一文帶你搞懂JavaScript中轉(zhuǎn)義字符的使用
目錄
- 字符串中的轉(zhuǎn)義
- 字母
- 十六進(jìn)制數(shù)字
- 八進(jìn)制數(shù)字
- Unicode碼點(diǎn)
- 正則表達(dá)式中的轉(zhuǎn)義
- HTML中的轉(zhuǎn)義
- URL轉(zhuǎn)義字符
說(shuō)起轉(zhuǎn)義字符,大家最先想到的肯定是使用反斜杠,這也是我們最常見(jiàn)的,很多編程語(yǔ)言都支持。
轉(zhuǎn)義字符從字面上講,就是能夠轉(zhuǎn)變字符原本的意義,得到新的字符。常用在特殊字符的顯示以及特定的編碼環(huán)境中。
除了反斜杠以外,在前端開(kāi)發(fā)中,還有其他幾種轉(zhuǎn)義字符,也是較常見(jiàn)的,本文將對(duì)這些做一個(gè)總結(jié)。
字符串中的轉(zhuǎn)義
使用反斜杠來(lái)表示轉(zhuǎn)義字符時(shí),主要是在字符串中使用。這里就需要了解字符集和編碼等知識(shí),具體可見(jiàn)前文前端開(kāi)發(fā)中需要搞懂的字符編碼。
字符集就是字符的集合,最常見(jiàn)的 ASCII字符集、Unicode字符集等:
ASCII的任一個(gè)字符都可以被轉(zhuǎn)義,使用的就是反斜杠加上數(shù)字編碼,特殊的也能使用反斜杠加上字母。
Unicode,也能進(jìn)行轉(zhuǎn)義,使用則是反斜杠加上碼點(diǎn)。由于Unicode包含了ASCII的所有字符,且編碼一致,所以都可算編碼轉(zhuǎn)義,而現(xiàn)在前端編程所涉及到的已經(jīng)都是Unicode字符。
一般,反斜杠(\)在字符串中有特殊的含義,用來(lái)和后面的字符一起組合表示一些特殊字符,所以又被稱為轉(zhuǎn)義符。
反斜杠后面可以跟著的字符大致有以下幾種:
- 字母
- 三位八進(jìn)制
- x 加上 兩位十六進(jìn)制
- Unicode碼點(diǎn)
字母
轉(zhuǎn)義字符中最基礎(chǔ)的就是:使用反斜杠\加上字母,表示那些無(wú)法輸入表示特殊含義的字符,常見(jiàn)的有以下幾種:
- \b 后退鍵
- \f 換頁(yè)符
- \n 換行符
- \r 回車(chē)鍵
- \t 制表符
- \v 垂直制表符
以前在字符串拼接時(shí),就經(jīng)常使用\n、\t:
"\n " + console.log("test") + "\n "
需要注意的是,這些字母是特殊的可應(yīng)用于轉(zhuǎn)義的字母。
如果是非特殊字母,加上反斜杠,則會(huì)忽略反斜杠,很多字符也是同樣忽略反斜杠:
"\a" // "a" "\"" // """ "\?" // "?"
十六進(jìn)制數(shù)字
十六進(jìn)制更常用,它的轉(zhuǎn)義規(guī)則:\x<hex>
,\x
后跟上2位十六進(jìn)制數(shù)。
因?yàn)橹挥袃晌唬秶牵?x00-0xFF,所以這種方式也只能輸出265種字符,其中:
- 0x00-0x7F 和ASCII碼一致
- 0x80-0x9F 表示控制字符
- 0xA0-0xFF 表示文字字符
"\xA9" // "?" "\x75" === "u" // true "\x67" // "g"
八進(jìn)制數(shù)字
反斜杠后面跟3位八進(jìn)制數(shù)(),就代表一個(gè)轉(zhuǎn)義字符:
"\251" // "?" "\165" === "u" // true "\106" // "F"
取值范圍:000-377,總共也是有256種字符,其中就包含了所有的ASCII碼。
八進(jìn)制和十六進(jìn)制能轉(zhuǎn)義的字符是一樣的,進(jìn)行進(jìn)制轉(zhuǎn)換即可,見(jiàn)前文搞懂JavaScript中的進(jìn)制與進(jìn)制轉(zhuǎn)換。
在JS中,用這兩種方式的轉(zhuǎn)義字符是相等的:
"\xA9" === "\251" // true "\200" === "\x80" // true
Unicode碼點(diǎn)
提到Unicode,首先需明確的一點(diǎn),JS中的字符串是基于Unicode的UTF-16編碼方式。
Unicode字符規(guī)定了碼點(diǎn)和字符平面。
碼點(diǎn)使用從U+0000到U+10FFFF的方位來(lái)表示所有的字符。
如果直接使用碼點(diǎn)來(lái)轉(zhuǎn)義所有的Unicode字符,則使用規(guī)則:\u{<hex>}
,\u
后跟上1-6位的十六進(jìn)制:
"\u{A9}" // "?" "\u{597d}" // "好" "\u{1f604}" // "
