unicode,utf-8
字符集:字符集規定了某個文字對應的二進位制數字存放方式(編碼)和某串二進位制數值代表了哪個文字(解碼)的轉換關係。計算機可以輸出列印的是實體化的文字,但是在計算機儲存中存放的是二進位制的bit流,如何把這兩者之間做準確的互相轉換就需要一個標準,字符集就規定了這個標準。
字元編碼:字符集只是一個規則集合的名字,要正確編碼轉碼一個字元需要3個元素:字型檔表(儲存所有可顯示的字元),編碼字符集(用一個編碼值表示一個字元在字型檔中的位置),字元編碼(把編碼字符集和實際儲存數值之間的轉換關係),栗子:在ASCll中A在表中排65,所以A編碼後的數值01000001等於十進位制的65轉換成二進位制的結果。
utf-8:UTF-8編碼為變長編碼。最小編碼單位是一個位元組。一個位元組的前1-3個bit為描述性部分,後面為實際序號部分。
如果一個位元組的第一位為0,那麼代表當前字元為單位元組字元,佔用一個位元組的空間。0之後的所有部分(7個bit)代表在Unicode中的序號。
如果一個位元組以110開頭,那麼代表當前字元為雙位元組字元,佔用2個位元組的空間。110之後的所有部分(7個bit)代表在Unicode中的序號。且第二個位元組以10開頭
如果一個位元組以1110開頭,那麼代表當前字元為三位元組字元,佔用2個位元組的空間。110之後的所有部分(7個bit)代表在Unicode中的序號。且第二、第三個位元組以10開頭
如果一個位元組以10開頭,那麼代表當前位元組為多位元組字元的第二個位元組。10之後的所有部分(6個bit)代表在Unicode中的序號。
uncode和utf-8的關係:Unicode就是編碼字符集,而UTF-8就是字元編碼,即Unicode字型檔的一種實現形式。
相關文章
- unicode vs utf-8Unicode
- UTF-8 and Unicode FAQ(轉)Unicode
- iOS Unicode轉中文(UTF-8)iOSUnicode
- unicode、utf-8、ansi的故事Unicode
- unicode和UTF-8的區別Unicode
- 【轉】utf-8與Unicode的轉化Unicode
- 字元編碼:ASCII,Unicode和UTF-8字元ASCIIUnicode
- 徹底弄懂UTF-8、Unicode、寬字元、localeUnicode字元
- 你真的瞭解 Unicode 和 UTF-8 嗎?Unicode
- 字元編碼:Unicode & UTF-16 & UTF-8字元Unicode
- 什麼是Unicode,什麼是UTF-8Unicode
- Unicode 和 UTF-8 是什麼關係?Unicode
- 字元編碼筆記:ASCII,Unicode和UTF-8字元筆記ASCIIUnicode
- 字元編碼筆記:ASCII,Unicode 和 UTF-8字元筆記ASCIIUnicode
- ANSI(字符集) and Unicode(字符集) and UTF-8(編碼Unicode字符集)Unicode
- Unicode、GBK、UTF-8、ASCII的編碼簡介UnicodeASCII
- 字元編碼 ASCII,Unicode 和 UTF-8 概念掃盲字元ASCIIUnicode
- 字符集編碼淺析:Unicode和UTF-8Unicode
- Unicode和UTF-8之間的轉換詳解Unicode
- 帶你瞭解 Unicode和UTF-8編碼知識Unicode
- Unicode中UTF-8與UTF-16編碼詳解Unicode
- 多位元組與UTF-8、Unicode之間的轉換Unicode
- 符號編碼-ASCII、Unicode、Unicode big endian、UTF-8之間的關係(轉)符號ASCIIUnicode
- Unicode,UTF-8和UTF-16的區別與聯絡Unicode
- 字元編解碼的故事(ASCII,ANSI,Unicode,Utf-8區別)字元ASCIIUnicode
- UTF-8檔案的Unicode簽名BOM(Byte Order Mark)Unicode
- 推薦一個UTF-8或者Unicode編輯的免費軟體Unicode
- 字符集之間轉換(UTF-8,UNICODE,Gb2312)Unicode
- webSocket 二進位制傳輸基礎準備-UTF-16和UTF-8轉UnicodeWebUnicode
- ASCII,Unicode,UTF-8,GB2312一些關於編碼的理解ASCIIUnicode
- 關於字元編碼,你所需要知道的(ASCII,Unicode,Utf-8,GB2312…)字元ASCIIUnicode
- unicodeUnicode
- 徹底搞懂字元編碼(unicode,mbcs,utf-8,utf-16,utf-32,big endian,little endian...)字元Unicode
- 轉貼 (談談Unicode編碼,簡要解釋UCS、UTF、BMP、BOM等名詞)&(UTF-8編碼規則)Unicode
- Hacking with UnicodeUnicode
- Unicode 與 UTFUnicode
- Unicode 筆記Unicode筆記
- utf-8、UTF-8、utf8在使用中的區別