unicode vs utf-8
前提:
是不是感覺到unicode和utf-8是一個東西?因為兩者都以u開頭。
UTF-8和Unicode是兩個完全不同的事物。
Unicode:
Unicode是一種字符集。
第一個原因是,計算機只認數字,即010101,所以,需要把文字表示成數字得有個標準來遵守。第二個原因是,很早的時候,計算機是在美國發明的,所以,支援英文是理所當然的事情。英文有26個字母,算上大小寫,加上標點和數字,就大概有少於100個。所以,用1-100個數字就可以表示了,後來照顧到歐洲人民,比如法語,德語什麼的,也不超過250個。但是,如果歐美以外的國家,加上漢字,加上阿拉伯文,加上日韓文字,這麼多的文字就用unicode來編碼了,uni在英文中表示巨大的,統一的,比如universe,綜合性大學 blah blah blah,unicode的位很多,其實我現在也不知道,總之,用unicode這個標準來表示世界上的文字,足夠了,就類似於ipv4升級為ipv6一樣。
UTF-8
UTF-8是一種編碼方式,是把數字轉換為二進位制儲存起來的演算法。當然也可以從二進位制轉化回來為一串數字。當應用程式讀取0101001這樣的二進位制數字的時候,utf-8就把這二進位制轉化為實際的數字,然後利用unicode 字符集,把對應的數字轉化為字元,然後顯示出來。
所以,
unicode和utf-8是兩種不同的事物,不可以進行比較。雖然樣子類似,但是確實不同的東西,需要重新認識。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29757574/viewspace-2152699/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- unicode,utf-8Unicode
- UTF-8 and Unicode FAQ(轉)Unicode
- iOS Unicode轉中文(UTF-8)iOSUnicode
- unicode、utf-8、ansi的故事Unicode
- unicode和UTF-8的區別Unicode
- 【轉】utf-8與Unicode的轉化Unicode
- 字元編碼:ASCII,Unicode和UTF-8字元ASCIIUnicode
- 徹底弄懂UTF-8、Unicode、寬字元、localeUnicode字元
- 你真的瞭解 Unicode 和 UTF-8 嗎?Unicode
- 字元編碼:Unicode & UTF-16 & UTF-8字元Unicode
- 什麼是Unicode,什麼是UTF-8Unicode
- Unicode 和 UTF-8 是什麼關係?Unicode
- 字元編碼筆記:ASCII,Unicode和UTF-8字元筆記ASCIIUnicode
- 字元編碼筆記:ASCII,Unicode 和 UTF-8字元筆記ASCIIUnicode
- ANSI(字符集) and Unicode(字符集) and UTF-8(編碼Unicode字符集)Unicode
- Unicode、GBK、UTF-8、ASCII的編碼簡介UnicodeASCII
- 字元編碼 ASCII,Unicode 和 UTF-8 概念掃盲字元ASCIIUnicode
- 字符集編碼淺析:Unicode和UTF-8Unicode
- Unicode和UTF-8之間的轉換詳解Unicode
- 字元編碼發展史4 — Unicode與UTF-8字元Unicode
- 帶你瞭解 Unicode和UTF-8編碼知識Unicode
- Unicode中UTF-8與UTF-16編碼詳解Unicode
- 多位元組與UTF-8、Unicode之間的轉換Unicode
- 符號編碼-ASCII、Unicode、Unicode big endian、UTF-8之間的關係(轉)符號ASCIIUnicode
- Unicode,UTF-8和UTF-16的區別與聯絡Unicode
- 字元編解碼的故事(ASCII,ANSI,Unicode,Utf-8區別)字元ASCIIUnicode
- UTF-8檔案的Unicode簽名BOM(Byte Order Mark)Unicode
- 推薦一個UTF-8或者Unicode編輯的免費軟體Unicode
- 字符集之間轉換(UTF-8,UNICODE,Gb2312)Unicode
- webSocket 二進位制傳輸基礎準備-UTF-16和UTF-8轉UnicodeWebUnicode
- ASCII,Unicode,UTF-8,GB2312一些關於編碼的理解ASCIIUnicode
- 讓VS偵錯程式正確顯示UTF-8字串字串
- 關於字元編碼,你所需要知道的(ASCII,Unicode,Utf-8,GB2312…)字元ASCIIUnicode
- unicodeUnicode
- 徹底搞懂字元編碼(unicode,mbcs,utf-8,utf-16,utf-32,big endian,little endian...)字元Unicode
- 轉貼 (談談Unicode編碼,簡要解釋UCS、UTF、BMP、BOM等名詞)&(UTF-8編碼規則)Unicode
- 解決VS2005開啟UTF-8編碼文件亂碼問題(ZZ)
- Hacking with UnicodeUnicode