unicode vs utf-8
前提:
是不是感覺到unicode和utf-8是一個東西?因為兩者都以u開頭。
UTF-8和Unicode是兩個完全不同的事物。
Unicode:
Unicode是一種字符集。
第一個原因是,計算機只認數字,即010101,所以,需要把文字表示成數字得有個標準來遵守。第二個原因是,很早的時候,計算機是在美國發明的,所以,支援英文是理所當然的事情。英文有26個字母,算上大小寫,加上標點和數字,就大概有少於100個。所以,用1-100個數字就可以表示了,後來照顧到歐洲人民,比如法語,德語什麼的,也不超過250個。但是,如果歐美以外的國家,加上漢字,加上阿拉伯文,加上日韓文字,這麼多的文字就用unicode來編碼了,uni在英文中表示巨大的,統一的,比如universe,綜合性大學 blah blah blah,unicode的位很多,其實我現在也不知道,總之,用unicode這個標準來表示世界上的文字,足夠了,就類似於ipv4升級為ipv6一樣。
UTF-8
UTF-8是一種編碼方式,是把數字轉換為二進位制儲存起來的演算法。當然也可以從二進位制轉化回來為一串數字。當應用程式讀取0101001這樣的二進位制數字的時候,utf-8就把這二進位制轉化為實際的數字,然後利用unicode 字符集,把對應的數字轉化為字元,然後顯示出來。
所以,
unicode和utf-8是兩種不同的事物,不可以進行比較。雖然樣子類似,但是確實不同的東西,需要重新認識。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29757574/viewspace-2152699/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- unicode和UTF-8的區別Unicode
- 你真的瞭解 Unicode 和 UTF-8 嗎?Unicode
- 徹底弄懂UTF-8、Unicode、寬字元、localeUnicode字元
- 字元編碼:Unicode & UTF-16 & UTF-8字元Unicode
- Unicode、GBK、UTF-8、ASCII的編碼簡介UnicodeASCII
- 字元編碼發展史4 — Unicode與UTF-8字元Unicode
- 帶你瞭解 Unicode和UTF-8編碼知識Unicode
- Unicode中UTF-8與UTF-16編碼詳解Unicode
- Unicode,UTF-8和UTF-16的區別與聯絡Unicode
- webSocket 二進位制傳輸基礎準備-UTF-16和UTF-8轉UnicodeWebUnicode
- 徹底搞懂字元編碼(unicode,mbcs,utf-8,utf-16,utf-32,big endian,little endian...)字元Unicode
- unicodeUnicode
- Hacking with UnicodeUnicode
- Unicode 與 UTFUnicode
- utf-8和gbk
- Unicode的前世今生Unicode
- VS2013 由Unicode字符集切換為多位元組字符集後編譯報錯Unicode編譯
- xls 編碼 utf-8
- springboot設定UTF-8Spring Boot
- Unicode編碼解碼Unicode
- JavaScript 字元 Unicode 表示法JavaScript字元Unicode
- 使用ofstream輸出unicodeUnicode
- Unicode編碼介紹Unicode
- Python convert string to unicode numberPythonUnicode
- unicode轉碼工具類Unicode
- utf-8的中文漢字
- leetcode393. UTF-8 ValidationLeetCode
- C++ string互轉wstring/Unicode互轉ANSI/Unicode互轉UTF8C++Unicode
- ECMAScript 6:更好的 Unicode 支援Unicode
- catalyst支援unicode的重要配置Unicode
- str跟unicode不一樣Unicode
- UTF-8編碼規則(轉)
- 什麼是 unicode 程式碼點Unicode
- 字符集編碼(三):UnicodeUnicode
- 2-Windows程式設計 -UnicodeWindows程式設計Unicode
- Playwright VS Selenium VS Puppeteer VS Cypress
- PHP中文GBK編碼轉UTF-8PHP
- PHP 與 UTF-8 的最佳實踐PHP