unicode vs utf-8

牛平發表於2018-04-09
前提:
    是不是感覺到unicode和utf-8是一個東西?因為兩者都以u開頭。


UTF-8和Unicode是兩個完全不同的事物。

Unicode:
    Unicode是一種字符集。
    第一個原因是,計算機只認數字,即010101,所以,需要把文字表示成數字得有個標準來遵守。第二個原因是,很早的時候,計算機是在美國發明的,所以,支援英文是理所當然的事情。英文有26個字母,算上大小寫,加上標點和數字,就大概有少於100個。所以,用1-100個數字就可以表示了,後來照顧到歐洲人民,比如法語,德語什麼的,也不超過250個。但是,如果歐美以外的國家,加上漢字,加上阿拉伯文,加上日韓文字,這麼多的文字就用unicode來編碼了,uni在英文中表示巨大的,統一的,比如universe,綜合性大學 blah blah blah,unicode的位很多,其實我現在也不知道,總之,用unicode這個標準來表示世界上的文字,足夠了,就類似於ipv4升級為ipv6一樣。

UTF-8

    UTF-8是一種編碼方式,是把數字轉換為二進位制儲存起來的演算法。當然也可以從二進位制轉化回來為一串數字。當應用程式讀取0101001這樣的二進位制數字的時候,utf-8就把這二進位制轉化為實際的數字,然後利用unicode 字符集,把對應的數字轉化為字元,然後顯示出來。


所以,
    unicode和utf-8是兩種不同的事物,不可以進行比較。雖然樣子類似,但是確實不同的東西,需要重新認識。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29757574/viewspace-2152699/,如需轉載,請註明出處,否則將追究法律責任。

相關文章