Python字元編碼的常用種類!Python基礎教程

老男孩IT教育機構發表於2021-09-10

  剛開始學習Python,肯定少不了基礎知識的瞭解,比如說字元編碼,那麼你知道Python常見字元編碼有哪些嗎?我們一起來看看Python字元編碼的常用種類吧。

  第一種:ASCII碼。是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言,它是現今最通用的單位元組編碼系統,並等同於國際標準IS/IEC 646。

  由於計算機是美國人發明的,因此,最早只有127個字母被編碼到計算機李,也就是大小寫英文字母、數字和一些符號,這個編碼表被稱為ASCII編碼,比如大寫字母A的編碼是65,小寫字母a的編碼是97,後128個稱為擴充套件ASCII碼。

  第二種:GBK和GB2312。能在計算機中顯示中文字元是至關重要的,然而ASCII表裡一個偏旁部首都沒有,所以我們需要一個關於中文和數字對應的關係表,一個位元組只能最多表示256個字元,用處理中文顯然一個位元組是不夠的,所以我們需要採用兩個位元組來表示,所以中國製定了GB2312編碼,用來將中文編寫進去。

  第三種:Unicode。因為各個國家都有一套自己的編碼,所以無法避免衝突,因此Unicode誕生了。它可以把所有語言都統一到一套編碼裡,這樣就不會存在亂碼問題了,現代作業系統和大多數程式語言都直接支援Unicode。

  第四種:UFT-8。基於節約的原則,出現了把Unicode編碼轉化為可變長編碼的UTF-8編碼。而UTF-8編碼把一個Unicode字元根據不同的數字大小編碼成1-6個位元組,常用的英文字母被編碼成一個位元組,漢字通常是3個位元組,只有很生僻的字元才會被編碼成4-6個位元組,如果你要傳輸的文字包含大量英文字元,用UTF-8編碼就能節省空間。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2791465/,如需轉載,請註明出處,否則將追究法律責任。

相關文章