2.15Python中的字符集問題

水木·圳烜發表於2018-02-28

@什麼是字符集

  • 計算機記錄文字的方式是通過字符集序號來記錄的;
  • 每一個字元的儲存,都是以其位於字符集中的序號來實現的,包括空格、換行符、標點等;
  • 最早的字符集是ASCII,只包含包括大小寫字母、阿拉伯數字、一些基本符號;
  • 隨著計算機在全球各國的普及,由於世界的語言眾多,就誕生了各種適應不同語種的字符集;
  • 專門適應中文的字符集有GBK、GB2312等,例如Windows作業系統中文版所使用的就是GBK字符集;
  • 但無論何種字符集,都預設將ASCII完整包含在前128位當中;
  • 由於不同主機中使用的字符集不同,導致了嚴重的資料傳輸亂碼問題;
  • UTF-8字符集包含了世界各種不同語言中的常用字元,正逐漸成為某種意義上的、心照不宣的業界標準;

@ASCII字符集

  • 美國標準資訊交換碼(American Standard Code for Information Interchange);
  • 包括最基本的128個字元,是最早也最基本的字符集;
  • 內容包括大小寫字母、阿拉伯數字、以及一些常用符號;
  • 序號和字元的互換可以使用chr(order)和ord(character)兩個系統內建函式;
  • ASCII碼錶
    這裡寫圖片描述

相關文章