Python 中文編碼

026發表於2018-12-04

Python 中文編碼

  • 作者:楊夢鴿
  • 校對:翟舒青

前面章節中我們已經學會了如何用 Python 輸出 "Hello, World!",英文沒有問題,但是如果你輸出中文字元"你好,世界"就有可能會碰到中文編碼問題。

Python 檔案中如果未指定編碼,在執行過程會出現報錯:

#!/usr/bin/python
print "你好,世界";

以上程式執行輸出結果為:

  File "test.py", line 2
SyntaxError: Non-ASCII character '\xe4' in file test.py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Python中預設的編碼格式是 ASCII 格式,在沒修改編碼格式時無法正確列印漢字,所以在讀取中文時會報錯。

解決方法為只要在檔案開頭加入 # -- coding: UTF-8 -- 或者 #coding=utf-8 就行了

注意:#coding=utf-8 的 = 號兩邊不要空格。

例項(Python 2.0+)

#!/usr/bin/python
# -*- coding: UTF-8 -*-

print "你好,世界";

輸出結果為:

你好,世界

所以如果大家在學習過程中,程式碼中包含中文,就需要在頭部指定編碼。

注意:Python3.X 原始碼檔案預設使用utf-8編碼,所以可以正常解析中文,無需指定 UTF-8 編碼。

注意:如果你使用編輯器,同時需要設定 py 檔案儲存的格式為 UTF-8,否則會出現類似以下錯誤資訊:

SyntaxError: (unicode error) ‘utf-8’ codec can’t decode byte 0xc4 in position 0:
invalid continuation byte

Pycharm 設定步驟:

  • 進入 file > Settings,在輸入框搜尋 encoding
  • 找到 Editor > File encodings,將 IDE EncodingProject Encoding 設定為utf-8。
4553217-e7ddb94bf77ab423.jpg
img

相關文章