python實現中文和unicode轉換

ponponon發表於2023-05-14

在 Python 中,可以使用 encode()decode() 方法實現中文和 Unicode 編碼之間的相互轉換。

將中文轉換為 Unicode 編碼:

chinese_str = "中文"
unicode_str = chinese_str.encode("unicode_escape").decode()
print(unicode_str)

將 Unicode 編碼轉換為中文:

unicode_str = "\\u4e2d\\u6587"
chinese_str = bytes(unicode_str, 'utf-8').decode('unicode_escape')
print(chinese_str)

執行上述程式碼後,將會分別輸出中文和 Unicode 編碼。其中,將中文轉換為 Unicode 編碼時,使用 encode() 方法將中文字串編碼為 Unicode 轉義序列,再使用 decode() 方法將轉義序列轉換為 Unicode 編碼字串。而將 Unicode 編碼轉換為中文時,使用 bytes() 方法將 Unicode 編碼字串轉換為位元組序列,再使用 decode() 方法將位元組序列轉換為中文字串。

需要注意的是,在使用 encode()decode() 方法時,需要指定正確的編碼方式,例如上述程式碼中使用的是 utf-8 編碼。如果編碼方式不正確,將可能導致轉換錯誤。

相關文章