python讀txt亂碼如何解決

funnyok發表於2021-09-11

python讀txt亂碼如何解決

從報錯講起:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 2: illegal multibyte sequence

出現這個錯誤一般是由於開啟檔案時,沒有指定編碼引起的,比如下面程式碼

with open('../corpus.txt', mode = 'r') as f:

解決方法很簡單,為其指定編碼就行了

with open('../corpus.txt', encoding='utf-8',  mode = 'r') as f:

還有一個常見的問題就是,生成txt檔案,檢視內容時發現亂碼,這可能與你在開啟檔案時沒有指定編碼方式有關

程式碼就像這樣 

output = open('context.txt', 'w')

解決的方式也很簡單,只要在開啟檔案時,指定檔案編碼就行了

output = open('context.txt', 'w', encoding="utf-8")

推薦學習《》!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/3137/viewspace-2834582/,如需轉載,請註明出處,否則將追究法律責任。

相關文章