python 中文亂碼問題解決方案

李博Garvin發表於2014-12-09

      最近在專案中部署結巴分詞的時候遇到了亂碼情況,明明是中文,確顯示不出來或者顯示亂碼。解決方案如下。


利用isinstance 來判斷是否已經編碼,s是出問題的字串。unicode是沒編碼

isinstance(s, unicode): 


用print 列印,如果結果是true說明沒編碼。如果是false說明編碼了,但是編的碼不對

print isinstance(s,unicode)


如果沒編碼,加入編碼

s.encode('UTF-8')

如果編碼了,編錯了,就先解碼再編

s.decode('utf-8').encode('gb2312')



參考:http://www.jb51.net/article/17560.htm


/********************************

* 本文來自部落格  “李博Garvin“

* 轉載請標明出處:http://blog.csdn.net/buptgshengod

******************************************/



相關文章