setdefaultencoding函式使用詳解

pythontab發表於2016-09-08

sys.getdefaultencoding()是設定預設的string的編碼格式,如果你在python中進行編碼和解碼的時候,不指定編碼方式,那麼python就會使用defaultencoding。

而python2.x的的defaultencoding是ascii,這也就是大多數python編碼報錯:“UnicodeDecodeError: 'ascii' codec can't decode byte ......”的原因。

與此有類似功能的# coding:utf-8 作用是定義原始碼的編碼. 如果沒有定義, 此原始碼中是不可以包含中文字串的.

注意:python2.7以後setdefaultencoding就廢棄掉了,所以在python3.x中不可使用


程式碼例項:

#!/usr/bin/env python    
#encoding: utf-8  
import sys   #引用sys模組進來,並不是進行sys的第一次載入  
reload(sys)  #重新載入sys  
sys.setdefaultencoding('utf8')  ##呼叫setdefaultencoding函式

可以正確的執行,可是下面的程式碼會出錯

#!/usr/bin/env python    
#encoding: utf-8  
import sys     
sys.setdefaultencoding('utf8')

要在呼叫setdefaultencoding時必須要先reload一次sys模組,因為這裡的import語句其實並不是sys的第一次匯入語句,也就是說這裡其實可能是第二、三次進行sys模組的import,這裡只是一個對sys的引用,只能reload才能進行重新載入。


那麼為什麼要重新載入,而直接引用過來則不能呼叫該函式呢?因為setdefaultencoding函式在被系統呼叫後被刪除了,所以透過import引用進來時其實已經沒有了,所以必須reload一次sys模組,這樣setdefaultencoding才會為可用,才能在程式碼裡修改直譯器當前的字元編碼。


在python安裝目錄的Lib資料夾下,有一個叫site.py的檔案,在裡面可以找到main() --> setencoding()-->sys.setdefaultencoding(encoding),因為這個site.py每次啟動python直譯器時會自動載入,所以main函式每次都會被執行,setdefaultencoding函式一出來就已經被刪除了。


相關文章