sys.getdefaultencoding()是設定預設的string的編碼格式,如果你在python中進行編碼和解碼的時候,不指定編碼方式,那麼python就會使用defaultencoding。
而python2.x的的defaultencoding是ascii,這也就是大多數python編碼報錯:“UnicodeDecodeError: 'ascii' codec can't decode byte ......”的原因。
與此有類似功能的# coding:utf-8 作用是定義原始碼的編碼. 如果沒有定義, 此原始碼中是不可以包含中文字串的.
注意:python2.7以後setdefaultencoding就廢棄掉了,所以在python3.x中不可使用
程式碼例項:
#!/usr/bin/env python #encoding: utf-8 import sys #引用sys模組進來,並不是進行sys的第一次載入 reload(sys) #重新載入sys sys.setdefaultencoding('utf8') ##呼叫setdefaultencoding函式
可以正確的執行,可是下面的程式碼會出錯
#!/usr/bin/env python #encoding: utf-8 import sys sys.setdefaultencoding('utf8')
要在呼叫setdefaultencoding時必須要先reload一次sys模組,因為這裡的import語句其實並不是sys的第一次匯入語句,也就是說這裡其實可能是第二、三次進行sys模組的import,這裡只是一個對sys的引用,只能reload才能進行重新載入。
那麼為什麼要重新載入,而直接引用過來則不能呼叫該函式呢?因為setdefaultencoding函式在被系統呼叫後被刪除了,所以透過import引用進來時其實已經沒有了,所以必須reload一次sys模組,這樣setdefaultencoding才會為可用,才能在程式碼裡修改直譯器當前的字元編碼。
在python安裝目錄的Lib資料夾下,有一個叫site.py的檔案,在裡面可以找到main() --> setencoding()-->sys.setdefaultencoding(encoding),因為這個site.py每次啟動python直譯器時會自動載入,所以main函式每次都會被執行,setdefaultencoding函式一出來就已經被刪除了。