詳解Python中open()函式指定檔案開啟方式的用法

pythontab發表於2016-06-07

當我們用open()函式去開啟檔案的時候,有好幾種開啟的模式。

'r'->只讀

'w'->只寫,檔案已存在則清空,不存在則建立。

'a'->追加,寫到檔案末尾

'b'->二進位制模式,比如開啟影像、音訊、word檔案。

'+'->更新(可讀可寫)

這個帶'+'號的有點難以理解,上程式碼感受下。

with open('foo.txt', 'w+') as f: 
    f.write('bar\n') 
    f.seek(0)  
    data = f.read()

可以看到,上面這段程式碼,它不但可以寫,還可以讀出來。注意要先定位到開頭,f.seek(0),不然讀出來的是空資料。

一些人可能會有迷惑,既然帶'+'號是可讀可寫,那'w+'跟'r+'有什麼不同。

那就是,

'w+'會清空,會建立 (檔案已存在則清空,不存在則建立。)

'r+'不清空,不建立

不要用二進位制模式開啟文字檔案

先看下面程式碼的“詭異”現象。

假設在windows下,我有個f.txt檔案,裡面的內容是下面這樣的。

hello

world

程式碼一,

with open('f.txt', 'r') as f: 
    print f.readlines() 
with open('f.txt', 'rb') as f: 
    print f.readlines()

輸出

['hello\n', 'world\n']

['hello\r\n', 'world\r\n']

程式碼二,

with open('f.txt', 'rb') as f: 
    data = f.read() 
with open('f.txt', 'w') as f: 
    f.write(data)

開啟檔案,變成了下面這樣,

hello^M

world^M

首先,先理解換行符'\n'跟回車符'\r'的概念。

'\n',換行符(LF,Line-Feed ),指新的一行。

'\r',回車符(CR,Carriage-Return),指回到行頭。

因為在不同系統下的換行標識是不一樣的。

windows->'\r\n'

unix->'\n'

mac->'\r'

這就是為什麼windows下的txt在linux開啟的時候行尾會有'^M'。

這就是為什麼我在linux下跑指令碼匯出遊戲資料下到本地windows開啟變成了一行。

其實文字檔案也是二進位制檔案,是文字編碼的二進位制檔案,文字檔案對一些不可見字元進行了處理,增加可讀性。

在python中,可以透過os.linesep獲得當前系統的換行標識。比如在windows下,os.linesep是'\r\n'。

在python中操作換行標識的時候,並不用管是在什麼平臺下,直接用'\n'就行了,python會自動根據不同系統轉成不同標識。

有了上面這些理論依據,就可以解析本文開頭程式碼的“詭異”現象了。

程式碼一中,用文字模式開啟的檔案,換行標識會被python處理成'\n',而用二進位制模式開啟則原封不動。

程式碼二中,用二進位制模式開啟,用文字模式寫入。二進位制開啟原封不動還是'\r\n',而文字模式寫入的時候因為python會把'\n'轉成'\r\n',所以其實就等於是寫入了'\r\r\n',於是就多了個'^M'。


相關文章