課時30:檔案系統:介紹一個高大上的東西

那是個好男孩發表於2018-08-20

目錄:

  一、os模組中關於檔案/目錄常用的函式使用方法

  二、os.path模組中關於路徑常用的函式使用方法

  三、課時30課後習題及答案

 

接下來會介紹跟Python的檔案相關的一些很有用的模組。模組是什麼?其實我們寫的每一個原始碼檔案(*.py)都是一個模組。Python自身帶有非常多使用的模組。

比如剛開始介紹的文字小遊戲,裡邊就用random模組的randint()函式來生成隨機數。然而要使用這個randint()函式,直接就呼叫可不行:

>>> random.randint(0,9)
                              
Traceback (most recent call last):
  File "<pyshell#36>", line 1, in <module>
    random.randint(0,9)
NameError: name 'random' is not defined

正確的做法是先使用import語句匯入模組,然後再使用:

>>> import random
                              
>>> random.randint(0,9)
                              
3
>>> random.randint(0,9)
                              
0
>>> random.randint(0,9)
                              
7

 

*******************************************************

一、os模組中關於檔案/目錄常用的函式使用方法

*******************************************************

首先要介紹的是高大上的OS模組,OS即Operating System的縮寫,意思是作業系統。之所以說OS模組高大上,是因為對於檔案系統的訪問,Python一般是通過OS模組來實現的。

Python是跨平臺的語言,也就是說,同樣的原始碼在不同的作業系統不需要修改就可以同樣實現。有了OS模組,不需要關心什麼作業系統下使用什麼模組,OS模組會幫你選擇正確的模組並呼叫。

下表列舉了os模組中關於檔案/目錄常用的函式使用方法:

函式名                 使用方法
getcwd()             返回當前工作目錄
chdir(path)           改變工作目錄
listdir(path='.')       列舉指定目錄中的檔名('.'表示當前目錄,'..'表示上一級目錄)
mkdir(path)           建立單層目錄,如該目錄已存在丟擲異常
makedirs(path)         遞迴建立多層目錄,如該目錄已存在丟擲異常,注意:'E:\\a\\b''E:\\a\\c'並不會衝突
remove(path)          刪除檔案
rmdir(path)           刪除單層目錄,如該目錄非空則丟擲異常
removedirs(path)        遞迴刪除目錄,從子目錄到父目錄逐層嘗試刪除,遇到目錄非空則丟擲異常
rename(old, new)        將檔案old重新命名為new
system(command)        執行系統的shell命令
walk(top)            遍歷top路徑以下所有的子目錄,返回一個三元組:(路徑, [包含目錄], [包含檔案])【具體實現方案請看:第30講課後作業^_^
以下是支援路徑操作中常用到的一些定義,支援所有平臺 os.curdir          指代當前目錄(
'.') os.pardir         指代上一級目錄('..') os.sep           輸出作業系統特定的路徑分隔符(Win下為'\\',Linux下為'/') os.linesep         當前平臺使用的行終止符(Win下為'\r\n',Linux下為'\n') os.name          指代當前使用的作業系統(包括:'posix',  'nt', 'mac', 'os2', 'ce', 'java'

 

1、getcwd()

在有些情況下,我們需要獲得應用程式當前的工作目錄(比如要儲存臨時檔案),那麼可以使用getcwd()函式獲得:

>>> import os
                              
>>> os.getcwd()
                              
'C:\\Users\\14158\\AppData\\Local\\Programs\\Python\\Python37'

 

2、chdir(path)

用chdir()函式可以改變當前工作目錄,比如可以切換到D盤:

>>> os.chdir("D:\\")
                              
>>> os.getcwd()
                              
'D:\\'

 

3、listdir(path='.')

有時候你可能需要知道當前目錄下有哪些檔案和子目錄,那麼listdir()函式可以幫你列舉出來。path引數用於指定列舉的目錄,預設值是'.',代表根目錄,也可以使用'..'代表上一層目錄:

 

>>> os.chdir("C:\\")
                              
>>> os.listdir()
                              
['$Recycle.Bin', 'aow_drv.log', 'AppData', 'Documents and Settings', 'hiberfil.sys', 'Intel', 'OneDriveTemp', 'pagefile.sys', 'pbb.txt', 'PerfLogs', 'Program Files', 'Program Files (x86)', 'ProgramData', 'Recovery', 'swapfile.sys', 'System Volume Information', 'Users', 'Windows']
>>> os.listdir("D:\\")
                              
['$RECYCLE.BIN', 'bigdata', 'Hlddz', 'InstallConfig.ini', 'JAVA', 'QQ圖片20180728154834.jpg', 'QQ圖片20180728155014.jpg', 'qycache', 'rhel-server-7.4-x86_64-dvd.iso', 'System Volume Information', 'ubuntu-18.04-live-server-amd64.iso', '大二上', '安裝包', '小甲魚', '應用程式', '桌面桌布']

 

4、mkdir(path)

mkdir()函式用於建立資料夾,如果該資料夾存在,則丟擲FileExistsError異常:

>>> os.mkdir("test")
                              
>>> os.listdir()
                              
['$Recycle.Bin', 'aow_drv.log', 'AppData', 'Documents and Settings', 'hiberfil.sys', 'Intel', 'OneDriveTemp', 'pagefile.sys', 'pbb.txt', 'PerfLogs', 'Program Files', 'Program Files (x86)', 'ProgramData', 'Recovery', 'swapfile.sys', 'System Volume Information', 'test', 'Users', 'Windows']
>>> os.mkdir("test")
                              
Traceback (most recent call last):
  File "<pyshell#57>", line 1, in <module>
    os.mkdir("test")
FileExistsError: [WinError 183] 當檔案已存在時,無法建立該檔案。: 'test'

 

5、makedirs(path)

makedirs()函式可以用於建立多層目錄:

>>> os.makedirs(r".\a\b\c")

效果如圖所示:

 

6、remove(path)、rmdir(path) 和removedirs(path)  

remove()函式用於刪除指定的檔案,注意是刪除檔案,不是刪除目錄。如果要刪除目錄,則用rmdir()函式;如果要刪除多層目錄,則用removedirs()函式。

>>> os.listdir()                              
['$Recycle.Bin', 'a', 'aow_drv.log', 'AppData', 'b', 'Documents and Settings', 'hiberfil.sys', 'Intel', 'OneDriveTemp', 'pagefile.sys', 'pbb.txt', 'PerfLogs', 'Program Files', 'Program Files (x86)', 'ProgramData', 'Recovery', 'swapfile.sys', 'System Volume Information', 'test', 'Users', 'Windows']
>>> os.remove("test")                             
>>> os.rmdir("b")
>>> os.removedirs(r".\a\b\c")

注:在C盤有可能會報錯,沒有許可權。

 

7、rename(old,new)

rename()函式用於重新命名檔案或資料夾:

>>> os.listdir()
['a','a.txt']                              
>>> os.rename("a","b")
>>> os.rename("a.txt","b.txt")                           
>>> os.listdir()
['b','b.txt']  

 

8、systemf(command)

幾乎每個作業系統都會提供一些小工具,system()函式就是用於使用這些小工具:

>>> os.system("calc")#calc是windows自帶的計算器

回車後即彈出計算器。

 

9、walk(top)

最後是walk()函式,這個函式在有些時候確實非常有用,可以省去你很多麻煩。該函式的作用是遍歷top引數指定路徑下的所有子目錄,並將結果返回一個三元組(路徑,[包含目錄],[包含檔案])。

>>> for i in os.walk("test"):
         print(i)    

 

另外path模組還提供了一些很實用的定義,分別是:os.curdir表示當前目錄;os.pardir表示上一級目錄('..');os.sep表示路徑的分隔符,比如Windows系統下為‘\\’,linux下為‘\’;os.linesep表示當前平臺使用的行終止符(在Windows下為‘\r\n’,Linux下為‘\n’);os.name表示當前使用的作業系統。

 

*******************************************************

二、os.path模組中關於路徑常用的函式使用方法

*******************************************************

 另一個強大的板塊是os.pash,它可以完成一些針對路徑名的操作。下表列舉了os.pash中常用到的函式使用方法。

函式名                          使用方法
basename(path)                    去掉目錄路徑,單獨返回檔名
dirname(path)                     去掉檔名,單獨返回目錄路徑
join(path1[, path2[, ...]])            將path1, path2各部分組合成一個路徑名
split(path)                      分割檔名與路徑,返回(f_path, f_name)元組。如果完全使用目錄,它也會將最後一個目錄作為檔名分離,且不會判斷檔案或者目錄是否存在
splitext(path)                    分離檔名與副檔名,返回(f_name, f_extension)元組
getsize(file)                     返回指定檔案的尺寸,單位是位元組
getatime(file)                    返回指定檔案最近的訪問時間(浮點型秒數,可用time模組的gmtime()或localtime()函式換算)
getctime(file)                    返回指定檔案的建立時間(浮點型秒數,可用time模組的gmtime()或localtime()函式換算)
getmtime(file)                    返回指定檔案最新的修改時間(浮點型秒數,可用time模組的gmtime()或localtime()函式換算)
以下為函式返回 True 或 False exists(path)                   判斷指定路徑(目錄或檔案)是否存在 isabs(path)                    判斷指定路徑是否為絕對路徑 isdir(path)                    判斷指定路徑是否存在且是一個目錄 isfile(path)                    判斷指定路徑是否存在且是一個檔案 islink(path)                    判斷指定路徑是否存在且是一個符號連結 ismount(path)                   判斷指定路徑是否存在且是一個掛載點 samefile(path1, paht2)              判斷path1和path2兩個路徑是否指向同一個檔案

 

1、basename(pash)和dirname(path)

basename(pash)和dirname(path)函式分別用於獲取檔名和路徑名:

>>> os.path.dirname(r"a\b\test.txt")
                              
'a\\b'
>>> os.path.basename(r"a\b\test.txt")
                              
'test.txt'

 

2、join(path1[, path2[, ...]])

join()函式跟BIF的那個join()函式不同,os.path.join()用於將路徑名和檔名組合成一個完整的路徑:

>>> os.path.join(r"C:\Python34\Test","FishC.txt")
                              
'C:\\Python34\\Test\\FishC.txt'

 

3、split(path)和splitext(path)

split()和splitext()函式都用於分割路徑,split()函式分割路徑和檔名(如果完全使用目錄,它也會將最後一個目錄作為檔名分離,且不會判斷檔案或者目錄是否存在);splitext()函式則是用於分割檔名和副檔名:

>>> os.path.split(r"a\b\test.txt")
                              
('a\\b', 'test.txt')
>>> os.path.splitext(r"a\b\test.txt")
                              
('a\\b\\test', '.txt')

 

4、getsize(file)

getsize()函式用於獲取檔案的尺寸,返回值是以位元組為單位:

>>> os.chdir("C:\\Users\\14158\\AppData\\Local\\Programs\\Python\\Python37")
                              
>>> os.path.getsize("python.exe")
                              
99992

 

5、getatime(file)、getctime(file)和getmtime(file)

getatime(file)、getctime(file)和getmtime(file)分別用於獲取檔案的最近訪問時間、建立時間和修改時間。不過返回值是浮點型秒數,可用time模組的gmtime()或localtime()函式換算:

>>> import time
                              
>>> temp = time.localtime(os.path.getatime("python.exe"))
                              
>>> print("python.exe被訪問的時間是:",time.strftime("%d%b%Y%H:%M:%S",temp))
                              
python.exe被訪問的時間是: 20Aug201817:46:49
>>> temp = time.localtime(os.path.getctime("python.exe"))
                              
>>> print("python.exe被建立的時間是:",time.strftime("%d%b%Y%H:%M:%S",temp))
                              
python.exe被建立的時間是: 27Jun201805:01:38
>>> temp = time.localtime(os.path.getmtime("python.exe"))
                              
>>> print("python.exe被修改的時間是:",time.strftime("%d%b%Y%H:%M:%S",temp))
                              
python.exe被修改的時間是: 27Jun201805:01:38

還有一些函式返回布林型別的值,詳情見表。

 

*******************************

三、課時30課後習題及答案

*******************************

 

 

相關文章