glob模組
功能描述:glob模組可以使用Unix shell風格的萬用字元匹配符合特定格式的檔案和資料夾,跟windows的檔案搜尋功能差不多。glob模組並非呼叫一個子shell實現搜尋功能,而是在內部呼叫了os.listdir()和fnmatch.fnmatch()。
glob模組共包含以下3個函式:
-
glob(pathname, recursive=False)
第一個引數pathname為需要匹配的字串。(該引數應儘量加上r字首,以免發生不必要的錯誤)
第二個引數代表遞迴呼叫,與特殊萬用字元“**”一同使用,預設為False。
該函式返回一個符合條件的路徑的字串列表,如果使用的是Windows系統,路徑上的“\”符號會自動加上轉義符號變為“\\”(方便使用)。
在3.5版本之後,glob函式支援一個特殊的萬用字元“**”,該萬用字元可以匹配指定路徑裡所有檔案和目錄,包括子目錄裡的所有檔案和目錄。相當於遞迴地呼叫了這個函式。使用這個萬用字元必須加上recursive=True引數。
(在有複雜目錄結構的情況下使用該萬用字元可能會導致效能下降,拖累整個程式的執行,需謹慎使用!) -
iglob(pathname, recursive=False)
引數與glob()一致。
返回一個迭代器,該迭代器不會同時儲存所有匹配到的路徑,遍歷該迭代器的結果與使用相同引數呼叫glob()的返回結果一致。 -
escape(pathname)
這個函式是在3.4版本之後才有的,功能是忽略所有萬用字元。(可以用於測試某檔案是否存在)
(3.5.1版本該函式不能正常執行,升級到3.5.2之後恢復正常)
需要注意的地方:
glob預設不匹配以點符號(.)開始的檔案,如果有這類檔案,則需要做特殊處理。
假如當前資料夾包含test.txt和.test.txt兩個檔案。
>>> import glob
>>> glob.glob('*.txt')
['test.txt']
>>> glob.glob('.*.txt')
['.test.txt']
- 1
- 2
- 3
- 4
- 5
glob模組支援的萬用字元:
萬用字元 | 功能 |
---|---|
* | 匹配0或多個字元 |
** | 匹配所有檔案、目錄、子目錄和子目錄裡的檔案(3.5版本新增) |
? | 匹配1個字元,與正規表示式裡的?不同 |
[exp] | 匹配指定範圍內的字元,如:[1-9]匹配1至9範圍內的字元 |
[!exp] | 匹配不在指定範圍內的字元 |
總結:雖然glob模組可以很輕鬆地匹配特定檔案和資料夾,但是僅僅支援少量的萬用字元,沒辦法像正規表示式一樣匹配更復雜的字串。使用的時候應當認真考慮使用場景,根據需求針對性地選擇解決方案。
官方文件地址:
https://docs.python.org/3.5/library/glob.html#module-glob
感謝內容提供者
以上內容遵循BY-NC-SA協議,歡迎轉載,轉載請註明作者。