Linux檔案內容查詢命令(轉)

BSDLite發表於2007-08-11
Linux檔案內容查詢命令(轉)[@more@]   grep、fgrep和egrep命令

   這組命令以指定模式搜尋檔案,並通知使用者在什麼檔案中搜尋到與指定的模式匹配的字串,並列印出所有包含該字串的文字行,在該文字行的最前面是該行所在的檔名。grep命令一次只能搜尋一個指定的模式;egrep命令檢索擴充套件的正規表示式(包括表示式組和可選項);fgrep命令檢索固定字串,它不識別正規表示式,是快速搜尋命令。

   這組命令在搜尋與定位檔案中特定的主題方面非常有用。要搜尋的模式可以被認為是一些關鍵詞,您可以用它們來搜尋檔案中包含的這些關鍵詞。編寫程式時,可以用它來尋找某一個函式,或是相關的片語。grep命令的搜尋功能比fgrep強大,因為grep命令的搜尋模式可以是正規表示式,而fgrep卻不能。有關正規表示式請參見shell一章。

   該組命令中的每一個命令都有一組選項,利用這些選項可以改變其輸出方式。例如,可以在搜尋到的文字行上加入行號,或者只輸出文字行的行號,或者輸出所有與搜尋模式不匹配的文字行,或只簡單地輸出已搜尋到指定模式的檔名,並且可以指定在查詢模式時忽略大小寫。

   這組命令在指定的輸入檔案中查詢與模式匹配的行。如果沒有指定檔案,則從標準輸入中讀取。正常情況下,每個匹配的行被顯示到標準輸出。如果要查詢的檔案是多個,則在每一行輸出之前加上檔名。

   語法:

   grep [選項] [查詢模式] [檔名1,檔名2,……]

   egrep [選項] [查詢模式] [檔名1,檔名2,……]

   fgrep [選項] [查詢模式] [檔名1,檔名2,……]

   這組命令各選項的含義為:

   - E 每個模式作為一個擴充套件的正規表示式對待。

   - F 每個模式作為一組固定字串對待(以新行分隔),而不作為正規表示式。

   - b在輸出的每一行前顯示包含匹配字串的行在檔案中的位元組偏移量。

   - c 只顯示匹配行的數量。

   - i 比較時不區分大小寫。

   - h 在查詢多個檔案時,指示grep不要將檔名加入到輸出之前。

   - l 顯示首次匹配串所在的檔名並用換行符將其隔開。當在某檔案中多次出現匹配串時,不重複顯示此檔名。

   - n 在輸出前加上匹配串所在行的行號(檔案首行行號為1)。

   - v 只顯示不包含匹配串的行。

   - x 只顯示整行嚴格匹配的行。

   - e expression 指定檢索使用的模式。用於防止以“-”開頭的模式被解釋為命令選項。

   - f expfile 從expfile檔案中獲取要搜尋的模式,一個模式佔一行。

   對該組命令的使用還需注意以下方面:

   在命令後鍵入搜尋的模式,再鍵入要搜尋的檔案。其中,檔名列表中也可以使用特殊字元,如“*”等,用來生成檔名列表。如果想在搜尋的模式中包含有空格的字串,可以用單引號把要搜尋的模式括起來,用來表明搜尋的模式是由包含空格的字串組成。否則,Shell將把空格認為是命令列引數的定界符,而grep命令將把搜尋模式中的單詞解釋為檔名列表中的一部分。在下面的例子中,grep命令在檔案example中搜尋模式“text file”。

   $ grep 'text file' example

    使用者可以在命令列上用Shell特殊字元來生成將要搜尋的檔名列表。在下面的例子中,特殊字元“*”用來生成一個檔名列表,該列表包含當前目錄下所有的檔案。該命令將搜尋出當前目錄下所有檔案中與模式匹配的行。

   $ grep data *

    特殊字元在搜尋一組指定的檔案時非常有用。例如,如果想搜尋所有的C程式原始檔中特定的模式,您可以用“*.c”來指定檔名列表。假設使用者的 C程式中包含一些不必要的轉向語句(goto語句),想要找到這些語句,可以用如下的命令來搜尋並顯示所有包含goto語句的程式碼行:

   $ grep goto *.c

   使用者可以在命令列上鍵入搜尋模式,也可以使用-f選項從指定檔案中讀取要搜尋的模式。在檔案中,每個搜尋模式佔一行。如果經常要搜尋一組常見字串時,這個功能非常有用。在下面的例子中,使用者要在檔案exam中搜尋字串“editor”和“create”,就把要搜尋的模式放置在檔案mypats中,然後,grep命令從檔案mypats中讀取要搜尋的模式。

   $ cat mypats

   editor

   create

   $ grep -f mypats exam

   檔案查詢命令

   find命令

   功能:在目錄結構中搜尋檔案,並執行指定的操作。此命令提供了相當多的查詢條件,功能很強大。

   語法:find 起始目錄 尋找條件 操作

   說明:find命令從指定的起始目錄開始,遞迴地搜尋其各個子目錄,查詢滿足尋找條件的檔案並對之採取相關的操作。

   該命令提供的尋找條件可以是一個用邏輯運算子not、and、or組成的複合條件。邏輯運算子and、or、not的含義為:

   (1)and:邏輯與,在命令中用“-a”表示,是系統預設的選項,表示只有當所給的條件都滿足時,尋找條件才算滿足。例如:

   $ find –name 'tmp' –xtype c -user 'inin'

   該命令尋找三個給定條件都滿足的所有檔案。

   (2)or:邏輯或,在命令中用“-o”表示。該運算子表示只要所給的條件中有一個滿足時,尋找條件就算滿足。例如:

   $ find –name 'tmp' –o –name 'mina*'

   該命令查詢檔名為'tmp'或是匹配'mina*'的所有檔案。

   (3)not:邏輯非,在命令中用“!”表示。該運算子表示查詢不滿足所給條件的檔案。例如:

   $ find ! –name 'tmp'

   該命令查詢檔名不是'tmp'的所有檔案。

   需要說明的是:當使用很多的邏輯選項時,可以用括號把這些選項括起來。為了避免Shell本身對括號引起誤解,在話號前需要加跳脫字元“”來去除括號的意義。

   例:$ find (–name 'tmp' –xtype c -user 'inin' )

   尋找條件有以下選項:

   首先,下列各個選項中的n值可以有三種輸入方式,假設n為20,則:

   +20 表示20以後(21,22,23等)

   -20 表示20以前(19,18,17等)

   20 表示正好是20

   1. 以名稱和檔案屬性查詢。

   - name '字串' 查詢檔名匹配所給字串的所有檔案,字串內可用萬用字元*、?、[ ]。

   - lname '字串' 查詢檔名匹配所給字串的所有符號連結檔案,字串內可用萬用字元*、?、[ ]。

   -gid n 查詢屬於ID號為n的使用者組的所有檔案。

   -uid n 查詢屬於ID號為n的使用者的所有檔案。

   -group '字串' 查詢屬於使用者組名為所給字串的所有的檔案。

   -user '字串' 查詢屬於使用者名稱為所給字串的所有的檔案。

   -empty 查詢大小為0的目錄或檔案。

   -path '字串' 查詢路徑名匹配所給字串的所有檔案,字串內可用萬用字元*、?、[ ]。

   -perm 許可權 查詢具有指定許可權的檔案和目錄,許可權的表示可以如711,644。

   -size n[bckw] 查詢指定檔案大小的檔案,n後面的字元表示單位,預設為b,代表512位元組的塊。

   -type x 查詢型別為x的檔案,x為下列字元之一:

   b 塊裝置檔案

   c 字元裝置檔案

   d 目錄檔案

   p 命名管道(FIFO)

   f 普通檔案

   l 符號連結檔案(symbolic links)

   s socket檔案

   -xtype x 與-type基本相同,但只查詢符號連結檔案。

   2. 以時間為條件查詢

   - amin n 查詢n分鐘以前被訪問過的所有檔案。

   - atime n 查詢n天以前被訪問過的所有檔案。

   - cmin n 查詢n分鐘以前檔案狀態被修改過的所有檔案。

   - ctime n 查詢n天以前檔案狀態被修改過的所有檔案。

   - mmin n 查詢n分鐘以前檔案內容被修改過的所有檔案。

   - mtime n 查詢n天以前檔案內容被修改過的所有檔案。

   3. 可執行的操作

   - exec 命令名稱 {} 對符合條件的檔案執行所給的Linux 命令,而不詢問使用者是否需要執行該命令。{}表示命令的引數即為所找到的檔案;命令的末尾必須以“ ;”結束。

   - ok 命令名稱 { } 對符合條件的檔案執行所給的Linux 命令,與exec不同的是,它會詢問使用者是否需要執行該命令。

   - ls 詳細列出所找到的所有檔案。

   - fprintf 檔名 將找到的檔名寫入指定檔案。

   - print 在標準輸出裝置上顯示查詢出的檔名。

   - printf 格式 格式的寫法請參考有關C語言的書。

   例1:查詢當前目錄中所有以main開頭的檔案,並顯示這些檔案的內容。

   $ find . - name ‘main*' - exec more {} ;

   例2:刪除當前目錄下所有一週之內沒有被訪問過的a .out或*.o檔案。

   $ find . (- name a.out - o - name ‘*.o')

   > - atime +7 - exec rm {} ;

   說明如下:

   命令中的“.”表示當前目錄,此時find將從當前目錄開始,逐個在其子目錄中查詢滿足後面指定條件的檔案。(和)表示括號(),其中的“”稱為轉義符。之所以這樣寫是由於對Shell而言,(和)另有不同的含義,而不是這裡的用於組合條件的用途。“- name a.out”是指要查詢名為a.out的檔案;“- name ‘*.o'”是指要查詢所有名字以 .o結尾的檔案。這兩個- name之間的- o表示邏輯或(or),即查詢名字為a.out或名字以 .o結尾的檔案,find在當前目錄及其子目錄下找到這佯的檔案之後,再進行判斷,看其最後訪問時間是否在7天以前(條件-atime +7),若是,則對該檔案執行命令rm(- exec rm{ };)。其中{ }代表當前查到的符合條件的檔名,;則是語法所要求的。上述命令中第一行的最後一個是續行符。當命令太長而在一行寫不下時,可輸入一個,之後系統將顯示一個>,指示使用者繼續輸入命令。

   locate命令

   locate命令用於查詢檔案,它比find命令的搜尋速度快,它需要一個資料庫,這個資料庫由每天的例行工作(crontab)程式來建立。當我們建立好這個資料庫後,就可以方便地來搜尋所需檔案了。

   該命令的一般形式為:

   locate 相關字

   例如:查詢相關字issue

   $ locate issue

   /etc/issue

   /etc/issue.net

   /usr/man/man5/issue.5

   /usr/man/man5/issue.net.5


   第十課(三) 文字處理命令              

   Sort命令

   sort命令的功能是對檔案中的各行進行排序。sort命令有許多非常實用的選項,這些選項最初是用來對資料庫格式的檔案內容進行各種排序操作的。實際上,sort命令可以被認為是一個非常強大的資料管理工具,用來管理內容類似資料庫記錄的檔案。

   Sort命令將逐行對檔案中的內容進行排序,如果兩行的首字元相同,該命令將繼續比較這兩行的下一字元,如果還相同,將繼續進行比較。

   語法:

   sort [選項] 檔案

   說明:sort命令對指定檔案中所有的行進行排序,並將結果顯示在標準輸出上。如不指定輸入檔案或使用“- ”,則表示排序內容來自標準輸入。

   sort排序是根據從輸入行抽取的一個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字元序列。預設情況下以整行為關鍵字按ASCII字元順序進行排序。

   改變預設設定的選項主要有:

   - m 若給定檔案已排好序,合併檔案。

   - c 檢查給定檔案是否已排好序,如果它們沒有都排好序,則列印一個出錯資訊,並以狀態值1退出。

   - u 對排序後認為相同的行只留其中一行。

   - o 輸出檔案 將排序輸出寫到輸出檔案中而不是標準輸出,如果輸出檔案是輸入檔案之一,sort先將該檔案的內容寫入一個臨時檔案,然後再排序和寫輸出結果。

   改變預設排序規則的選項主要有:

   - d 按字典順序排序,比較時僅字母、數字、空格和製表符有意義。

   - f 將小寫字母與大寫字母同等對待。

   - I 忽略非列印字元。

   - M 作為月份比較:“JAN”   - r 按逆序輸出排序結果。

   +posl - pos2 指定一個或幾個欄位作為排序關鍵字,欄位位置從posl開始,到pos2為止(包括posl,不包括pos2)。如不指定pos2,則關鍵字為從posl到行尾。欄位和字元的位置從0開始。

   - b 在每行中尋找排序關鍵字時忽略前導的空白(空格和製表符)。

   - t separator 指定字元separator作為欄位分隔符。

   下面透過幾個例子來講述sort的使用。


   用sort命令對text檔案中各行排序後輸出其結果。請注意,在原檔案的第二、三行上的第一個單詞完全相同,該命令將從它們的第二個單詞vegetables與fruit的首字元處繼續進行比較。

   $ cat text

   vegetable soup

   fresh vegetables

   fresh fruit

   lowfat milk

   $ sort text

   fresh fruit

   fresh vegetables

   lowfat milk

   vegetable soup

   使用者可以儲存排序後的檔案內容,或把排序後的檔案內容輸出至印表機。下例中使用者把排序後的檔案內容儲存到名為result的檔案中。

   $ sort text>result


   以第2個欄位作為排序關鍵字對檔案example的內容進行排序。

   $ sort +1-2 example


   對於file1和file2檔案內容反向排序,結果放在outfile中,利用第2個欄位的第一個字元作為排序關鍵字。

   $ sort -r -o outfile +1.0 -1.1 example


   sort排序常用於在管道中與其他命令連用,組合完成比較複雜的功能,如利用管道將當前工作目錄中的檔案送給sort進行排序,排序關鍵字是第6個至第8個欄位。

   $ ls - l | sort +5 - 7

   sort命令也可以對標準輸入進行操作。例如,如果您想把幾個檔案文字行合併,並對合並後的文字行進行排序,您可以首先用命令cat把多個檔案合併,然後用管道操作把合併後的文字行輸入給命令sort,sort命令將輸出這些合併及排序後的文字行。在下面的例子中,檔案veglist與檔案fruitlist的文字行經過合併與排序後被儲存到檔案clist中。

   $ cat veglist fruitlist | sort > clist


   uniq命令

   檔案經過處理後在它的輸出檔案中可能會出現重複的行。例如,使用cat命令將兩個檔案合併後,再使用sort命令進行排序,就可能出現重複行。這時可以使用uniq命令將這些重複行從輸出檔案中刪除,只留下每條記錄的唯一樣本。

   語法:uniq [選項] 檔案

   說明:這個命令讀取輸入檔案,並比較相鄰的行。在正常情況下,第二個及以後更多個重複行將被刪去,行比較是根據所用字符集的排序序列進行的。該命令加工後的結果寫到輸出檔案中。輸入檔案和輸出檔案必須不同。如果輸入檔案用“- ”表示,則從標準輸入讀取。

   該命令各選項含義如下:、

   - c 顯示輸出中,在每行行首加上本行在檔案中出現的次數。它可取代- u和- d選項。

   - d 只顯示重複行。

   - u 只顯示檔案中不重複的各行。

   - n 前n個欄位與每個欄位前的空白一起被忽略。一個欄位是一個非空格、非製表符的字串,彼此由製表符和空格隔開(欄位從0開始編號)。

   +n 前n個字元被忽略,之前的字元被跳過(字元從0開始編號)。

   - f n 與- n相同,這裡n是欄位數。

   - s n 與+n相同,這裡n是字元數。

   例如:

   1. 顯示檔案example中不重複的行。

   uniq - u example

   2. 顯示檔案example中不重複的行,從第2個欄位的第2個字元開始做比較。

   uniq - u - 1 +1 example

本文由TurboLinux公司提供

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10617542/viewspace-947438/,如需轉載,請註明出處,否則將追究法律責任。

相關文章