Linux Shell 萬用字元、元字元、轉義符使用

發表於2015-10-16

說到shell萬用字元(wildcard),大家在使用時候會經常用到。下面是一個例項:

從上面這個例項,不知道大家有沒有發現問題呢。我們先了解一下,萬用字元相關知識,再分析下這個例項吧。

一、linux shell萬用字元(wildcard)

萬用字元是由shell處理的(不是由所涉及到命令語句處理的,其實我們在shell各個命令中也沒有發現有這些萬用字元介紹), 它只會出現在 命令的“引數”裡(它不用在 命令名稱裡, 也不用在 操作符上)。當shell在“引數”中遇到了萬用字元時,shell會將其當作路徑或檔名去在磁碟上搜尋可能的匹配:若符合要求的匹配存在,則進行代換(路徑擴充套件);否則就將該萬用字元作為一個普通字元傳遞給“命令”,然後再由命令進行處理。總之,萬用字元 實際上就是一種shell實現的路徑擴充套件功能。在 萬用字元被處理後, shell會先完成該命令的重組,然後再繼續處理重組後的命令,直至執行該命令。

我們回過頭分析上面命令吧:在第2個命令中,*.txt 實際shell搜尋檔案,找到了符合條件的檔案,命令會變成:ls a.txt b.txt ,實際在執行ls 時候傳給它的是a.txt b.txt .

而命令3,d*.txt 由於當前目錄下面沒有這樣的檔案或目錄,直接將”d*.txt” 作為ls 引數,傳給了 ls .這個時候”*” 只是一個普通的 ls 引數而已,已經失去了它通配意義。 由於找不到檔案,所以會出現:無法訪問提示!

瞭解了shell萬用字元,我們現在看下,shell常見萬用字元有那一些了。

shell常見萬用字元:

字元 含義 例項
* 匹配 0 或多個字元 a*b  a與b之間可以有任意長度的任意字元, 也可以一個也沒有, 如aabcb, axyzb, a012b, ab。
? 匹配任意一個字元 a?b  a與b之間必須也只能有一個字元, 可以是任意字元, 如aab, abb, acb, a0b。
匹配 list 中的任意單一字元 a[xyz]b   a與b之間必須也只能有一個字元, 但只能是 x 或 y 或 z, 如: axb, ayb, azb。
[!list] 匹配 除list 中的任意單一字元 a[!0-9]b  a與b之間必須也只能有一個字元, 但不能是阿拉伯數字, 如axb, aab, a-b。
[c1-c2] 匹配 c1-c2 中的任意單一字元 如:[0-9] [a-z] a[0-9]b  0與9之間必須也只能有一個字元 如a0b, a1b… a9b。
{string1,string2,…} 匹配 sring1 或 string2 (或更多)其一字串 a{abc,xyz,123}b    a與b之間只能是abc或xyz或123這三個字串之一。

需要說明的是:萬用字元看起來有點象正規表示式語句,但是它與正規表示式不同的,不能相互混淆。把萬用字元理解為shell 特殊代號字元就可。而且涉及的只有,*,? [] ,{} 這幾種。

二、shell元字元(特殊字元 Meta)

shell 除了有萬用字元之外,由shell 負責預先先解析後,將處理結果傳給命令列之外,shell還有一系列自己的其他特殊字元。

字元 說明
IFS 由 <space> 或 <tab> 或 <enter> 三者之一組成(我們常用 space )。
CR 由 <enter> 產生。
= 設定變數。
$ 作變數或運算替換(請不要與 shell prompt 搞混了)。
> 重導向 stdout。 *
< 重導向 stdin。 *
| 命令管線。 *
& 重導向 file descriptor ,或將命令置於背境執行。 *
( ) 將其內的命令置於 nested subshell 執行,或用於運算或命令替換。 *
{ } 將其內的命令置於 non-named function 中執行,或用在變數替換的界定範圍。
; 在前一個命令結束時,而忽略其返回值,繼續執行下一個命令。 *
&& 在前一個命令結束時,若返回值為 true,繼續執行下一個命令。 *
|| 在前一個命令結束時,若返回值為 false,繼續執行下一個命令。 *
! 執行 history 列表中的命令。*

加入”*” 都是作用在命令名直接。可以看到shell 元字元,基本是作用在命令上面,用作多命令分割(或者引數分割)。因此看到與萬用字元有相同的字元,但是實際上作用範圍不同。所以不會出現混淆。

 

以下是man bash 得到的英文解析:

metacharacter
A character that, when unquoted, separates words.  One of the following:
|  & ; ( ) < > space tab
control operator
A token that performs a control function.  It is one of the following symbols:
|| & && ; ;; ( ) | <newline>

三、shell轉義符

有時候,我們想讓 萬用字元,或者元字元 變成普通字元,不需要使用它。那麼這裡我們就需要用到轉義符了。 shell提供轉義符有三種。

字元 說明
‘’(單引號) 又叫硬轉義,其內部所有的shell 元字元、萬用字元都會被關掉。注意,硬轉義中不允許出現’(單引號)。
“”(雙引號) 又叫軟轉義,其內部只允許出現特定的shell 元字元:$用於引數代換 `用於命令代替
$$反斜槓)   又叫轉義,去除其後緊跟的元字元或萬用字元的特殊意義。

man bash 英文解釋如下:

There are three quoting mechanisms: the escape character, single quotes, and double quotes.

例項:

可以看到,加入了轉義符 “*”已經失去了萬用字元意義了。

四、shell解析指令碼的過程

看到上面說的這些,想必大家會問到這個問題是,有這麼想特殊字元,萬用字元,那麼 shell在得到一條命令,到達是怎麼樣處理的呢?我們看下下面的圖:

如果用雙引號包括起來,shell檢測跳過了1-4步和9-10步,單引號包括起來,shell檢測就會跳過了1-10步。也就是說,雙引號 只經過引數擴充套件、命令代換和算術代換就可以送入執行步驟,而單引號轉義符直接會被送入執行步驟。而且,無論是雙引號轉義符還是單引號轉義符在執行的時候能夠告訴各個命令自身內部是一體的,但是其本身在執行時是並不是命令中文字的一部分。

相關文章