【轉載】SHELL字串處理技巧(${}、##、%%)

摩斯電碼發表於2013-08-21

轉載自:http://www.cnblogs.com/pmars/archive/2013/02/17/2914444.html

在SHELL程式設計中,經常要處理一些字串變數。比如,計算長度啊、擷取子串啊、字元替換啊等等,常常要用到awk、expr、sed、tr等命令。下面給大家介紹個簡單的字串處理方法,用不著巢狀複雜的子命令。

  1. ${#VALUE}:計算VALUE字串的字元數量。
  2. ${VALUE%.*}${VALUE%%.*}:刪除VALUE字串中以分隔符“.”匹配的右邊字元,保留左邊字元。
  3. ${VALUE#*.}${VALUE##*.}:刪除VALUE字串中以分隔符“.”匹配的左邊字元,保留右邊字元。
  4. ${VALUE/OLD/NEW}${VALUE//OLD/NEW}:用NEW子串替換VALUE字串中匹配的OLD子串。

    補充:“*”表示萬用字元,用於匹配字串將被刪除的字串。“.”表示字串中分隔符,可以為任意一個或 多個字元。“%”表示從右向左匹配,“#”表示從左向右匹配,“\”表示替換,都屬於非貪婪匹配,即匹配符合萬用字元的最短結果。與“%”、“#”和“/” 類似的有“%%”、“##”和“//”,都屬於貪婪匹配,即匹配符合萬用字元的最長結果。

  1. ${VALUE:OFFSET}${VALUE:OFFSET:LENGTH}:從VALUE字串的左邊開始中擷取子串。
  2. ${VALUE:0-OFFSET}${VALUE:0-OFFSET:LENGTH}:從VALUE字串的右邊開始中擷取子串。

    補充:左邊第一個字元從“0”開始,右邊第一個字元從“0-1”開始。 表示偏移OFFSET個字元開始,LENGTH表示要擷取字元的長度。如果沒有LENGTH變數,表示偏移OFFSET個字元開始到字串結束。

  1. ${VALUE:-WORD}:當變數未定義或者值為空時,返回值為WORD的內容,否則返回變數的值。
  2. ${VALUE:=WORD}:當變數未定義或者值為空時,返回WORD的值的同時並將WORD賦值給VALUE,否則返回變數的值。
  3. ${VALUE:+WORD}:當變數已賦值時,其值才用WORD替換,否則不進行任何替換。
  4. ${VALUE:?MESSAGE}:當變數已賦值時,正常替換。否則將訊息MESSAGE送到標準錯誤輸出(若此替換出現在SHELL程式中,那麼該程式將終止執行)。

    補充:WORD可以為一個字串,也可以為一個變數。當為變數時,需要用“$”引用該變數。

 

參考:http://blog.zol.com.cn/2322/article_2321763.html

$( ) 與 ` ` (反引號)
在 bash shell 中,$( ) 與 ` ` (反引號) 都是用來做命令替換用(command substitution)的。

所謂的命令替換與我們第五章學過的變數替換差不多,都是用來重組命令列:
* 完成引號裡的命令列,然後將其結果替換出來,再重組命令列。
例如:
[code]$ echo the last sunday is $(date -d "last sunday" +%Y-%m-%d)[/code]
如此便可方便得到上一星期天的日期了… ^_^

用 $( ) 的理由:

1,   ` ` 很容易與 ' ' ( 單引號)搞混亂,尤其對初學者來說。
有時在一些奇怪的字形顯示中,兩種符號是一模一樣的(直豎兩點)。
當然了,有經驗的朋友還是一眼就能分辯兩者。只是,若能更好的避免混亂,又何樂不為呢? ^_^

2, 在多層次的複合替換中,` ` 須要額外的跳脫( \` )處理,而 $( ) 則比較直觀。例如:
這是錯的:
[code]command1 `command2 `command3` `[/code]
原本的意圖是要在 command2 `command3` 先將 command3 提換出來給 command 2 處理,
然後再將結果傳給 command1 `command2 …` 來處理。
然而,真正的結果在命令列中卻是分成了 `command2 ` 與 “ 兩段。
正確的輸入應該如下:
[code]command1 `command2 \`command3\` `[/code]

要不然,換成 $( ) 就沒問題了:
[code]command1 $(command2 $(command3))[/code]
只要你喜歡,做多少層的替換都沒問題啦~~~   ^_^

$( ) 的不足:
1. ` ` 基本上可用在全部的 unix shell 中使用,若寫成 shell cript: ,其移植性比較高。
而 $( ) 並不見的每一種 shell 都能使用,我只能跟你說,若你用 bash2 的話,肯定沒問題…   ^_^

${ } 用來作變數替換。
一般情況下,$var 與 ${var} 並沒有啥不一樣。
但是用 ${ } 會比較精確的界定變數名稱的範圍,比方說:
$ A=B
$ echo $AB
原本是打算先將 $A 的結果替換出來,然後再補一個 B 字母於其後,
但在命令列上,真正的結果卻是隻會提換變數名稱為 AB 的值出來…
若使用 ${ } 就沒問題了:
$ echo ${A}B
BB

不過,假如你只看到 ${ } 只能用來界定變數名稱的話,那你就實在太小看 bash 了﹗
有興趣的話,你可先參考一下 cu 本版的精華文章:
http://www.chinaunix.net/forum/viewtopic.php?t=201843

為了完整起見,我這裡再用一些例子加以說明 ${ } 的一些特異功能:
假設我們定義了一個變數為:
file=/dir1/dir2/dir3/my.file.txt
我們可以用 ${ } 分別替換獲得不同的值:
${file#*/}:拿掉第一條 / 及其左邊的字串:dir1/dir2/dir3/my.file.txt
${file##*/}:拿掉最後一條 / 及其左邊的字串:my.file.txt
${file#*.}:拿掉第一個 .  及其左邊的字串:file.txt
${file##*.}:拿掉最後一個 .  及其左邊的字串:txt
${file%/*}:拿掉最後條 / 及其右邊的字串:/dir1/dir2/dir3
${file%%/*}:拿掉第一條 / 及其右邊的字串:(空值)
${file%.*}:拿掉最後一個 .  及其右邊的字串:/dir1/dir2/dir3/my.file
${file%%.*}:拿掉第一個 .  及其右邊的字串:/dir1/dir2/dir3/my
記憶的方法為:
[list]# 是去掉左邊(在鑑盤上 # 在 $ 之左邊)
% 是去掉右邊(在鑑盤上 % 在 $ 之右邊)
單一符號是最小匹配﹔兩個符號是最大匹配。[/list]
${file:0:5}:提取最左邊的 5 個位元組:/dir1
${file:5:5}:提取第 5 個位元組右邊的連續 5 個位元組:/dir2

我們也可以對變數值裡的字串作替換:
${file/dir/path}:將第一個 dir 提換為 path:/path1/dir2/dir3/my.file.txt
${file//dir/path}:將全部 dir 提換為 path:/path1/path2/path3/my.file.txt

利用 ${ } 還可針對不同的變數狀態賦值(沒設定、空值、非空值):
${file-my.file.txt} :假如 $file 沒有設定,則使用 my.file.txt 作傳回值。(空值及非空值時不作處理)
${file:-my.file.txt} :假如 $file 沒有設定或為空值,則使用 my.file.txt 作傳回值。 (非空值時不作處理)
${file+my.file.txt} :假如 $file 設為空值或非空值,均使用 my.file.txt 作傳回值。(沒設定時不作處理)
${file:+my.file.txt} :若 $file 為非空值,則使用 my.file.txt 作傳回值。 (沒設定及空值時不作處理)
${file=my.file.txt} :若 $file 沒設定,則使用 my.file.txt 作傳回值,同時將 $file 賦值為 my.file.txt 。 (空值及非空值時不作處理)
${file:=my.file.txt} :若 $file 沒設定或為空值,則使用 my.file.txt 作傳回值,同時將 $file 賦值為 my.file.txt 。 (非空值時不作處理)
${file?my.file.txt} :若 $file 沒設定,則將 my.file.txt 輸出至 STDERR。 (空值及非空值時不作處理)
${file:?my.file.txt} :若 $file 沒設定或為空值,則將 my.file.txt 輸出至 STDERR。 (非空值時不作處理)

 

tips:
以上的理解在於, 你一定要分清楚 unset 與 null 及 non-null 這三種賦值狀態.
一般而言, : 與 null 有關, 若不帶 : 的話, null 不受影響, 若帶 : 則連 null 也受影響.

還有哦,${#var} 可計算出變數值的長度:
${#file} 可得到 27 ,因為 /dir1/dir2/dir3/my.file.txt 剛好是 27 個位元組…

接下來,再為大家介稍一下 bash 的組數(array)處理方法。
一般而言,A="a b c def" 這樣的變數只是將 $A 替換為一個單一的字串,
但是改為 A=(a b c def) ,則是將 $A 定義為組數…
bash 的組數替換方法可參考如下方法:
${A[@]} 或 ${A[*]} 可得到 a b c def (全部組數)
${A[0]} 可得到 a (第一個組數),${A[1]} 則為第二個組數…
${#A[@]} 或 ${#A[*]} 可得到 4 (全部組數數量)
${#A[0]} 可得到 1 (即第一個組數(a)的長度),${#A[3]} 可得到 3 (第四個組數(def)的長度)
A[3]=xyz 則是將第四個組數重新定義為 xyz …

好了,最後為大家介紹 $(( )) 的用途吧:它是用來作整數運算的。
在 bash 中,$(( )) 的整數運算子號大致有這些:
+ - * / :分別為 "加、減、乘、除"。
% :餘數運算
& | ^ !:分別為 "AND、OR、XOR、NOT" 運算。

例:
$ a=5; b=7; c=2
$ echo $(( a+b*c ))
19
$ echo $(( (a+b)/c ))
6
$ echo $(( (a*b)%c))
1

在 $(( )) 中的變數名稱,可於其前面加 $ 符號來替換,也可以不用,如:
$(( $a + $b * $c)) 也可得到 19 的結果

此外,$(( )) 還可作不同進位(如二進位制、八進位、十六進位制)作運算呢,只是,輸出結果皆為十進位制而已:
echo $((16#2a)) 結果為 42 (16進位轉十進位制)
以一個實用的例子來看看吧:
假如當前的   umask 是 022 ,那麼新建檔案的許可權即為:
$ umask 022
$ echo "obase=8;$(( 8#666 & (8#777 ^ 8#$(umask)) ))" | bc
644

事實上,單純用 (( )) 也可重定義變數值,或作 testing:
a=5; ((a++)) 可將 $a 重定義為 6
a=5; ((a–)) 則為 a=4
a=5; b=7; ((a < b)) 會得到   0 (true) 的返回值。
常見的用於 (( )) 的測試符號有如下這些:
<:小於
>:大於
<=:小於或等於
>=:大於或等於
==:等於
!=:不等於

 

 

相關文章