簡單的文字處理

2puT發表於2016-07-26
簡單的文字處理 - 實驗樓
https://www.shiyanlou.com/courses/document/337
簡單的文字處理
實驗介紹
這一節我們將介紹這幾個命令 tr (注意不是
tar), col , join , paste 。實際這一節是上一節關於能實現管道
操作的命令的延續,所以我們依然將結合管道來熟悉這些命令的使
用。
一、常用的文字處理命令
二、文字處理命令
1.tr 命令
tr 命令可以用來刪除一段文字資訊中的某些文字。或者將其進行轉
換。
使用方式:
tr [option] .. .SET1 [SET2]
常用的選項有:
選項說明
-d 刪除和set1匹配的字元,注意不是全詞匹配也不是按字元順序匹配
-s 去除set1指定的在輸入文字中連續並重復的字元
操作舉例:
# 刪除 "hello shiyanlou" 中所有的'o','l','h'
$ echo 'hello shiyanlou' | tr -d 'olh'
# 將"hello" 中的ll,去重為一個l
$ echo 'hello' | tr -s 'l'
# 將輸入文字,全部轉換為大寫或小寫輸出
$ cat /etc/passwd | tr '[:lower:]' '[:upper:]'
# 上面的'[:lower:]' '[:upper:]'你也可以簡單的寫作'[
a-z]' '[A-Z]',當然反過來將大寫變小寫也是可以的
1 of 6
08/17/2015 07:24 PM簡單的文字處理 - 實驗樓
https://www.shiyanlou.com/courses/document/337
更多 tr 的使用,你可以使用 --help 或者 man tr 獲得。
2.col 命令
col 命令可以將 Tab 換成對等數量的空格建,或反轉這個操作。
使用方式:
col [option]
常用的選項有:
選項說明
-x 將 Tab 轉換為空格
-h 將空格轉換為 Tab (預設選項)
操作舉例:
# 檢視 /etc/protocols 中的不可見字元,可以看到很多 ^
I ,這其實就是 Tab 轉義成可見字元的符號
$ cat -A /etc/protocols
# 使用 col -x 將 /etc/protocols 中的 Tab 轉換為空
格,然後再使用 cat 檢視,你發現 ^I 不見了
$ cat /etc/protocols | col -x | cat -A
3.join命令
學過資料庫的使用者對這個應該不會陌生,這個命令就是用於將兩個文
件中包含相同內容的那一行合併在一起。
使用方式:
join [option]... file1 file2
常用的選項有:
選項說明
2 of 6
08/17/2015 07:24 PM簡單的文字處理 - 實驗樓
https://www.shiyanlou.com/courses/document/337
選項說明
-t 指定分隔符,預設為空格
-i 忽略大小寫的差異
-1 指明第一個檔案要用哪個欄位來對比,,預設對比第一個欄位
-2 指明第二個檔案要用哪個欄位來對比,,預設對比第一個欄位
操作舉例:
# 建立兩個檔案
$ echo '1 hello' > file1
$ echo '1 shiyanlou' > file2
$ join file1 file2
# 將/etc/passwd與/etc/shadow兩個檔案合併,指定以':'
作為分隔符
$ sudo join -t ':' /etc/passwd /etc/shadow
# 將/etc/passwd與/etc/group兩個檔案合併,指定以':'
作為分隔符, 分別比對第4和第3個欄位
$ sudo join -t ':' - 1 4 /etc/passwd - 2 3 /etc/group
4.paste命令
paste 這個命令與 join 命令類似,它是在不對比資料的情況下,簡
單地將多個檔案合併一起,以 Tab 隔開。
使用方式:
paste [option] file ...
常用的選項有:
選項說明
-d 指定合併的分隔符,預設為Tab
-s 不合併到一行,每個檔案為一行
操作舉例:
3 of 6
08/17/2015 07:24 PM簡單的文字處理 - 實驗樓
https://www.shiyanlou.com/courses/document/337
$ echo hello > file1
$ echo shiyanlou > file2
$ echo www.shiyanlou.com > file3
$ paste -d ':' file1 file2 file3
$ paste -s file1 file2 file3
三、小結
上面這些命令不是所有你都會經常用到,不過它們確是很實用的,熟
練掌握之後,可以減輕很多工作量,比如不停的用滑鼠操作在 gedit 裡
面複製貼上賦值貼上,將兩個檔案的內容合併為一個檔案,這原本只
需要一個命令就能完成。
作業
1、在《檔案打包與解壓縮》一節實驗中提到 Windows/dos 與
Linux/UNIX 文字檔案一些特殊字元不一致,如斷行符 Windows 為
CR+LF( \r\n ),Linux/UNIX 為 LF( \n )。使用 cat -A 文字 可以看
到文字中包含的不可見特殊字元。Linux 的 \n 表現出來就是一個 $ ,
而 Windows/dos 的表現為 ^M$ ,可以直接使用 dos2unix 和
unix2dos 工具在兩種格式之間進行轉換,使用 file 命令可以檢視文
件的具體型別。不過現在希望你在不使用上述兩個轉換工具的情況
下,使用前面學過的命令手動完成 dos 文字格式到 UNIX 文字格式的
轉換。
2、還記得小時候在小霸王上面玩的小蜜蜂遊戲麼?它的正統名字應該
是Space Invaders:太空侵略者 (http://en.wikipedia.org/wiki
/Space_Invaders)。
使用下面這個命令可以安裝,之所以叫 ninvaders 是因為這款遊戲是
基於 ncurses 命令列圖形庫做的:
sudo apt- get install ninvaders
4 of 6
08/17/2015 07:24 PM簡單的文字處理 - 實驗樓
https://www.shiyanlou.com/courses/document/337
動手做實驗,輕鬆學IT。
實驗樓-通過動手實踐的方式學會IT技術。
公司簡介 (/aboutus) 聯絡我們 (/contact) 常見問題 (/faq#howtostart) 加入我們 (/hire) 隱私協議 (/privacy)
會員條款 (/terms)
站長統計 (http://www.cnzz.com/stat/website.php?web_id=5902315)
蜀ICP備13019762號 (http://www.miibeian.gov.cn/)
(http://www.anquan.org/authenticate/cert/?site=www.shiyanlou.com&at=realname)
QQ群
微信
5 of 6
08/17/2015 07:24 PM簡單的文字處理 - 實驗樓
https://www.shiyanlou.com/courses/document/337
微博
(http://weibo.com/shiyanlou2013)
6 of 6
08/17/2015 07:24 PM

相關文章