你應該知道的一些Linux技巧

pythontab發表於2013-03-21

首先,我想告訴大家,在Unix/Linux下,最有效率技巧的不是操作圖形介面,而是命令列操作,因為命令列意味著自動化。如果你看過《你可能不知道的Shell》以及《28個Unix/Linux的命令列神器》你就會知道Linux有多強大,這個強大完全來自於命令列,於是,就算你不知道怎麼去做一個環保主義的程式設計師,至少他們可以讓你少熬點夜,從而有利於你的身體健康。下面是一個有點長的列表,正如作者所說,你並不需要知道所有的這些東西,但是如果你還在很沉重地在使用Linux的話,這些東西都值得你看一看。

(注:如果你想知道下面涉及到的命令的更多的用法,你一定要man一點。對於一些命令,你可能需要先yum或apt-get來安裝一下,如果有什麼問題,別忘了Google。)

基礎

學習 Bash 。你可以man bash來看看bash的東西,並不複雜也並不長。你用別的shell也行,但是bash是很強大的並且也是系統預設的。(學習zsh或tsch只會讓你在很多情況下受到限制)

學習 vim 。在Linux下,基本沒有什麼可與之競爭的編輯器(就算你是一個Emacs或Eclipse的重度使用者)。你可以看看《簡明vim攻略》和 《Vim的冒險遊戲》以及《給程式設計師的Vim速查卡》還有《把Vim變成一個程式設計的IDE》等等。

瞭解 ssh。明白不需要口令的使用者認證(透過ssh-agent, ssh-add),學會用ssh翻 牆,用scp而不是ftp傳檔案,等等。你知道嗎?scp 遠端的時候,你可以按tab鍵來檢視遠端的目錄和檔案(當然,需要無口令的使用者認證),這都是bash的功勞。

熟悉bash的作業管理,如: &, Ctrl-Z, Ctrl-C, jobs, fg, bg, kill, 等等。當然,你也要知道Ctrl+\(SIGQUIT)和Ctrl+C (SIGINT)的區別。

簡單的檔案管理 : ls 和 ls -l (你最好知道 “ls -l” 的每一列的意思), less, head, tail 和 tail -f, ln 和 ln -s (你知道明白hard link和soft link的不同和優缺點), chown, chmod, du (如果你想看看磁碟的大小 du -sk *), df, mount。當然,原作者忘了find命令。

基礎的網路管理: ip 或 ifconfig, dig。當然,原作者還忘了如netstat, ping, traceroute, 等

理解正規表示式,還有grep/egrep的各種選項。比如: -o, -A, 和 -B 這些選項是很值得了解的。

學習使用 apt-get 和 yum 來查詢和安裝軟體(前者的經典分發包是Ubuntu,後者的經典分發包是Redhat),我還建議你試著從原始碼編譯安裝軟體。

日常

在 bash 裡,使用 Ctrl-R 而不是上下游標鍵來查詢歷史命令。

在 bash裡,使用 Ctrl-W 來刪除最後一個單詞,使用 Ctrl-U 來刪除一行。請man bash後查詢Readline Key Bindings一節來看看bash的預設熱鍵,比如:Alt-. 把上一次命令的最後一個引數打出來,而Alt-* 則列出你可以輸入的命令。

回到上一次的工作目錄: cd – (回到home是 cd ~)

使用 xargs。這是一個很強大的命令。你可以使用-L來限定有多少個命令,也可以用-P來指定並行的程序數。如果你不知道你的命令會變成什麼樣,你可以使用xargs echo來看看會是什麼樣。當然, -I{} 也很好用。示例:

程式碼

find . -name \*.py | xargs grep some_function

cat hosts | xargs -I{} ssh root@{} hostname

pstree -p 可以幫你顯示程序樹。(讀過我的那篇《一個fork的面試題》的人應該都不陌生)

使用 pgrep 和 pkill 來找到或是kill 某個名字的程序。 (-f 選項很有用).

瞭解可以發給程序的訊號。例如:要掛起一個程序,使用 kill -STOP [pid]. 使用 man 7 signal 來檢視各種訊號,使用kill -l 來檢視數字和訊號的對應表

使用 nohup 或 disown 如果你要讓某個程序執行在後臺。

使用netstat -lntp來看看有偵聽在網路某埠的程序。當然,也可以使用 lsof。

在bash的指令碼中,你可以使用 set -x 來debug輸出。使用 set -e 來當有錯誤發生的時候abort執行。考慮使用 set -o pipefail 來限制錯誤。還可以使用trap來截獲訊號(如截獲ctrl+c)。

在bash 指令碼中,subshells (寫在圓括號裡的) 是一個很方便的方式來組合一些命令。一個常用的例子是臨時地到另一個目錄中,例如:

程式碼

# do something in current dir

(cd /some/other/dir; other-command)

# continue in original dir

在 bash 中,注意那裡有很多的變數展開。如:檢查一個變數是否存在: ${name:?error message}。如果一個bash的指令碼需要一個引數,也許就是這樣一個表示式 input_file=${1:?usage: $0 input_file}。一個計算表示式: i=$(( (i + 1) % 5 ))。一個序列: {1..10}。 截斷一個字串: ${var%suffix} 和 ${var#prefix}。 示例: if var=foo.pdf, then echo ${var%.pdf}.txt prints “foo.txt”.

透過 <(some command) 可以把某命令當成一個檔案。示例:比較一個本地檔案和遠端檔案 /etc/hosts: diff /etc/hosts <(ssh somehost cat /etc/hosts)

瞭解什麼叫 “here documents” ,就是諸如 cat <<EOF 這樣的東西。

在 bash中,使用重定向到標準輸出和標準錯誤。如: some-command >logfile 2>&1。另外,要確認某命令沒有把某個開啟了的檔案控制代碼重定向給標準輸入,最佳實踐是加上 “</dev/null”,把/dev/null重定向到標準輸入。

使用 man ascii 來檢視 ASCII 表。

在遠端的 ssh 會話裡,使用 screen 或 dtach 來儲存你的會話。(參看《28個Unix/Linux的命令列神器》)

要來debug Web,試試curl 和 curl -I 或是 wget 。我覺得debug Web的利器是firebug,curl和wget是用來抓網頁的,呵呵。

把 HTML 轉成文字: lynx -dump -stdin

如果你要處理XML,使用 xmlstarlet

對於 Amazon S3, s3cmd 是一個很方便的命令(還有點不成熟)

在 ssh中,知道怎麼來使用ssh隧道。透過 -L or -D (還有-R) ,翻 牆神器。

你還可以對你的ssh 做點最佳化。比如,.ssh/config 包含著一些配置:避免連結被丟棄,連結新的host時不需要確認,轉發認證,以前使用壓縮(如果你要使用scp轉檔案):

程式碼

TCPKeepAlive=yes

ServerAliveInterval=15

ServerAliveCountMax=6

StrictHostKeyChecking=no

Compression=yes

ForwardAgent=yes

如果你有輸了個命令列,但是你改變注意了,但你又不想刪除它,因為你要在歷史命令中找到它,但你也不想執行它。那麼,你可以按下 Alt-# ,於是這個命令關就被加了一個#字元,於是就被註釋掉了。

資料處理

瞭解 sort 和 uniq 命令 (包括 uniq 的 -u 和 -d 選項).

瞭解用 cut, paste, 和 join 命令來操作文字檔案。很多人忘了在cut前使用join。

如果你知道怎麼用sort/uniq來做集合交集、並集、差集能很大地促進你的工作效率。假設有兩個文字檔案a和b已解被 uniq了,那麼,用sort/uniq會是最快的方式,無論這兩個檔案有多大(sort不會被記憶體所限,你甚至可以使用-T選項,如果你的/tmp目錄很小)

程式碼

cat a b | sort | uniq > c # c is a union b 並集

cat a b | sort | uniq -d > c # c is a intersect b 交集

cat a b b | sort | uniq -u > c # c is set difference a - b 差集

瞭解和字符集相關的命令列工具,包括排序和效能。很多的Linux安裝程式都會設定LANG 或是其它和字符集相關的環境變數。這些東西可能會讓一些命令(如:sort)的執行效能慢N多倍(注:就算是你用UTF-8編碼文字檔案,你也可以很安全地使用ASCII來對其排序)。如果你想Disable那個i18n 並使用傳統的基於byte的排序方法,那就設定export LC_ALL=C (實際上,你可以把其放在 .bashrc)。如果這設定這個變數,你的sort命令很有可能會是錯的。

瞭解 awk 和 sed,並用他們來做一些簡單的資料修改操作。例如:求第三列的數字之和: awk ‘{ x += $3 } END { print x }’。這可能會比Python快3倍,並比Python的程式碼少三倍。

使用 shuf 來打亂一個檔案中的行或是選擇檔案中一個隨機的行。

瞭解sort命令的選項。瞭解key是什麼(-t和-k)。具體說來,你可以使用-k1,1來對第一列排序,-k1來對全行排序。

Stable sort (sort -s) 會很有用。例如:如果你要想對兩例排序,先是以第二列,然後再以第一列,那麼你可以這樣: sort -k1,1 | sort -s -k2,2

我們知道,在bash命令列下,Tab鍵是用來做目錄檔案自動完成的事的。但是如果你想輸入一個Tab字元(比如:你想在sort -t選項後輸入<tab>字元),你可以先按Ctrl-V,然後再按Tab鍵,就可以輸入<tab>字元了。當然,你也可以使用$’\t’。

如果你想檢視二進位制檔案,你可以使用hd命令(在CentOS下是hexdump命令),如果你想編譯二進位制檔案,你可以使用bvi命令(http://bvi.sourceforge.net/)

另外,對於二進位制檔案,你可以使用strings(配合grep等)來檢視二進位制中的文字。

對於文字檔案轉碼,你可以試一下 iconv。或是試試更強的 uconv 命令(這個命令支援更高階的Unicode編碼)

如果你要分隔一個大檔案,你可以使用split命令(split by size)和csplit命令(split by a pattern)。

系統除錯

如果你想知道磁碟、CPU、或網路狀態,你可以使用 iostat, netstat, top (或更好的 htop), 還有 dstat 命令。你可以很快地知道你的系統發生了什麼事。關於這方面的命令,還有iftop, iotop等(參看《28個Unix/Linux的命令列神器》)

要了解記憶體的狀態,你可以使用free和vmstat命令。具體來說,你需要注意 “cached” 的值,這個值是Linux核心佔用的記憶體。還有free的值。

Java 系統監控有一個小的技巧是,你可以使用kill -3 <pid> 發一個SIGQUIT的訊號給JVM,可以把堆疊資訊(包括垃圾回收的資訊)dump到stderr/logs。

使用 mtr 會比使用 traceroute 要更容易定位一個網路問題。

如果你要找到哪個socket或程序在使用網路頻寬,你可以使用 iftop 或 nethogs。

Apache的一個叫 ab 的工具是一個很有用的,用quick-and-dirty的方式來測試網站伺服器的效能負載的工作。如果你需要更為複雜的測試,你可以試試 siege。

如果你要抓網路包的話,試試 wireshark 或 tshark。

瞭解 strace 和 ltrace。這兩個命令可以讓你檢視程序的系統呼叫,這有助於你分析程序的hang在哪了,怎麼crash和failed的。你還可以用其來做效能profile,使用 -c 選項,你可以使用-p選項來attach上任意一個程序。

瞭解用ldd命令來檢查相關的動態連結庫。注意:ldd的安全問題

使用gdb來除錯一個正在執行的程序或分析core dump檔案。參看我寫的《GDB中應該知道的幾個除錯方法》

學會到 /proc 目錄中檢視資訊。這是一個Linux核心執行時記錄的整個作業系統的執行統計和資訊,比如: /proc/cpuinfo, /proc/xxx/cwd, /proc/xxx/exe, /proc/xxx/fd/, /proc/xxx/smaps.

如果你除錯某個東西為什麼出錯時,sar命令會有用。它可以讓你看看 CPU, 記憶體, 網路, 等的統計資訊。

使用 dmesg 來檢視一些硬體或驅動程式的資訊或問題。


相關文章