Linux系統超全超實惠的命令列工具

Koma_Wong發表於2018-08-25

Linux工具

Linux下還是有很多超棒的開發工具的。

在Linux日常使用中,最常用的命令自然是sudo, ls, cp, mv, cat等,但作為後臺開發者,上述命令遠遠不夠。從我的理解來看,合格的C/C++開發者至少需要從開發及除錯工具、檔案處理、效能分析、網路工具四個方面針對性使用一些開發工具。這裡我羅列了一些,大部分都是開發中經常需要使用的命令,有些功能比較簡單的命令我會給出一些基本用法,有些本身自帶體系(比如vim, gdb等)的命令只能附上鍊接了。

開發及除錯工具介紹了從“編輯 -> 編譯 -> 分析目標檔案 -> 追蹤呼叫過程”的全套命令,檔案處理部分介紹了查詢、統計、替換等基本文字操作命令,效能分析介紹了檢視程式資訊、CPU負載、I/O負載、記憶體使用情況等基本命令,網路工具介紹了可以檢視“鏈路層 -> 網路層 -> 傳輸層 -> 應用層”資訊的工具。除此以外,其他命令中也列出了開發者經常會用到的一些命令,基本可以滿足日常開發需要。


目錄

Chapter 1 Chapter 2 Chapter 3 Chapter 4 Chapter 5
開發及除錯 檔案處理 效能分析 網路工具 其他
  • 開發及除錯

    • 編輯器:vim
    • 編譯器:gcc/g++
    • 除錯工具:gdb
    • 檢視依賴庫:ldd
    • 二進位制檔案分析:objdump
    • ELF檔案格式分析:readelf
    • 跟蹤程式中系統呼叫:strace
    • 跟蹤程式棧:pstack
    • 程式記憶體對映:pmap
  • 檔案處理

    • 檔案查詢:find
    • 文字搜尋:grep
    • 排序:sort
    • 轉換:tr
    • 按列切分文字:cut
    • 按列拼接文字:paste
    • 統計行和字元:wc
    • 文字替換:sed
    • 資料流處理:awk
  • 效能分析

    • 程式查詢:ps
    • 程式監控:top
    • 開啟檔案查詢:lsof
    • 記憶體使用量:free
    • 監控效能指標:sar
  • 網路工具

    • 網路卡配置:ifconfig
    • 檢視當前網路連線:netstat
    • 檢視路由表:route
    • 檢查網路連通性:ping
    • 轉發路徑:traceroute
    • 網路Debug分析:nc
    • 命令列抓包:tcpdump
    • 域名解析工具:dig
    • 網路請求:curl
  • 其他

    • 終止程式:kill
    • 修改檔案許可權:chmod
    • 建立連結:ln
    • 顯示檔案尾:tail
    • 版本控制:git
    • 設定別名:alias

內容

開發及除錯

開發工具大部分都提供了完善的功能,所以這裡不一一列舉用法。從技術層面來說,除錯工具比開發工具更考驗一個人的工程能力。

  1. 編輯器:vim

    • 伺服器端開發必知必會,功能強大,這裡不一一列舉,但基本的開啟檔案、儲存退出要會。
    • 詳見
  2. 編譯器:gcc/g++

    • C/C++編譯器,必知必會,除此以外需要了解預處理-> 編譯 -> 彙編 -> 連結等一系列流程。
    • 詳見
  3. 除錯工具:gdb

    • 伺服器端除錯必備。
    • 詳見
  4. 檢視依賴庫:ldd

    • 程式依賴庫查詢
    # ldd後接可執行檔案
    # 第一列為程式依賴什麼庫,第二列為系統提供的與程式需要的庫所對應的庫,第三列為庫載入的開始地址
    # 前兩列可以判斷系統提供的庫和需要的庫是否匹配,第三列可以知道當前庫在程式地址空間中對應的開始位置
    
    ldd a.out
  5. 二進位制檔案分析:objdump

    • 反彙編,需要理解組合語言
    • 詳見
  6. ELF檔案格式分析:readelf

    • 可以得到ELF檔案各段內容,分析連結、符號表等需要用到
    • 詳見
  7. 跟蹤程式中系統呼叫:strace

  8. 跟蹤程式棧:pstack

  9. 程式記憶體對映:pmap

    • 顯示程式記憶體對映
    # -x顯示擴充套件資訊,後接程式pid
    # Address: 記憶體開始地址
    # 顯示資訊:
        Kbytes: 佔用記憶體的位元組數
        RSS: 保留記憶體的位元組數
        Dirty: 髒頁的位元組數(包括共享和私有的)
        Mode: 記憶體的許可權:read、write、execute、shared、private
        Mapping: 佔用記憶體的檔案、或[anon](分配的記憶體)、或[stack](堆疊)
        Device: 裝置名 (major:minor)
    
    pmap -x 12345

檔案處理

Everything is file. 在Linux環境下,對文字處理相當頻繁,所以有些命令的引數還是需要記憶的。另外其他很多命令的輸出資訊都需要通過檔案處理命令來篩選有用資訊。

  1. 檔案查詢:find

    按名查詢:

    • 查詢具體檔案(一般方式)
    find . -name *.cpp
    • 查詢具體檔案(正則方式)
    # -regex為正則查詢,-iregex為忽略大小寫的正則查詢 
    
    find -regex ".*.cpp$"

    定製查詢:

    • 按型別查詢
    # f(file)為檔案,d(dictionary)為目錄,l(link)為連結
    
    find . -type f
    • 按時間查詢
    # atime為訪問時間,x天內加引數"-atime -x",超過x天加"-atime -x"
    # mtime為修改時間
    
    find . -type f -atime -7
    • 按大小查詢
    # -size後接檔案大小,單位可以為k(kb),m(MB),g(GB)
    
    find . -type f -size -1k
    • 按許可權查詢
    # -perm後接許可權
    
    find . -type -perm 644
  2. 文字搜尋:grep

    • 模式匹配
    # 匹配test.cpp檔案中含有"iostream"串的內容
    
    grep "iostream" test.cpp  
    • 多個模式匹配
    # 匹配test.cpp檔案中含有"iostream"和"using"串的內容
    
    grep -e "using" -e "iostream" test.cpp  
    • 輸出資訊
    # -n為列印匹配的行號;-i搜尋時忽略大小寫;-c統計包含文字次數
    
    grep -n "iostream" test.cpp  
  3. 排序:sort

    • 檔案內容行排序
    # 排序在記憶體進行,不改變檔案
    # -n(number)表示按數字排序,-d(dictionary)表示按字典序
    # -k N表示按各行第N列進行排序
    # -r(reverse)為逆序排序
    
    sort -n -k 1 test
  4. 轉換:tr

    • 字元替換
    # 轉換在記憶體進行,不改變檔案
    # 將開啟檔案中所有目標字元替換
    
    cat test | tr '1' '2'
    • 字元刪除
    # 轉換在記憶體進行,不改變檔案
    # -d刪除(delete)
    
    cat test | tr -d '1'
    • 字元壓縮
    # 轉換在記憶體進行,不改變檔案
    # -s位於後部
    
    cat test | tr ' ' -s
  5. 按列切分文字:cut

    • 擷取特定列
    # 擷取的記憶體進行,不改變檔案
    # -b(byte)以位元組為單位,-c(character)以字元為單位,-f以欄位為單位
    # 數字為具體列範圍
    
    cut -f 1,2 test
    • 指定界定符
    # 擷取的記憶體進行,不改變檔案
    # -d後接界定符
    
    cut -f 2 -d ',' new
  6. 按列拼接文字:paste

    • 按列拼接
    # 在記憶體中拼接,不改變檔案
    # 將兩個檔案按對應列拼接
    # 最後加上-d "x"會將x作為指定分隔符(paste test1 test2 -d ",")
    # 兩檔案列數可以不同 
    
    paste test1 test2
    • 指定界定符拼接
    # 在記憶體中拼接,不改變檔案
    # 按照-d之後給出的界定符拼接
    
    paste test1 test2 -d ","
  7. 統計行和字元:wc

    • 基本統計
    # -l統計行數(line),-w統計單詞數(word),-c統計字元數(character)
    
    wc -l test
  8. 文字替換:sed

    • 區別於上面的命令,sed是可以直接改變被編輯檔案內容的。
    • 詳見
  9. 資料流處理:awk

    • 區別於上面的命令,awk是可以直接改變被編輯檔案內容的。
    • 詳見

系統資訊

效能監視工具對於程式設計師的作用就像是聽診器對於醫生的作用一樣。系統資訊主要針對於伺服器效能較低時的排查工作,主要包括CPU資訊,檔案I/O和記憶體使用情況,通過程式為紐帶得到系統執行的瓶頸。

  1. 程式查詢:ps

    • 檢視正在執行程式
    # 常結合grep篩選資訊(e.g, ps -ef | grep xxx)
    
    ps -ef
    • 以完整格式顯示所有程式
    # 常結合grep篩選資訊
    
    ps -ajx
  2. 程式監控:top

    • 顯示實時程式資訊
    # 這是個大招,都不帶引數的,具體資訊通過grep篩選
    # 互動模式下鍵入M程式列表按記憶體使用大小降序排列,鍵入P程式列表按CPU使用大小降序排列
    # %id表示CPU空閒率,過低表示可能存在CPU存在瓶頸
    # %wa表示等待I/O的CPU時間百分比,過高則I/O存在瓶頸 > 用iostat進一步分析
    
    top
  3. 開啟檔案查詢:lsof

    • 檢視佔用某埠的程式
    # 最常見的就是mysql埠被佔用使用(lsof i:3307)
    # 周知埠(ftp:20/21, ssh:22, telnet:23, smtp:25, dns:53, http:80, pop3:110, https:443)
    
    lsof -i:53
    • 檢視某使用者開啟的檔案
    # -u(user)為使用者,後接使用者名稱
    
    lsof -u inx
    • 檢視指定程式開啟的檔案
    # -p(process)為程式,後接程式PID
    
    lsof -p 12345
    • 檢視指定目錄下被程式開啟的檔案
    # 這裡是"+d",需要注意,使用"+D"遞迴目錄
    
    lsof +d /test
  4. 記憶體使用量:free

    • 記憶體使用量
    # 可獲得記憶體及交換區的總量,已使用量,空閒量等資訊
    
    free
  5. 監控效能指標:sar

    監控CPU

    • 監控CPU負載
    # 加上-q可以檢視執行佇列中程式數,系統上程式大小,平均負載等
    # 這裡"1"表示取樣時間間隔是1秒,這裡"2"表示取樣次數為2
    
    sar -q 1 2
    • 監控CPU使用率
    # 可以顯示CPU使用情況
    # 引數意義同上
    
    sar -u 1 2

    監控記憶體

    • 查詢記憶體
    # 可以顯示記憶體使用情況
    # 引數意義同上 
    
    sar -r 1 2
    • 頁面交換查詢
    # 可以檢視是否發生大量頁面交換,吞吐率大幅下降時可用
    # 引數意義同上
    
    sar -W 1 2

網路工具

網路工具部分只介紹基本功能,引數部分一筆帶過。這部分重點不在於工具的使用而是對反饋的資料進行解讀,並且這部分命令功能的重合度還是比較高的。

  1. 網路卡配置(鏈路層):ifconfig

    • 顯示裝置資訊
    # 可以顯示已啟用的網路裝置資訊
    
    ifconfig
    • 啟動關閉指定網路卡
    # 前一個引數為具體網路卡,後一個為開關資訊
    # up為開啟,down為關閉
    
    ifconfig eth0 up
    • 配置IP地址
    # 前一個引數為具體網路卡,後一個為配置的IP地址
    
    ifconfig eth0 192.168.1.1
    • 設定最大傳輸單元
    前一個引數為具體網路卡,後面為MTU的大小
    # 設定鏈路層MTU值,通常為1500
    
    ifconfig eth0 mtu 1500
    • 啟用和關閉ARP協議
    # 開啟arp如下,若關閉則-arp
    
    ifconfig eth0 arp
    
  2. 檢視當前網路連線(鏈路層/網路層/傳輸層):netstat

    • 網路介面資訊
    # 顯示網路卡資訊,可結合ifconfig學習
    
    netstat -i
    • 列出埠
    # -a(all)表示所有埠,-t(tcp)表示所有使用中的TCP埠
    # -l(listening)表示正在監聽的埠
    
    netstat -at
    • 顯示埠統計資訊
    # -s(status)顯示各協議資訊
    # -加上-t(tcp)顯示tcp協議資訊,加上-u(udp)顯示udp協議資訊
    
    netstat -s
    • 顯示使用某協議的應用名
    # -p(progress)表示程式,可以顯示使用tcp/udp協議的應用的名稱
    
    netstat -pt
    • 查詢指定程式、埠
    # 互逆操作第一個顯示某程式使用的埠號,第二個顯示某埠號的使用程式
    # 第二個操作可以用lsof替代
    
    netstat -ap | grep ssh
    netstat -an | grep ':80'
  3. 檢視路由表(網路層IP協議):route

    • 檢視路由資訊
    # 得到路由表資訊,具體分析路由表工作需要網路知識
    # 可以通過netstat -r(route)得到同樣的路由表
    
    route
  4. 檢查網路連通性(網路層ICMP協議):ping

    • 檢查是否連通
    # 主要功能是檢測網路連通性
    # 可以額外得到網站的ip地址和連線最大/最小/平均耗時。
    
    ping baidu.com
  5. 轉發路徑(網路層ICMP協議):traceroute

    • 檔案包途徑的IP
    # 
    # 可以列印從沿途經過的路由器IP地址
    
    traceroute baidu.com
  6. 網路Debug分析(網路層/傳輸層):nc

    • 埠掃描
    # 黑客很喜歡
    # 掃描某伺服器埠使用情況
    # -v(view)顯示指令執行過程,-w(wait)設定超時時長
    # -z使用輸入輸出模式(只在埠掃描時使用)
    # 數字為掃描的埠範圍 
    
    nc -v -w 1 baidu.com  -z 75-1000
  7. 命令列抓包(網路層/傳輸層):tcpdump

    • 抓包利器,沒有什麼比資料更值得信賴。可以跟蹤整個傳輸過程。
    • 詳見
  8. 域名解析工具(應用層DNS協議):dig

    # 應用層,DNS
    # 列印域名解析結果
    # 列印域名解析過程中涉及的各級DNS伺服器地址
    
    dig baidu.com
  9. 網路請求(應用層):curl


其他

這裡都是日常開發中高頻命令。

  1. 終止程式:kill

    • 殺死具體程式
    # 加具體程式PID
    
    kill 12345
    • 殺死某程式相關程式
    # 加上"-9"殺死某程式相關程式
    
    kill -9 12345
  2. 修改檔案許可權:chmod

    • 更改檔案許可權
    # 可以對三種使用者設定許可權,u(user, owner),g(group),o(other)
    # 檔案可以有三種許可權,r(read),w(write),x(execute)
    # 這裡u+r表示檔案所有者在原有基礎上增加檔案讀取許可權
    # 這裡777分別對應,u=7,g=7,o=7,具體數字含義自行google
    
    chmod u+r file
    chmod 777 file
  3. 建立連結:ln

    • 建立硬連結
    # 檔案inode中連結數會增加,只有連結數減為0時檔案才真正被刪除
    
    ln file1 file2
    • 建立軟(符號連結)連結
    # -s(symbol)為符號連結,僅僅是引用路徑
    # 相比於硬連結最大特點是可以跨檔案系統
    # 類似於Windows建立快捷方式,實際檔案刪除則連結失效
    
    ln -s file1 file2
  4. 顯示檔案尾:tail

    • 檢視檔案尾部
    # -f引數可以不立即回傳結束訊號,當檔案有新寫入資料時會及時更新
    # 檢視日誌時常用
    
    tail -f test
  5. 版本控制:git

    • 版本控制最好用的軟體,沒有之一。至少要知道"git init","git add","git commit","git pull","git push"幾個命令。
    • 詳見
  6. 設定別名:alias

    • 常用命令新增別名
    # ".bashrc"檔案中配置常用命令別名,生效後在命令列只需要使用別名即可代替原先很長的命令
    
    alias rm='rm -i'

實戰

假設已經通過vim編輯,gcc編譯得到可執行檔案server,這時就可以使用一些開發者常用的工具來進行後期除錯。這裡都是給出最簡單的用法,意在快速掌握一些基本開發工具。

先clone這個專案,然後使用src_code下程式碼編譯通過後通過下面命令除錯。程式碼

  1. 單步除錯:gdb
  • 執行得不到正確結果可以通過gdb設定斷點來檢視每個中間變數值,以此來確定哪裡出了問題。因為gdb除錯內容較多,這裡不詳細說明。另外,gdb出了可以單步檢視變數值,還可以分析coredump檔案來排查錯誤。
  1. 動態庫依賴:ldd
  • 命令:ldd ./server

  • 可以檢視可執行檔案server所需的所有動態庫,動態庫所在目錄及其被對映到的虛擬地址空間。

  1. 效能分析:top
  • top可以檢視當前系統很多資訊,比如1,5,15分鐘內負載,執行、休眠、殭屍程式數,使用者、核心程式佔CPU百分比,儲存資訊等。top可以定位具體哪個程式CPU佔用率高和記憶體使用率高。我們可以以此定位效能問題出在什麼程式上(比如你後臺執行TKeed server之後,可以看到CPU佔用率為99%,這時候我們就需要從這個程式入手了)。
  1. 系統呼叫:strace
  • 命令:strace ./server

  • 上面已經提到TKeed server的CPU佔用率為99%,那麼問題通常一定是出在了死迴圈上。我們接下來在程式碼中找到死迴圈位置。因為程式中epoll_wait需要阻塞程式,我們懷疑是不是這裡沒有阻塞,這時就可以通過上面的方式執行server程式。此時可以列印出沒次系統呼叫及其引數等,我們也可以加-o filename將系統呼叫資訊儲存下來。

  1. 列印程式:ps
  • 命令:ps -ejH

  • 我們在命令列下開啟的程式的父程式是shell程式,之前用strace開啟server程式,strace也是server的父程式。我們有時候需要知道程式間的層級關係就需要列印程式樹,上面的ps命令可以做到。當出現殭屍程式時就可以通過程式樹定位具體是哪個程式出了問題。另外當想要知道程式pid時,ps -el | grep XXX也是很常用的。

  1. 開啟檔案:lsof
  • lsof -i:3000

  • 比如在執行server時發現埠被佔用了,可以通過lsof -i:port來檢視對應埠號正在被哪個程式所佔用。埠占用是非常常見的問題,比如3306被佔用我遇到過好幾次,要麼是某個程式正好佔用了要麼是之前沒能結束程式,這些都可以藉助lsof幫助檢視埠。

  1. 修改許可權:chmod
  • chmod 000 ./index.html

  • 可以修改檔案許可權,這裡設為000,這樣任何人都無法訪問,重新在瀏覽器請求127.0.0.1:3000/index.html就會因為檔案許可權不夠而無法展示,伺服器返回狀態碼為403,符合我們預期。修改許可權後再請求一次可得到狀態碼200。

  1. 網路卡資訊:ifconfig
  • ifconfig

  • 如果想看一下整個傳輸過程,可以使用tcpdump來抓包,但是抓包時引數需要加上網路卡資訊,這時候可以通過ifconfig來獲得網路卡資訊。

  1. 抓包分析:tcpdump
  • tcpdump -i eth0 port 3000

  • 可以用tcpdump來抓包分析三次握手及資料傳輸過程,-i之後加上上一步得到的網路卡地址,port可以指定監聽的埠號。

相關文章