據@淘叔度 4月13日微博:Tsar(Taobao System Activity Reporter)是淘寶開發的一個非常好用的系統監控工具,在淘寶內部大量使用。它不僅可以監控CPU、IO、記憶體、TCP等系統狀態,也可以監控Apache,Nginx/Tengine,Squid等伺服器狀態。
Tsar介紹
Tsar是淘寶的一個用來收集伺服器系統和應用資訊的採集報告工具,如收集伺服器的系統資訊(cpu,mem等),以及應用資料(nginx、swift等),收集到的資料儲存在伺服器磁碟上,可以隨時查詢歷史資訊,也可以將資料傳送到nagios報警。
Tsar能夠比較方便地增加模組,只需要按照 tsar 的要求編寫資料的採集函式和展現函式,就可以把自定義的模組加入到tsar中。
安裝
Tsar目前託管在github上,下載編譯安裝步驟:
1 2 3 4 |
$git clone git://github.com/kongjian/tsar.git $cd tsar $make $make install |
安裝後:
定時任務配置:/etc/cron.d/tsar
,負責每分鐘呼叫tsar執行採集任務;
日誌檔案輪轉配置:/etc/logrotate.d/tsar
,每個月會把tsar的本地儲存進行輪轉;
Tsar配置檔案路徑:/etc/tsar/tsar.conf
,tsar的採集模組和輸出的具體配置;
模組路徑:/usr/local/tsar/modules
,各個模組的動態庫so檔案;
Tsar配置
Tsar剛安裝完,還沒有歷史資料,想要check是否正常,執行tsar -l,檢視是否有實時資訊輸出:
1 2 3 4 5 |
[kongjian@v132172.sqa.cm4 tsar]$ tsar -l -i 1 Time ---cpu-- ---mem-- ---tcp-- -----traffic---- --xvda-- -xvda1-- -xvda2-- -xvda3-- -xvda4-- -xvda5-- ---load- Time util util retran pktin pktout util util util util util util load1 11/04/13-14:09:10 0.20 11.57 0.00 9.00 2.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 11/04/13-14:09:11 0.20 11.57 0.00 4.00 2.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 |
Tsar的配置主要都在/etc/tsar/tsar.conf
中,常用的有:
- 增加一個模組,新增
mod_<yourmodname> on
到配置檔案中 - 開啟或者關閉一個模組,修改
mod_<yourmodname> on/off
output_stdio_mod
能夠配置執行tsar時的輸出模組output_file_path
採集到的資料預設儲存到的檔案(如果修改的話需要對應修改輪轉的配置/etc/logrotate.d/tsar
)output_interface
指定tsar的資料輸出目的,預設file儲存本地,nagios/db輸出到監控中心/資料庫中,這兩個功能還需要結合其它配置,具體見後面
Tsar使用
- 檢視歷史資料,tsar
- -l/–list 檢視可用的模組列表
- -l/–live 檢視實時資料,tsar -l –cpu
- -i/–interval 指定間隔,歷史,tsar -i 1 –cpu
- –modname 指定模組,tsar –cpu
- -s/–spec 指定欄位,tsar –cpu -s sys,util
- -d/–date 指定日期,YYYYMMDD或者n代表n天前
- -C/–check 檢視最後一次的採集資料
- -d/–detail 能夠指定檢視主要欄位還是模組的所有欄位
- -h/–help 幫助功能
高階功能
- 輸出到nagios
配置: 首先配置output_interface file,nagios
,增加nagios輸出
然後配置nagios伺服器和埠,以及傳送的間隔時間
1 2 3 4 5 6 |
####The IP address or the host running the NSCA daemon server_addr nagios.server.com ####The port on which the daemon is running - default is 5667 server_port 8086 ####The cycle of send alert to nagios cycle_time 300 |
由於是nagios的被動監控模式,需要制定nsca的位置和配置檔案位置
1 2 3 |
####nsca client program send_nsca_cmd /usr/bin/send_nsca send_nsca_conf /home/a/conf/amon/send_nsca.conf |
接下來制定哪些模組和欄位需要進行監控,一共四個閥值對應nagios中的不同報警級別
1 2 3 |
####tsar mod alert config file ####threshold [hostname.]servicename.key;w-min;w-max;c-min;cmax; threshold cpu.util;50;60;70;80; |
- 輸出到mysql
配置: 首先配置output_interface file,db
,增加db輸出
然後配置哪些模組資料需要輸出
1 |
output_db_mod mod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udpmod_io |
然後配置sql語句傳送的目的地址和埠
1 |
output_db_addr console2:56677 |
目的地址在該埠監聽tcp資料,並且把資料入庫即可,可以參照tsar2db:https://github.com/kongjian/tsar2db
模組開發
Tsar的一個比較好的功能是能夠增加自己的採集,這時候需要編寫模組程式碼,編譯成so檔案即可。
首先安裝tsardevel,剛才安裝時,如果執行make tsardevel
,就會把模組開發的基本檔案安裝到系統 然後執行tsardevel ,就能在當前模組生成一個模組目錄:
1 2 3 4 5 6 |
[kongjian@v132172.sqa.cm4 tsar]$ tsardevel test build:make install:make install uninstall:make uninstall [kongjian@v132172.sqa.cm4 tsar]$ ls test Makefile mod_test.c mod_test.conf |
按照要求修改mod_test.c中的read_test_stats,set_test_record 完成後make;make install就完成新模組的配置檔案和so的設定,執行tsar –test就能檢視效果
另外也可以通過配置檔案對自定義模組傳遞引數,方法是 修改配置檔案中的mod_test on myparameter
然後在mod_test.c中的read_test_stats函式中,通過parameter引數就可以獲得剛才配置檔案中的內容。
TSAR 原始碼地址:https://github.com/alibaba/tsar
TSAR 專案主頁:http://tsar.taobao.org/
如果有關於tsar的問題,可以聯絡諮詢tsar現在的開發同學 @淘空見。