Contents [hide] |
---|
監控方案調研過程
選擇監控方案:
1. 虛擬機器裡內建監控模組
測試collectd+rrdtool,獲取到比較好的監控效果,但是collectd生成的rrd檔案是以主機名作為監控儲存目錄的,如果在openstack中有2個以上的機器相同名字,儲存到ceph中將是一個問題。並且需要在主機中開啟該agent服務。可變因素過多(如使用者禁用該服務)。
2. 通過libvirt獲取虛擬機器資料監控。
a.測試openstack的自待元件ceilometer
使用過程中獲取到例項的cpu,磁碟讀寫,網路讀寫資料。但是沒有記憶體,磁碟空間資料。缺點一。在dashboard中實現後發先,請求超時嚴重,缺點二。
b. sina的kanyun
使用過程中獲取到資料不正確。cpu使用率,記憶體使用率均不正確。
c. 我們自己根據libvirt的api開發cpu使用率,記憶體使用率,磁碟空間,磁碟讀寫,網路出入。
工作量過大,還有風險是:對cpu使用率的計算公式,共存的使用率計算公式(檢視當前python的libvirt的api並沒有已使用記憶體介面,可能為libvirt版本問題)等都需要熟悉,對計算數值的驗證準確度都需要驗證.
d. 天成雲的監控方案
該方案為collectd+libvirt+rrdtool+cgp,該方案之前能監控虛擬機器的CPU使用率,網路出入,磁碟讀寫,負載。有良好的圖表呈現。