基於KVM的H3C雲端計算平臺CAS的一些運維經驗

耕耘實錄發表於2018-05-15

前言

在寫本文時,CAS版本為3.0 (E0306H23),虛擬機器作業系統主要以CentOS Linux 7.2.1511Minimal為主,有少部分Windows Server 2008 R2(包括標準版和企業版)、Windows Server 2003(包括標準版和企業版)、CentOS7.3、CentOS7.4、CentOS6.X。

一、資源調整

(一)CPU

1.虛擬機器在執行時,CPU的核數是不能進行調整的,只能調整CPU的個數。並且,個數只能增加不能減少。大部分虛擬機器支援CPU個數熱新增,有少部分虛擬增加CPU資源之後機需要重啟。CentOS7.2-1511系統CPU資源線上新增之後立即生效。

2.CPU核心總數=CPU個數*每個CPU的核心數,CAS的CPU核心數是指每個CPU的核心數。

3.CAS平臺的CPU是可以超額分配的。一般情況下,不需要繫結物理CPU。

(二)記憶體

1.在修改記憶體時我們會看到:“若虛擬機器處於執行或者暫停狀態,修改記憶體預留後,必須重啟虛擬機器才能生效,且修改後的記憶體值必須大於原記憶體大小”。實際在操作過程中是這樣的,對於線上的虛擬機器,增加虛擬機器記憶體後是實時生效的,不能線上減少記憶體。如需減少記憶體資源配置,那就需要關閉虛擬機器修改數值之後,再次啟動。

2.虛擬機器一般情況下記憶體不設預留值。

3.CAS的記憶體不能超配。如果CAS系統開啟了系統預留記憶體,那麼就必須保證至少剩餘宿主機總記憶體的10%左右的預留值。主機記憶體預留值不足的情況下虛擬機器是無法正常啟動的,遇到緊急情況,可以暫時關閉CAS系統的主機記憶體預留,一小段時間後,啟動虛擬機器之後再開啟主機記憶體預留。

(三)磁碟

1.關於磁碟的修改,系統提示:若虛擬機器處於執行或者暫停狀態,修改快取方式、儲存大小(對於支援Virtio磁碟線上擴容的虛擬機器作業系統,Virtio磁碟線上擴容後無需重啟虛擬機器)、限制I/O速率(讀/寫)、限制IOPS(讀/寫)後,必須重啟虛擬機器才能生效 。由於新建虛擬機器時一般都採用高速智慧硬碟,因此是可以線上增加磁碟容量,無需重啟系統的。

2.磁碟容量只能增加,不能減少,每次操作的時候需要謹慎考慮,不要過分浪費資源。

3.對於一些P2V、V2V遷移過來的虛擬機器,有些硬碟介面需要特別考慮。

4.在CAS平臺增加磁碟資源後,需要回到虛擬機器作業系統對新分配的磁碟資源進行分割槽、掛載、LVM操作。目前一般使用LVM對磁碟進行管理,如遇特殊情況還需特別處理。

(四)網路

1.虛擬機器建立時就要注意選擇正確的虛擬交換機、網路策略模板。

2.一些特殊的網路卡裝置,還需對應型號進行設定。

3.如果是克隆過來的虛擬機器,那麼需要特別注意MAC地址。MAC地址出現衝突時,關閉虛擬機器,更新MAC地址後再次啟動虛擬機器作業系統,系統啟動後檢查其他網路配置。其他網路配置無誤,網路依然不通,則需要找出多餘的網路卡網路配置,刪除或者更新配置檔案內容,偶爾還需要手動更新MAC地址。此部分可以使用NetworkManager來進行操作。

4.雖然NetworkManager已經廠商設定開機啟動,但是該工具並不能正常開機啟動,使用NetworkManager時,必須先啟動再使用。這一部分最常用的的命令為:mntui,網路配置、主機名修改等都非常有用。

二、運維要點

1、如果CVM進行過更改,那麼更改完成之後第一件最重要的事是要檢查CVM上的NTP服務,檢視配置檔案,時鐘源配置是否正確,同步是否正常。CVM的DNS也是必須配置的專案,配置完成以後務必檢查是否生效。CVM的狀態、NTP服務、CVM的DNS解析是日常重點監控的物件,需要格外注意!

2.把CAS的CVM設定成主NTP。

3.虛擬機器建立完成後,第一件事是解除安裝虛擬機器自帶的NTP軟體,CentOS7.2無需操作,CentOS7.4自帶了chrony的NTP服務軟體,需要解除安裝,解除安裝完成安裝CAStools後開啟時間同步。由於CentOS7.3是奇數版本,日常較少使用,此處需要綜合CentOS7.2和CentOS7.4進行考慮。Windows系統同樣,關閉NTP同步,安裝CAStools,開啟時間同步。

4.對於新安裝的CVK主機,安裝完之後第一件事是對系統進行升級,必須保持版本與CVM一致,升級完畢之後才能將CVK主機增加到CAS平臺被CVM管理。

5.為了降低物理主機當機、重啟造成的影響,需要在虛擬機器上設定“主機啟動後,自動啟動虛擬機器”,具體操作步驟為:修改虛擬機器->更多->引導裝置-自動啟動-是。

6.CVK、CVM的安裝過程中,需要主要的是,磁碟分割槽選擇整塊硬碟LVM管理,以便後期擴充套件磁碟空間。

7.CAS平臺的虛擬機器遷移不支援無中斷業務遷移模式,線上遷移會造成虛擬機器狀態暫停,遷移完成之後部分服務可能需要重啟。遷移都會造成業務中斷,需要特別注意。但是可以採取克隆、切換業務的方式來減低業務中斷帶來的風險,需要具體情況具體分析。

8.CentOS7.4自帶了firewalld防火牆,並且廠商預置狀態為開機自動啟動,很多時候埠不通的原因就來源於此,日常運維中注意即可。

9.Windows Server 2008 R2標準版增加記憶體需要關閉主機。常規的在虛擬機器作業系統內關機的方式並未結束CVK上的相關虛擬機器的程式,需要使用系統的關機選單進行關機之後,修改記憶體重啟,這樣,新增的記憶體才能被系統正常使用。具體流程為:關閉(CAS主控制皮膚)->修改記憶體->啟動虛擬機器,企業版則不需要如此操作,增加後直接生效。

10.CVM配置檔案的備份。這是一個很重要的操作,原則上每週至少備份一次,並且需要注意保持異機備份。每次版本升級之前必須進行備份,並且將備份檔案儲存到CAS系統以外的儲存上。養成每次版本升級後系統確認無誤後第一時間備份配置檔案的習慣。

11.在虛擬機器遷移之前需要在目標主機配置好虛擬交換機網路配置。如果使用網路卡聚合功能,則需要提前在對應的網路卡上進行相關的網路配置操作。

三、總結

1.本文是在本人運維H3C的CAS平臺半年以後總結出來的經驗,本著對自己或讀者負責的態度,在寫作本文時又進行了再次驗證,但疏漏之處無法避免,希望諸位發現問題後第一時間告知本人,本人會在第一時間內完成驗證並更正。

2.由於截圖太浪費時間,本文無截圖,敬請諒解。因為我是這樣覺得的:能點進此文來的朋友應該都比較熟悉CAS雲端計算平臺,很多地方只需點到為止即可,希望也給讀者朋友帶來思考質疑的空間,這樣利於大家一起進步。

3.由於時間倉促,暫且寫到此處,以後發現新內容再次更新。能力有限,疏漏之處,萬望指出,感謝!


相關文章