基於KVM的H3C雲端計算平臺CAS的一些運維經驗
前言
在寫本文時,CAS版本為3.0 (E0306H23),虛擬機器作業系統主要以CentOS Linux 7.2.1511Minimal為主,有少部分Windows Server 2008 R2(包括標準版和企業版)、Windows Server 2003(包括標準版和企業版)、CentOS7.3、CentOS7.4、CentOS6.X。
一、資源調整
(一)CPU
1.虛擬機器在執行時,CPU的核數是不能進行調整的,只能調整CPU的個數。並且,個數只能增加不能減少。大部分虛擬機器支援CPU個數熱新增,有少部分虛擬增加CPU資源之後機需要重啟。CentOS7.2-1511系統CPU資源線上新增之後立即生效。
2.CPU核心總數=CPU個數*每個CPU的核心數,CAS的CPU核心數是指每個CPU的核心數。
3.CAS平臺的CPU是可以超額分配的。一般情況下,不需要繫結物理CPU。
(二)記憶體
1.在修改記憶體時我們會看到:“若虛擬機器處於執行或者暫停狀態,修改記憶體預留後,必須重啟虛擬機器才能生效,且修改後的記憶體值必須大於原記憶體大小”。實際在操作過程中是這樣的,對於線上的虛擬機器,增加虛擬機器記憶體後是實時生效的,不能線上減少記憶體。如需減少記憶體資源配置,那就需要關閉虛擬機器修改數值之後,再次啟動。
2.虛擬機器一般情況下記憶體不設預留值。
3.CAS的記憶體不能超配。如果CAS系統開啟了系統預留記憶體,那麼就必須保證至少剩餘宿主機總記憶體的10%左右的預留值。主機記憶體預留值不足的情況下虛擬機器是無法正常啟動的,遇到緊急情況,可以暫時關閉CAS系統的主機記憶體預留,一小段時間後,啟動虛擬機器之後再開啟主機記憶體預留。
(三)磁碟
1.關於磁碟的修改,系統提示:若虛擬機器處於執行或者暫停狀態,修改快取方式、儲存大小(對於支援Virtio磁碟線上擴容的虛擬機器作業系統,Virtio磁碟線上擴容後無需重啟虛擬機器)、限制I/O速率(讀/寫)、限制IOPS(讀/寫)後,必須重啟虛擬機器才能生效 。由於新建虛擬機器時一般都採用高速智慧硬碟,因此是可以線上增加磁碟容量,無需重啟系統的。
2.磁碟容量只能增加,不能減少,每次操作的時候需要謹慎考慮,不要過分浪費資源。
3.對於一些P2V、V2V遷移過來的虛擬機器,有些硬碟介面需要特別考慮。
4.在CAS平臺增加磁碟資源後,需要回到虛擬機器作業系統對新分配的磁碟資源進行分割槽、掛載、LVM操作。目前一般使用LVM對磁碟進行管理,如遇特殊情況還需特別處理。
(四)網路
1.虛擬機器建立時就要注意選擇正確的虛擬交換機、網路策略模板。
2.一些特殊的網路卡裝置,還需對應型號進行設定。
3.如果是克隆過來的虛擬機器,那麼需要特別注意MAC地址。MAC地址出現衝突時,關閉虛擬機器,更新MAC地址後再次啟動虛擬機器作業系統,系統啟動後檢查其他網路配置。其他網路配置無誤,網路依然不通,則需要找出多餘的網路卡網路配置,刪除或者更新配置檔案內容,偶爾還需要手動更新MAC地址。此部分可以使用NetworkManager來進行操作。
4.雖然NetworkManager已經廠商設定開機啟動,但是該工具並不能正常開機啟動,使用NetworkManager時,必須先啟動再使用。這一部分最常用的的命令為:mntui,網路配置、主機名修改等都非常有用。
二、運維要點
1、如果CVM進行過更改,那麼更改完成之後第一件最重要的事是要檢查CVM上的NTP服務,檢視配置檔案,時鐘源配置是否正確,同步是否正常。CVM的DNS也是必須配置的專案,配置完成以後務必檢查是否生效。CVM的狀態、NTP服務、CVM的DNS解析是日常重點監控的物件,需要格外注意!
2.把CAS的CVM設定成主NTP。
3.虛擬機器建立完成後,第一件事是解除安裝虛擬機器自帶的NTP軟體,CentOS7.2無需操作,CentOS7.4自帶了chrony的NTP服務軟體,需要解除安裝,解除安裝完成安裝CAStools後開啟時間同步。由於CentOS7.3是奇數版本,日常較少使用,此處需要綜合CentOS7.2和CentOS7.4進行考慮。Windows系統同樣,關閉NTP同步,安裝CAStools,開啟時間同步。
4.對於新安裝的CVK主機,安裝完之後第一件事是對系統進行升級,必須保持版本與CVM一致,升級完畢之後才能將CVK主機增加到CAS平臺被CVM管理。
5.為了降低物理主機當機、重啟造成的影響,需要在虛擬機器上設定“主機啟動後,自動啟動虛擬機器”,具體操作步驟為:修改虛擬機器->更多->引導裝置-自動啟動-是。
6.CVK、CVM的安裝過程中,需要主要的是,磁碟分割槽選擇整塊硬碟LVM管理,以便後期擴充套件磁碟空間。
7.CAS平臺的虛擬機器遷移不支援無中斷業務遷移模式,線上遷移會造成虛擬機器狀態暫停,遷移完成之後部分服務可能需要重啟。遷移都會造成業務中斷,需要特別注意。但是可以採取克隆、切換業務的方式來減低業務中斷帶來的風險,需要具體情況具體分析。
8.CentOS7.4自帶了firewalld防火牆,並且廠商預置狀態為開機自動啟動,很多時候埠不通的原因就來源於此,日常運維中注意即可。
9.Windows Server 2008 R2標準版增加記憶體需要關閉主機。常規的在虛擬機器作業系統內關機的方式並未結束CVK上的相關虛擬機器的程式,需要使用系統的關機選單進行關機之後,修改記憶體重啟,這樣,新增的記憶體才能被系統正常使用。具體流程為:關閉(CAS主控制皮膚)->修改記憶體->啟動虛擬機器,企業版則不需要如此操作,增加後直接生效。
10.CVM配置檔案的備份。這是一個很重要的操作,原則上每週至少備份一次,並且需要注意保持異機備份。每次版本升級之前必須進行備份,並且將備份檔案儲存到CAS系統以外的儲存上。養成每次版本升級後系統確認無誤後第一時間備份配置檔案的習慣。
11.在虛擬機器遷移之前需要在目標主機配置好虛擬交換機網路配置。如果使用網路卡聚合功能,則需要提前在對應的網路卡上進行相關的網路配置操作。
三、總結
1.本文是在本人運維H3C的CAS平臺半年以後總結出來的經驗,本著對自己或讀者負責的態度,在寫作本文時又進行了再次驗證,但疏漏之處無法避免,希望諸位發現問題後第一時間告知本人,本人會在第一時間內完成驗證並更正。
2.由於截圖太浪費時間,本文無截圖,敬請諒解。因為我是這樣覺得的:能點進此文來的朋友應該都比較熟悉CAS雲端計算平臺,很多地方只需點到為止即可,希望也給讀者朋友帶來思考質疑的空間,這樣利於大家一起進步。
3.由於時間倉促,暫且寫到此處,以後發現新內容再次更新。能力有限,疏漏之處,萬望指出,感謝!
相關文章
- 雲端計算:拼的就是運維!運維
- 關於雲端計算運維管理要點的知識分享運維
- 如何做好雲端計算的運維工作?運維
- 雲端計算平臺的設計原則
- 怎麼學習雲端計算?雲端計算運維和傳統運維有何區別?運維
- 雲端計算和運維工程師衝突嗎?運維崗需要雲端計算知識嗎?運維工程師
- 1+x雲端計算平臺運維開發初級實操題集合運維
- 雲端計算基礎學習,雲端計算的八大運用分析
- 【雲端計算】從事雲端計算運維可以考取哪些證書?運維
- 雲端計算運維-SRE基礎篇之安裝VMware運維
- 能否利用Hadoop搭建完整的雲端計算平臺Hadoop
- 雲端計算裡的家校互聯平臺
- 雲知聲 Atlas 超算平臺: 基於 Fluid + Alluxio 的計算加速實踐UIUX
- 雲無關、桌面端、基於Kubernetes的平臺Otomi
- 做運維要懂雲端計算嗎?Linux運維學習運維Linux
- 基於 SAP BTP 平臺的 AI 專案經驗分享AI
- 雲端計算運維工程師怎麼樣?學習雲端計算前景如何?運維工程師
- 學習Linux雲端計算運維有啥好的方法?Linux運維
- 北鯤雲超算平臺——致力於提高科研效率,降低計算成本的雲超算平臺
- 北鯤雲超算平臺如何將雲端計算與高效能運算結合
- 第二週-雲端計算運維作業運維
- 第五週-雲端計算運維作業運維
- 第十週-雲端計算運維作業運維
- 端雲協同,打造更易用的AI計算平臺AI
- 雲端計算和雲服務是一樣的嗎?計算機linux運維開發計算機Linux運維
- 高薪崗位雲端計算面試題,雲端計算運維工程師必備高薪面試題運維工程師
- Linux運維對雲端計算有影響嗎?雲端計算需求怎麼樣?Linux運維
- 如何做好企業IT運維工作?雲端計算運維的工作內容有哪些?運維
- 微軟Windows Azure雲端計算平臺微軟Windows
- 如何從零開始學習Linux雲端計算的運維?Linux運維
- Netflix開源Mantis:基於微服務的運維監控平臺微服務運維
- 雲端計算管理平臺之OpenStack計算服務nova
- 雲端計算運維學習---ssh遠端管理服務運維
- 深圳雲端計算培訓學習:雲端計算正在殺死運維嗎?–【千鋒】運維
- 深圳雲端計算培訓學習:女生做雲端計算運維容易嗎?–【千鋒】運維
- 第四周-雲端計算運維作業運維
- 第十一週-雲端計算運維作業運維
- 雲端計算成為趨勢,北鯤雲超算平臺佈局雲端計算市場?