雲容量是怎麼管理的

weixin_44370833發表於2019-01-31

幾十年來,容量管理一直用於優化組織內部資源。現在,隨著IT逐步轉向雲環境,這種方法正在被擴充套件,以便在同一個地方和同一時間實現所有資源(包括雲端計算和本地部署)的整體規劃、管理和優化。
對於現代數字企業而言,容量和成本管理對於確保足夠的資源和預算(無論是在本地部署還是在雲平臺中)來支援新的、現有的和不斷增長的業務服務至關重要。在雲遷移過程中,在遷移到雲平臺之前對資源進行適當的調整有助於防止過度配置、不必要的運營費用、雲蔓延、過度管理的複雜性。效能基準測試有助於確保雲端計算資源提供與本地資源相同或更好的效能。
容量管理繼續在本地資源中發揮關鍵作用。根據調研機構Gartner公司的調查,目前大約28%的伺服器容量,以及40%的儲存空間未被使用。隨著越來越多的應用程式遷移到公共雲,容量管理可以幫助企業瞭解可以停用哪些本地資源,以及如何在剩餘資源上最佳地重新載入本地工作負載。在雲端計算資源和內部部署資源中,容量管理通過幫助組織確定其在整個環境中注意到的容量級別(包括計算配置、儲存、資料庫和網路頻寬),以及提供這些資源的最具成本效益的方法,來通知預測和規劃。
以下將瞭解將容量管理擴充套件到雲端計算的含義:它需要什麼?它與傳統的內部部署容量管理有何不同?以及如何在關鍵用例中應用它?
雲端計算對容量管理意味著什麼
在雲端計算出現之前,容量管理在IT方面有著悠久的歷史。在大型機時代,容量管理絕對至關重要,而使用者必須提前訂購和熟悉大型機,需要確切瞭解確保效能和可用性所需的內容。否則,使用者將面臨資源最大化、資源短缺以及沒有足夠的多種資訊平臺(MIP)來支援需要執行的關鍵業務工作的風險。
隨著易於部署和價格更低的分散式伺服器和虛擬機器的興起,許多組織轉向效能管理方法,在這種方法中,效能問題被用來標記容量問題。當然,這也意味著接受效率低下的資源調配的高成本,因為虛擬機器在環境中的應用激增,工作人員並不瞭解每臺伺服器的容量或利用率。隨著時間的推移,資本支出日前膨脹,許多組織又採用了容量管理方法,無論是使用正式工具還是非正式的電子表格、註釋和近似值。
現在,雲端計算顯著提高了大多陣列織的IT環境的複雜性。根據ESG公司的調查,81%的組織採用了兩個或更多公共雲,51%的組織使用三個甚至更多。只有16%的組織只採用本地部署或單個公共雲環境。組織在更加複雜的環境中管理容量,並實現全面的整體可視性,以確保每個服務都具有所需的容量,這比以往任何時候都更具挑戰性,也更加重要。容量管理還支援明智的決策,即哪些應用程式、服務和工作負載最適合遷移到雲平臺上,以及正確的移動方式。組織瞭解其所擁有的、正在使用的以及為之付出的一切,使得管理成本和避免支出膨脹成為可能。
容量管理生命週期
步驟1:匯入資料
資料就是力量:如果沒有它,企業就無能為力。容量管理的關鍵第一步是為資源匯入效能、容量和配置以及業務KPI的度量標準,其中包括:物理設施/虛擬設施/雲端計算基礎設施、資料庫、儲存、網路、大資料和設施。
收集這些資料有多種方法,其中包括從實時監控工具、行業標準ETL提取、直接API整合中匯入資料。企業還需要確定要收集資料的頻率和精細度;大多陣列織通常採用每24小時收集的方法,而收集的資料越多,基礎資訊就越全面,從而通過複雜的分析提供更好的洞察力。這有助於企業做出更好的業務決策,並變得更加主動。
收集效能資料只是完全成熟的容量管理生命週期的一半。企業還需要業務服務模型,可能從某種發現解決方案填充到配置管理資料庫(CMDB)中。發現工具為組織提供其已知和未知資產的完整清單。通常,發現解決方案也可以對映應用程式。這樣可以深入瞭解哪些應用程式正在使用哪些基礎設施,以及某些相關應用程式是否需要接近以獲得更好的效能。目前的最佳實踐是,在構建分析、模型、報表和儀表板時,利用在配置管理資料庫(CMDB)中標識為配置項(CI)的標記作為篩選條件。
使用標記方法是獲取服務檢視的另一種方法,也是雲端計算服務提供商鼓勵使用的方法。利用良好的標記方法,組織可以建立滿足各種利益相關者需求的資料自定義檢視,同時需要了解內部部署和雲端計算資源使用情況以及成本。典型的標記包括按部門分類、資料關鍵性、遵從性、例項型別、叢集、使用者組等。標記可以在資源配置時應用,但隨著時間的推移,企業可能還需要使用容量管理應用程式定義和應用其他標記。
容量管理應用程式負責將IT和業務方面結合在一起。這將提升容量管理實踐,從簡單的孤立基礎設施容量管理升級到更成熟的服務級別功能,從而實現高階建模技術,例如對服務需求進行建模更改。
步驟2:分析資料
組織既然擁有了資料,那麼還需要了解資產,以瞭解實際情況。許多組織缺乏對其業務服務的可見性,因為他們的業務被組織成由多個監控工具管理的技術孤島,每個監控工具都有自己的使用者介面。利用在一個位置提取和組織此資料的解決方案至關重要。這將人們帶到第二步:資料分析。
利用率分析應該從以下幾個方面進行。
可見性:整個環境的可見性是容量管理過程的基礎。企業通過可見性來分析發現資料,深入瞭解其擁有的資產、資產配置以及資產所在位置。
基線:接下來,配置正常的利用率配置檔案和基線(此步驟需要機器學習)。企業需要了解一段時間內的使用模式,並確定其存在的週期性行為的型別及其原因。分析的時間越長,收集的資料越多,基線和分析的準確性就越高。持續的資料收集和分析是正確分析和基線的關鍵。隨著時間的推移,瞭解資源使用模式有助於組織確定確保一致效能所需的容量級別。
峰值分析:確定週期性行為和最繁忙的時期。瞭解工作負載何時發生變化對於高效使用至關重要,尤其是在雲平臺中,組織每天、每小時、每分鐘或每秒都在為資源付費。通過理解這些行為,組織可以在不浪費資源的情況下,對如何處理應用程式和資源應用程式做出更好、更明智的決策,以確保效能。
優化:尋找優化資源使用的機會。這可能涉及使計算配置適應工作負載的變化,例如新增記憶體或CPU。這就需要有效地實現自動化。人工操作通常已經過時,並且無法跟上現代企業的變化步伐。
步驟3:預測資料
組織通過了解當前擁有的內容以及如何使用資源,可以通過預測未來利用率以及潛在的容量限制或飽和度來更加主動地管理其環境。這些知識可以幫助組織防止服務降級,並防止潛在的中斷。預測還可以瞭解未來配置變化將如何影響當前和預計的效能,這是容量管理過程的另一個關鍵方面。
通過預測,組織可以預測未來配置更改對利用率水平的影響,並在影響效能之前標記預期飽和點。要主動識別儲存容量飽和度:確定儲存池何時可能用完容量、量化滿足分配要求所需的額外容量、以及驗證儲存系統中是否有足夠的未使用磁碟來擴充套件現有儲存池。這個過程可以避免購買不足的情況,並滿足當前和未來的儲存要求,從而可以防止停機。同時,精確的大小調整有助於避免過度購買和浪費儲存容量。
步驟4:使用資料進行規劃
既然組織瞭解了現有系統、應用程式和業務服務的預計有機增長,現在就可以開始實施第4個步驟,該步驟的重點是規劃新的專案、應用程式和業務服務。這通常被稱為需求管理或預留感知容量管理。在此步驟中,組織需要關注兩個問題:(1)有足夠的容量來完成這些新專案嗎?(2)這些新專案將如何影響當前執行的其他應用程式和業務服務?
容量管理資料可以輸入資源預留儀表板,以提供問題的答案,其中包括:
擁有什麼資源以及如何使用?
儲存什麼資源以及什麼時候儲存?
是否擁有現有資源或正在新增新資源?
可以釋放多少容量?
什麼時候回收資源,並將其新增回可用資源池?
預留儀表板提供每個服務所需資源的清晰可見性,何時需要這些資源以及是否已提交這些資源。
步驟5:預測變化和回收容量
容量管理實踐演進發展的下一步是預測服務需求變化對現有系統、應用程式和業務服務的影響。這通常被稱為業務服務級別的排隊網路建模,或IT基礎設施資源(計算和儲存)的優化。在此步驟中,容量管理器模擬特定業務場景所必需的系統更改。例如:模擬IT基礎設施變化對業務增長與計算響應時間和資源利用率約束的影響;模擬整合和虛擬化方案,以確定潛在變更將如何推遲或消除飽和度;模擬災難恢復方案或資源淘汰導致的服務影響,作為雲遷移計劃的一部分。
容量管理可以預測系統資源的未來行為,例如這些和其他許多場景,以及對業務關鍵績效指標(KPI)的影響。這有助於IT將業務需求與容量需求相關聯,並根據需要調整資源以支援它們。如果即將發生的事件可能會改變應用程式資源需求,組織可以相應地建模,例如,保險公司可能需要額外的資源來支援開放註冊期。而在每個學年開始時,大學需要更多資源來管理學生入學事務。零售商需要資源來支援大型促銷活動和產品釋出以及其他銷售活動。每個企業都有可顯著改變所選應用程式工作負載的事件。這些應用程式通常面向客戶,對業務至關重要,並使用跨多層和共享環境的資源進行交付。
容量管理者可以通過模擬服務需求變化以及為解決這些變化而進行的各種配置或容量修改的影響,確保足夠的容量來應對預期的激增。通過對這些服務需求變化的影響進行建模,可以估計飽和度和容量約束,以及瞭解減輕約束所需的配置和/或容量修改。並確切地知道需要做什麼以及何時需要這樣做以支援業務。
在此步驟中可以解決的其他問題包括:
組織還可以部署多少個其他虛擬機器?哪一個是分配它們的最佳叢集?
可用性區域是否接近飽和?如何提高虛擬主機的效率?
根據當前趨勢,哪種資源最受限制,最有可能影響組織的服務?
組織有多少備用容量?什麼時候會根據業務增長來飽和資源?
對於雲端計算資源,容量管理可以闡明以下內容:
組織是否需要購買更多虛擬機器,增加或減少當前使用的虛擬機器的大小,或更改型別?
組織是否需要增加或減少特定應用程式的儲存空間?
這些變化的成本是多少?遷移到不同的雲供應商的成本是否會更低?
步驟6:使用資料進行報告

在資料匯入、可視性、分析、預測、計劃和建模之後,容量管理成熟度的下一步是能夠自動生成可分發給利益相關者的報表和儀表板。這些利益相關者可以包括僅負責個別技術孤島、業務健康狀況,特定應用程式,以及以上所有方面的人員。因此,定期為每個利益相關者自動生成具有不同內容的各種報告和檢視非常重要。這還可以包括生成基於異常的報告或展示報告。
容量管理用例:原因和方式
1、管理雲端計算容量
防止雲端計算容量浪費是容量管理的關鍵目標,但同樣重要的是確保在雲端計算資源上執行的應用程式和服務具有足夠的容量。為了在確保客戶和業務使用者獲得良好體驗,同時最大限度地利用雲端計算開支,組織可以使用容量管理工具:
掃描當前的環境使用情況,以獲取可用於提高基於雲端計算的服務效能的配置更正。
確定可能的配置更正,以實現效能改進。
掃描雲端計算資源以獲得提高效率或效能的其他機會,例如識別未正確退役的資源或仍然可用但未使用的資源。
根據資料驅動的建議制定新政策;例如,調整大小、未使用或過度配置容量等。
2、將內部部署資源和應用程式遷移到雲平臺
在進行任何雲遷移計劃之前,組織需要了解如何配置本地基礎設施以及這些工作負載的使用模式,以便其可以就所需的雲端計算資源做出明智的決策,其中包括型別、大小和配置。例如:在將任何服務或應用程式移動到雲端之前,從高效資源利用的角度清理內部部署的使用情況是至關重要的,這樣組織就不會出現過度配置和超額支付的情況。許多內部部署應用程式並不是為了利用雲平臺中的現代技術而設計的。這可能導致資源效率低下或流程效率低下的服務,進而導致過度配置和高運營成本。當組織在遷移到雲端時看到使用情況如何變化時,可以檢視前後指標,以指導有關哪些內部部署資源退役的決策,同時還可以展望如何充分利用可用的雲端計算基礎設施。
3、成本優化與控制
有效的成本控制和優化使IT能夠為企業提供更高的投資回報,同時確保資金可用於創新。為此,組織可使用容量管理工具:監控指標,如每日總支出;每種資源型別(虛擬機器、資料庫、儲存等)的每日支出;每月迄今的支出、使用情況和計算每項服務的小時數;以及每月和每年的支出預測——這些資料可用於跟蹤預算支出,並確定支出的任何重大變化;對活動工作負載執行成本比較,以瞭解例項型別和平臺之間的成本差異;根據使用和支出閾值建立暫停或終止例項的策略。
4、將IT服務成本的能力與業務服務聯絡起來
以業務為中心的容量和利用率檢視可以幫助組織確保IT支出與業務優先順序保持一致。這個過程包括:根據為其提供支援的IT服務定義業務服務;通過IT服務瞭解內部部署和雲端計算容量;以及按業務服務跟蹤資源利用率和成本。
5、生成成本管理報告
為了優化支出,避免浪費,並使投資與不斷變化的需求和優先順序保持一致,重要的是要清楚地瞭解每項服務的真實成本。容量管理工具可以捕獲IT和業務線所需的資料,以根據各種技術選項的相對成本以及它們所支援的業務服務的相對盈利能力做出具有成本效益的決策。這將包括:將IT成本與應用程式,業務服務,部門或客戶相關聯;模擬基礎設施或成本模型變更對IT成本的影響;生成成本分解報告,與利益相關方共享,以幫助他們瞭解IT預算的使用情況;利用服務成本資料,根據內部團隊、業務部門、合作伙伴或外部客戶的資源利用率向他們收取費用,通過激勵員工和業務部門做出更加優化的決策和行為,重新獲得支出和/或推動組織變革。
結論
為了讓業務提供最大價值,IT部門需要在內部部署和雲端計算環境中實現資源容量、成本和利用率的最佳平衡。通過確保足夠的高質量服務交付能力,同時避免浪費,組織可以獲得最大的支出回報,同時避免停機和中斷。容量和成本管理的整體方法提供了保持業務最佳執行所需的可視性、洞察力和控制能力。

相關文章