制定混合雲中的HPC戰略,應該怎麼做?

HitTwice發表於2018-05-07

  如今,雲端計算幾乎已成為所有企業基本的IT基礎設施戰略。去年Gartner預測,基礎設施即服務(IaaS)的需求將增加36.8%。另外一家諮詢公司在2018年的雲調查顯示,95%的企業都制定了雲策略,其中51%採用混合雲策略。

  然而,儘管雲已經普遍存在,且HPC在雲中已經十多年——2008年Univa在AWS上委託了第一個HPC叢集——但企業一直不願將HPC工作負載放在雲端計算中。對於資料安全性和缺乏相應技術的擔憂,已經超過了降低管理成本和避免硬體所有權的好處。

  只有在過去的一年裡,我們才真正達到了一個臨界點。一項客戶調查顯示,2017年企業對HPC雲的興趣和使用量增加了10倍。隨著與雲端計算相關挑戰的減少,這些企業都看到了採用混合雲策略的經濟和商業性機會。在公有云中,他們可以在不影響CAPEX的情況下使用像Nvidia GPU這樣的專用硬體,也可以擴充套件計算量繁重的工作負載,如通常會影響其他叢集的TensorFlow機器學習模型。而且在混合模式下,他們還可以在不犧牲現有投資的情況下實現這些目標。

制定混合雲中的HPC戰略,應該怎麼做?

  混合雲已經成為HPC的重要競爭戰略。但是何從開始呢?

  混合雲戰略

  在HPC領域,大多數公司都開始利用雲來擴大現有資源。這樣做可以最大化當前的投資,並提供一種方法來簡化新的雲基礎架構模型。然而,這也有可能加劇現有複雜性。如果企業不能很好地瞭解他們現有的基礎設施是如何使用的,那麼就不可能知道雲服務的增加是否會給他們帶來真正需要的結果。因此,在引入新的雲資源之前,他們應該儘可能地合併筒倉式的封閉工作負載,並確保有合適的工具,可以讓自己看到使用模式和最佳化資源。

  如此一來,企業就可以將公有云資源引入他們現有的工作流程中。大多數公司開始這種過渡時只遷入一些少量工作負載,然後再有序進行增加。在開始時採用以下策略,並在增加公有云投資時對其進行微調,或許會幫助你實現無縫過渡:

  ·策略自動化對於混合雲環境和HPC來說是至關重要的。有HPC工作負載的公司很可能已經意識到了有正確的策略管理工具的好處,而且應該考慮制定一些能夠幫助他們最大化使用混合雲資源的策略。他們可以透過制定策略來提高吞吐量,這些策略可以自動地確定哪些工作負載在本地執行,而不是在雲中,也可以根據工作負載指標和歷史記錄來可靠地進行監視、響應和做出決策。例如,可以將一個策略設定為,向某個等待資源過久的任務分配一個雲例項,或者自動終止未使用的雲例項。

  ·雲爆發(一個應用部署模式,其應用執行在私有云或資料中心中,當計算能力的需求達到頂峰時突然進入公有云中。)可以用來調整公司的產能以適應需求,極大地加快計算速度,並從對其他叢集的影響中不斷要求HPC工作負載。組織應該注意將雲爆發功能繫結到工作負載管理層,而不是應用程式或基礎架構層。這讓HPC雲管理軟體根據公司更廣泛的基礎設施的需求來決定何時提供伺服器例項、階段資料和拆除資源。當能夠有效地使用時,雲爆發將使硬體預算決策具有靈活性,同時幫助組織以更快的速度前進。

  ·終端使用者應該能夠使用他們已經知道且信任的方法與雲基礎設施進行互動。如果一個組織在採用雲端計算時突然改變了他們的流水線和提交方法,他們不可避免地會出現錯誤和延遲。相反,他們應該保留現有的工作流和與之相關的排程器,無論它們是簡單的步驟,如“qsub”提交單個任務——還是像環境設定一樣複雜的流程,觀察工作狀態、資料移動,或者是一個從任務到任務的序列。

  ·最後,要帶上你自己的映像。使用相同的機器映像有助於使應用程式在本地和基於雲的節點之間移植。公司應該使用他們自己的雲供應軟體定製映像,而不是用每個供應商特有的VM映像。

制定混合雲中的HPC戰略,應該怎麼做?

  HPC擁抱混合雲

  混合雲是公有云服務提供商和HPC使用者的勝利,而我們還只是處於這個巨大改變的開始。HPC往往有數百萬臺伺服器,每年有數十億的計算時間。隨著公司將這些工作負載轉移到雲上,它們將影響公有云服務的質量和IaaS市場的現狀。公有云提供商提供的安全性、GPU和機器學習服務將繼續改進,吸引越來越多的企業使用者,並鞏固混合雲中的HPC架構。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31473948/viewspace-2154056/,如需轉載,請註明出處,否則將追究法律責任。

相關文章