【恩墨學院】IT基礎架構變革在路上:青海移動的去“IE”之旅

恩墨學院發表於2018-02-01



IT基礎架構變更在路上青海移動的去“IE”之旅


1

近兩年一場由網際網路企業掀起的x86化浪潮已呈蔓延之勢,迅速波及到傳統行業。在網際網路時代,這是一個必然結果,因為降低成本,並以低成本實現對客戶需求的快速敏捷響應和極致使用者體驗,是加速業務創新、提高企業核心競爭力的重要手段。本著提升管理效率,降低交易成本的目的,IT最佳化是節約計劃中不可或缺的因素。

2

另一方面,傳統的小型機和集中式儲存的架構越來越不適應當前業務需要IT快速響應的要求。基礎架構雲化是簡化IT架構、降低IT系統建設和運維成本、實現業務需求敏捷響應的必由之路。在可預見的將來,絕大部分中小企業的IT系統會選擇部署在諸如阿里雲、亞馬遜AWS等公有云上,而傳統的大型企業如金融保險、運營商等會將IT系統執行在私有云上。

3

然而,IT系統的雲化意味著對底層架構的改造,這將是一個漫長的過程。如何規劃好技術路線,如何紮實地走出第一步,非常關鍵,也是一個不容易決策的過程。

4

青海移動由於地理位置原因,IT人才相對匱乏。對於傳統集中式架構越來越不適應當前需求以及較高的運維成本,他們有更深刻的體會,對改造IT基礎架構的願望也更為迫切。基於這些原因,青海移動啟動了IT基礎架構的變革路線,並在今年6月份邁出了關鍵一步。以下是這次專案的具體情況,以及在此基礎上如何進一步去實現IT基礎架構的跨越變革。希望透過這個案例,能夠給類似的企業提供一個參考。




下定決心去“IE”

青海移動剛剛實現了將統計庫從原來小型機和EMC儲存遷移到了基於分散式儲存的Oracle資料庫上,這個專案的成功對他們而言意義重大。青海移動的大部分系統都是執行在小型機和集中式儲存上。小型機和傳統的磁碟陣列在硬體可靠性上比較佔優勢,但隨著技術的發展特別是叢集技術和軟體方法的改進以及資源池化概念的再次提出,x86平臺在應用軟體風險的規避和分散上已經有了長足的進步。


雖然青海移動此前也利用過虛擬化技術建設了x86平臺雲資源池,但主要是用來執行一些應用軟體,並沒有在其上承載生產系統的資料庫。在現代軟體技術的運用下,應用軟體系統幾乎都是模組化的、非中心化的部署,硬體基本不會影響應用軟體的執行。但是作為IT系統核心的資料庫,是屬於絕對中心化的部分。如果資料庫或資料出現問題,將會嚴重影響生產的執行。


在此之前,青海移動對於x86伺服器執行資料庫幾乎沒有經驗,將Oracle資料庫遷移到x86伺服器上,如何保障系統的長期可靠、穩定執行?青海移動有著非常大的顧慮。在此種情況下,青海移動決定選擇與國內資料庫服務商雲和恩墨合作,正式啟動遷移專案。從專案開始到正式遷移歷經了半年時間,並在今年5月實現了統計庫從傳統架構遷移到x86分散式儲存平臺。到目前為止,系統執行非常穩定。可以說,青海移動成功地完成了Oracle資料庫去“I(BM)E(MC)”的第一步。


效能、成本、運維:去 "IE" 給青海移動帶來積極效果

在青海移動看來,這次成功的去“IE”專案,實現了以下兩個目標:


1. 成本的大量降低。原來的小型機已經超期服役,磁碟陣列的儲存容量也已經不能滿足需求,需要更換小型機和進行儲存擴容。而使用新的架構,其成本大幅低於原有架構。從長期的運維來看,TCO成本還會更低。

2. 效能的大幅提升。遷移後,系統的各個業務模組的效能普遍都得到提升,不少業務效能甚至獲得了十倍以上的提升 。


比較重要的是,透過一個多月的實際感受,業務人員反映系統變得更快、更流暢了,並希望將其他系統也遷移到新的環境中。業務部門的正面反饋和積極配合,對於推動青海移動IT基礎架構的真正變革將起到非常重要的作用。據瞭解,青海移動已經著手將結算系統遷移到新的基於分散式儲存架構的x86平臺上,並與原來的統計庫實現整合,從而達到減少Oracle資料庫分割管理數量的目的。而這正是業界針對“去IOE”口號的另一種聲音,即“去IE減O”的實際踐行。


青海移動前景規劃

以下青海移動專案負責人對未來的一些規劃,以及如何付諸實現,表明了其對IT基礎架構改造的決心和信心:


1. 將邊緣系統遷移到x86平臺上,從0開始構造新的基礎架構,並實現去“IE”方案的驗證和經驗積累。

2. 逐步將周邊系統遷移到新的架構上,在此過程中實現資料庫整合,實現“減O”方案的驗證和經驗積累。

3. 將一些重要系統遷移到新的架構上,最終形成資料庫雲平臺的架構模式。


在前期專案成功的基礎上,青海移動透過構建分散式儲存架構上的資料庫,實現更多系統的Oracle資料庫整合遷移。如此一來,實現資料庫私有云架構模式的探索就呈現出平穩但快速推進的態勢。對於運營商而言,這樣的方式無疑是見效最顯著卻又最安全的方式。


對於運維,新的架構模式下又會出現哪些變化呢?針對這個問題,青海移動業務支撐中心IT基礎架構和運維的負責人表示,新的平臺確實跟以住有很大的不同,現在都是開放式的標準化軟硬體,在新平臺上擴容為結算庫的整合作準備時,不用再請專業的儲存工程師來做,只需要走集中採購,購買標準的硬碟、PC伺服器,接到分散式儲存的網路上,安裝分散式儲存軟體,透過簡單的命令就實現了儲存的擴容。因為都是標準化的開放式的裝置:PC伺服器、SAS硬碟、SSD硬碟,任何一個搞IT的技術人員都能很快熟悉這些裝置並進行維護,不再需要像以前那樣訂購專門的硬體,並在故障時刻等待專門的主機和大型儲存裝置工程師到場維護,這對於運維的要求、運維的成本,都得到了大幅降低,而且運維響應度又得到了提升。甚至不再需要像以往那樣,要做長期的容量規劃,因為新的分散式儲存架構下,儲存容量和計算能力都可以做到即插即用。原來的容量規劃,要麼資源閒置,造成成本浪費;要麼資源不足,系統能力受到影響。


採用全新儲存架構

青海移動在這次專案中嘗試了一套全新的分散式儲存架構架構 - zData,雲和恩墨西區負責人熊軍深入瞭解了zData的技術架構情況並展示瞭如下的體系架構圖例。




熊軍介紹,雲和恩墨的分散式儲存架構zData是整合了標準化x86伺服器、40/56Gb Infiniband高速網路、快閃記憶體卡、SAS盤、SSD盤和分散式儲存軟體形成的超融合解決方案。


該方案透過靈活的軟體解決方案建立虛擬SAN,大幅降低了成本和複雜性,基於PCIe的快閃記憶體儲存提供了極高的效能和超低延遲等優點來加快資料庫的整體效能。透過方便靈活地搭配不同儲存介質,能夠以較低的成本應對以下這些應用場景:


1. 使用少量的SSD盤和快閃記憶體卡,加上大容量低成本的SAS硬碟和SATA硬碟,滿足如資料倉儲這樣的大資料量、密集IO的系統。單個資料庫節點高達每秒12GB的吞吐,可以輕鬆應對100TB級別的資料倉儲。

2. 使用全快閃記憶體卡和SSD盤,滿足對高併發、低延時OLTP類系統的需求。單個資料庫節點超過100萬IOPS,單個IO延時在0.6毫秒以下足以滿足交易型系統極端效能要求。

3. SSD盤、快閃記憶體卡和SAS硬碟分層設計應用,形成不同IO需求的應用,應對資料庫整合的混合IO要求。


面對去IE專案的成功實踐,青海移動負責人表示:“IT基礎架構的簡化,讓我們不用花太多精力在單個裝置、單個系統上,而是讓我們的精力可以更多聚焦在業務需求上,甚至實現IT驅動業務的目標。這就是IT基礎架構變革帶來的好處,青海移動也將繼續在這條變革之路上探索、前行。”


加入"雲和恩墨大講堂"微信群,參與討

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28530558/viewspace-2150751/,如需轉載,請註明出處,否則將追究法律責任。

相關文章