信創如何為業務帶來價值?| 趨勢觀點

帶你聊技術發表於2022-12-26


【摘要】信創的定義是“資訊科技應用創新”,如果不能創新,則自主可控難以有持續的投入來維持。要做好信創,需要從埋頭於“自主可控”中抽出一部分精力,思考如何從信創中獲取價值。

【作者】一隻紅松鼠


提到信創,大家第一反應就是自主可控。不過信創的定義卻是“資訊科技應用創新”,因為如果不能創新,不能為業務帶來價值,自主可控是難以有持續的投入來維持的,自主可控本質是為了加速新生態的成熟速度,是為創新服務。因此要做好信創,需要從埋頭於自主可控中抽出一部分精力,思考如何從信創中獲取價值。

本文是對自己出於省錢、提升效能,支撐業務發展等目的的IT改造替換經驗以及對產業界類似活動的觀察分析,得出的信創如何為業務帶來價值的思考,希望對朋友們的工作有所幫助。

為業務帶來價值的標準

在開始分析前,先定義一下怎樣才算為業務帶來價值,這是我總結的兩種情況:

  • 在獲得與原有方案架構相同能力的情況下,如相同的業務支撐能力(效能,可用性,安全性等),付出的硬體、軟體改造和開發、運維和使用(如機房租賃,電費或雲服務費)綜合成本更低。

  • 突破原有能力極限,能更好支撐業務,且投入產出比能支援業務運轉。

按這個定義,雖然有些替代工作能成功支撐業務,比如資料庫,由於需要大量的硬體來補齊效能和可靠性的差距,或者應用改造和運維的成本有比較大上升,暫時還不能算為業務帶來價值。

接下來首先看看技術替代的成功案例,再分析一下技術替換在什麼情況下能為業務帶來價值,最後轉回使用者視角,分析一下如何做能夠讓信創更好地為業務服務。

國內外技術替代獲得商業成功的案例

全快閃記憶體陣列的彎道超車

AFA(All-Flash Array)或SSA(Solid-state Arrays)曾經是 Gartner關注的創新技術,AFA不僅是把儲存介質換成SSD,而是根據SSD相對機械盤不需要機械尋道、擦寫更快的特性,以新快取配置與演算法、控制器配置來充分發揮SSD介質效能,並透過SSD介質的特性最佳化快照原理、重刪壓縮能力,因此與為了一種新架構。現在全快閃記憶體陣列已經成為企業儲存的主流並於2018年從 Gartner技術成熟度曲線中“畢業”。

在這場技術迭代中,老牌儲存廠商試圖在原有機械盤陣列上不重構架構直接支援SSD盤,無法充分發揮SSD介質的優勢,在創新上力不從心,最終只能靠收購維持江湖地位,而Pure Storage則靠AFA殺出重圍,成功躋身儲存領先廠商。有意思的是,AWS作為雲廠商,也收購了全快閃記憶體廠商E8 Storage,之後推出的“首個雲上SAN儲存”IO2 Express頗有企業儲存的味道。

AFA以技術創新重塑了產業,而它的成功說明客戶認可了架構替代對業務的價值。

ARM從移動端到超算,到雲再到桌面

20年初,我曾經寫了 國產化將帶來創新的新機遇 一文。到今天AWS基於ARM架構研發的CPU Graviton已歷經三代,阿里也推出了自研的倚天CPU並大規模商用。蘋果則將桌面系統轉向自研的ARM CPU,而Windows開始向ARM發力則可能徹底改變個人PC X86的主流格局。

ARM的算力與X86架構相比並沒有優勢。但在單體應用的算力需求過剩的時代,ARM CPU可以滿足大量應用的需求,同時眾核(併發效能)、低功耗在很多場合還有優勢。從超算到雲再到桌面,ARM在與Intel的競爭中獲得了市場認可,已經逐漸站穩腳跟。

應用層X86化和海外銀行業大型機替換

看過廠商視角,再回到使用者視角。2008年我在某運營商深度用X86刀鋒伺服器替換Web業務使用的IBM小型機,結果超出預期。首先因為擔心刀片機效能不行所以用了12片刀片替換了4個P595分割槽,但割接上線後CPU的負載只有20%,大大緩解了系統壓力。而無論是採購成本,還是機房佔地與耗電,刀片機都遠低於小型機。至於代價幾乎沒有,因為應用不需要改造,只是改了改負載均衡的配置。自此之後,X86伺服器替換小型機就成了自發而非任務性的工作,幾年時間,除了中介軟體CICS沒有X86版本外,全部前端業務和大量後端應用換成了X86伺服器,不但領導高興,運維也高興,因為手頭寬裕能買更多機器,支撐業務就更輕鬆些。

如今IBM的日子過得不好,並不是中國的原因,大型機替換在國外金融業這一IBM的糧倉也在進行,只不過速度相對中國慢些而已,這與替換的綜合收益分不開。

輪子本是洋人造,拿來主義為我用

對比一下會發現,信創的根技術與國外的替代技術路徑是一致的,比如算力方面的ARM和AMD64,儲存方面的AFA和分散式儲存,網路方面的ROCE,NvME Over ROCE/TCP。雖然遺憾我們還未實現根技術創新超越,但證明我們並沒有因自主可控的壓力閉門造車,這就為實現創造業務價值最關鍵的:實現同等能力替代創造了有利條件。

技術替換怎樣才能帶來價值

這些成功的“信創”有一些共同點,正是它們能為業務帶來價值的原因:

主要能力差距不大,能部分/全部一對一替換

要做到為業務帶來價值的第一條綜合成本更底,需要信創產品的主要能力與被替代者比較接近,這樣就不會為關鍵能力的補齊而耗費大量成本,同時新產品的成本優勢能真正發揮。

2015年我負責運營商B域(主要負責計費和為受理客戶業務)的IT規劃和系統整合時,客戶採購了一批華為的高階儲存。因為這是華為儲存在運營商核心業務的首次使用,誰都沒有使用經驗,不清楚在這麼重要的系統中應該怎麼配置儲存。於是剛測試就發現效能有問題,後來發現是多路徑配置問題,華為按之前的業務經驗,沒有為每條路徑連線所有的控制器,後來又調整了LUN的條帶配置,上線後效能和現網使用的EMC、HDS儲存沒什麼差別。還有如發現華為的儲存不支援命令列進行容災和Clone操作,於是寫了個指令碼直接向控制器發指令湊合了。此外還發現一些功能看上去有,但用習慣了EMC等廠家的我們和華為對功能的理解和操作方法有很大的不一致,不過最終都找到了規避的方法。之後幾年,可靠性沒有出問題,也就是效能和長期穩定性過關,就不必為此付出太多成本,替換難度不大,成本則有明顯的下降。

目前替換中最困難的資料庫則相反。15年就已實現的國產儲存去E,可以做到一對一替換效能可靠性不降,但到今天如果用分散式資料庫做去IOE,硬體需求需要幾倍甚至十幾倍增長來彌補可靠性和效能的差距,應用改造和後期維護成本也高,代價巨大。

前文提到的用X86刀鋒伺服器替換與也類似,在第一批替換時,還特意選擇了電信系統使用的可靠性較高的伺服器。雖然新採購的伺服器可靠性有所下降,但透過負載均衡整體的可靠性仍能保證。而這兩次替換還反映出成功替換中的另一個特點:

儘量減少應用改造

以AFA替換原有儲存,不但不需要應用改造,反而可能因為效能的提升避免了原計劃中的資料庫拆分等應用改造,並使業務體驗得到改善。在Web應用替換為86伺服器時,雖然節點增加了,但由於應用接近無狀態,可以很容易基於原有的負載均衡架構進行Scale Out擴充套件,因此也不需要應用改造。

類似的情況還有很多,比如用NAS替換伺服器搭建的NFS,用SSD高效能NAS替換GPFS,都不涉及應用改造。由於很多替代是核心業務,光改造的風險就會使替換變得異常困難,而且真正有重構核心業務架構改造能力的並不多。

架構和工具彌補能力缺失

除了一對一能力足夠強的替換外,像X86替換前端應用就利用了負載均衡來補齊可靠性和單機擴充套件性(小機分割槽可以加CPU/記憶體)的短板。成功的架構或工具的特點是,要麼是把原來大/中/小型機中具備的能力補回來,要麼是用在IOE架構中也能起到最佳化作用。

比如大/中/小型機中支援將一臺物理裝置分割成若干邏輯裝置的能力,被虛擬化和容器補齊了。另一些技術則解決了替換後的能力短板:快取技術彌補了資料庫能力的不足,容器編排排程提高了應對業務壓力的能力、加快了問題響應速度、簡化了安裝部署釋出和運維操作,呼叫鏈技術提高了故障定位效率等。這些技術在單體產品能力較弱時,可以彌補短板,等單體產品能力提升上來,仍然可以用來增強系統的能力,甚至在信創前就有應用了。不過這類最佳化往往不能帶來質變,比較典型的資料庫,阿里去IOE,淘寶的資料庫普遍替換為MySQL。但17年後,阿里研發了PolarDB資料庫IOE從架構的層面又回來了,與分庫分表結合成雲原生資料庫:

信創如何為業務帶來價值?| 趨勢觀點

分庫分表和雲原生資料庫的結合

不管是PolarDB,還是它的“老師”AWS Aurora都是希望“達到商業資料庫的效能和可靠性,回到一對一替換的路子上去。

新架構顛覆舊格局

真正能形成質變的新架構比如大資料、AI。從架構上,它們更容易透過分散式架構來實現,從業務角度看,大量業務是新業務,替換難度小,就不展開討論了。

中國製造打破壟斷溢價

這段純粹用來增加自豪感:-D

IOE貴,有合理的技術領先溢價,這部分換成任何廠商都少不了,因為技術溢價能換來支撐能力的提升和綜合成本的下降,是合理的。但IOE的貴更多是壟斷溢價,壟斷越強溢價越高,最明顯的是大型機,其次是資料庫。其實海外高技術產品都存在類似的問題,曾經一臺電信裝置上的擋風板不過是一個鐵片就要幾萬塊。

但當中國產品達到能替換,尤其是一對一替換這些海外高科技產品時,擋風板就不要錢了,高鐵跑遍中國,造船份額世界第一……使用者獲得的產品更好了,而成本卻更低了,讓高技術為更多人提供了服務。

回顧高鐵、光伏的發展過程,信創更像一個大號的產業扶植政策,最終目的還是實現世界領先。

信創中使用者可以如何做

如果是IT產品的使用者,在信創中希望降低難度,或者也想參與其中貢獻自己的智慧,我認為可以考慮以下幾方面:

減少應用改造

除非你在一家偉大的企業,能投入巨量資源進行業務改造並且能持續,否則最好的策略就是不改造應用。不過不改造應用不等於不創新,更不是落後的表現,需要改變思路。

  • 優先一對一替換

通常我們在做替換時,都會把能實現一對一替換作為首選方案。不過信創的特殊性可能使我們專注於架構路線之類的爭議中而忽略了這一基本原則。一個資料庫,一臺儲存,裡面是什麼架構並不是最重要的,最重要的是能跑得動業務。從去IOE到學IOE阿里是最務實的。看看最近公有云廠商的動向,已經有了走大型機路子的苗頭。如果我們真從學IOE再到成為IOE,到哪天中國能造大型機了,為什麼不用呢?

找到和驗證能實現一對一替換的技術路線,是最實惠的創新。

  • 在使用新架構時減少應用改造

有一個誤區就是新架構要用”新技術“。比如雲端計算一定要用分散式架構,容器一定要用分散式儲存……但實際上虛擬化,容器甚至分散式都是在小/大型機時代就出現的技術,甚至分散式、虛擬化也是大型機、高階磁碟陣列、Oracle RAC技術的“根”技術。公有云走大型機的老路也是創新。

如果跳出架構的束縛,很多問題就很好解決。比如小規模的虛擬化系統,使用磁碟陣列可能比分散式儲存還便宜,易維護,可靠性高。再看看我印象最深的則是過載應用的容器化:

容器的編排排程能力可以很方便進行應用任務排程,因此對過載的批處理業務很有價值。然而像運營商的話單處理業務使用的是大量小檔案共享檔案系統,容器“原生”的共享檔案儲存比如Ceph、GlusterFS效能差得太遠,可靠性也不盡人意。不過如果跳出架構優選的框框,把GPFS當成容器宿主機的本地目錄,一樣能實現話單處理的容器化。後來隨著GPFS被國產快閃記憶體NAS(非分散式儲存)替代,容器儲存信創就完成了。如果跳過GPFS那一段,那麼容器化改造的過程應用沒有做什麼改造。如果再調整一下儲存介面,用CSI實現動態分配就又實現了新的創新。

當遇到新架構的問題時,不妨用“老產品”嘗試解決,可能會收到意想不到的效果。

將經驗賦能廠商,促進能力提升

回顧下15年做儲存替換的例子,基本上所有的功能華為都有,因為EMC的功能都是公開的,相當於EMC告訴華為儲存要做什麼,但EMC並不會告訴華為為什麼要做,做了幹什麼,自然華為就不一定知道怎樣做使用者才能用得更好,所以國產廠商的產品從可用到好用的過程中,吸收使用者的意見和經驗非常重要。

中國企業的研發主力在國內,交流更方便,同時一些領先廠商已經和行業客戶建立了聯合創新甚至是聯合研發機制,一些開源社群和產業聯盟也起到了傳遞使用者經驗和創意的作用。如果有這方面的條件,可以考慮透過上述渠道與廠商一起推進產品能力提升,自己則能更早受益。

重點關注可持續使用的架構和工具

2017年我們曾經想在核心業務中進行分庫分表改造,不過打算使用Oracle資料庫。這個在當時看來“不正確”的思路,今天卻和AWS、阿里的雲原生資料庫思路很接近。對一些對業務有明確價值的架構改進,比如快取、分庫、容器化,可以在現有系統中就進行嘗試,這樣無論是對現有業務還是對未來的遷移都是有價值的。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024922/viewspace-2929469/,如需轉載,請註明出處,否則將追究法律責任。

相關文章