【FIW2022精彩回顧】五礦期貨基於超融合實現基礎架構整體雲化轉型的實踐

SmartX超融合發表於2022-11-14

9 月 21—23 日, 第一屆“金融現代化IT基礎架構轉型論壇(FinTech Infrastructure Wave 2022)”成功舉辦。該論壇由中國資訊通訊研究院雲端計算與大資料研究所、《中國金融電腦》雜誌社主辦,北京志凌海納科技有限公司(SmartX)與北京鯤鵬聯合創新中心協辦。論壇分為三大專場,覆蓋銀行、保險、證券、基金、期貨、信託六大金融細分行業,內容涵蓋多雲平臺建設、核心業務系統信創轉型、超融合關鍵場景落地、核心業務 K8s 改造、資料中心零信任安全、基礎設施即程式碼等前沿話題。


五礦期貨資訊科技部總經理朱大雙分享了基於超融合實現期貨公司基礎架構整體雲化轉型的實踐。


文丨五礦期貨資訊科技部總經理 朱大雙


一、IT 基礎架構轉型需求及發展歷程

1.轉型需求

期貨公司是“一行兩會”監管的金融機構,業務線條繁多,這就導致業務系統的需求也多,同時考慮到期貨行業的特殊性,需要更靈活、高效的 IT 架構。筆者認為,期貨公司的 IT 基礎架構轉型需求包括以下幾點。

一是系統能快速滿足資源發放和上線迭代的需求。

二是上線的所有系統不存在單點故障風險,能保證行情交易業務的連續性,資料可靠不丟失。

三是按照監管要求,經紀業務、資管業務、風險子公司業務、境外業務等需要做必要的業務隔離,這就要求系統之間能實現有效隔離,在此基礎上,還要降低所有系統的運維難度和整個系統的軟硬體投資成本。

四是要實現基礎架構的自主可控。


2.IT 基礎架構發展歷程

五礦期貨的 IT 基礎架構經歷了從傳統架構到 OpenStack,再到初始選型的某超融合產品,最後到 SmartX 超融合基礎架構的發展過程。在使用過程中,筆者總結了不同架構存在的問題。

傳統架構不僅需要購買儲存、配置伺服器和網路裝置,而且整個專案從立項、需求到採購,建設週期至少需要一個月時間。同時,基於傳統架構的系統裝置經過三五年後可能面臨淘汰、替換或更新的問題,而且擴充不方便,系統運維也相當複雜。

OpenStack 開源元件眾多,需要配備精通作業系統、網路、儲存的專業人士,操作管理不便;Ceph 儲存存在一些 I/O 問題,並且擴容極其不便。

初始選型的某超融合產品對硬體要求很嚴格,要完全匹配其硬體相容性列表。

SmartX 超融合產品具備彈性敏捷、簡單實用、穩定可靠的特性:可實現資源的快速發放和回收;CloudTower 介面簡單清爽,便於操作;穩定性和可靠性強,在使用過程中幾乎沒有出現任何重大事故及資料丟失的情況;同時,軟體和硬體沒有繫結,支援同一套叢集當中使用不同的硬體伺服器,在破壞測試中面對拔插硬碟、斷電、拔交換機等極端情況也有穩定的效能表現。

2018 年 2 月,五礦期貨上線第一套叢集,不久之後又在深圳建了辦公叢集,經過多次擴容,現有 8 個叢集,43 個節點,分佈在上海、大連、深圳、東莞等不同地方。這些叢集總的來說分為兩大類:生產叢集和辦公叢集。生產叢集根據業務系統要求,有的安裝了 Oracle RAC 資料庫叢集,有的安裝了做市策略系統。辦公叢集中上線了 OA,MAIL 等幾乎全部的辦公支撐類系統。


二、超融合基於不同場景的應用和使用模式

1.為機構通構建敏捷、可靠、隔離的資源池

超融合的使用場景之一是滿足多客戶機構通系統的需求。五礦期貨是中國五礦集團下屬的子公司,第一要務是服務集團主責主業,包括為集團內部的有色金屬、黑色金屬以及境內外期貨產品做套保,這就要求期貨公司為每一個不同的機構客戶提供一套獨立的包含行情、交易、結算的機構通系統。

如果按傳統方式構建機構通系統,從採購、儲存、伺服器到交換機的整個過程至少需要一個月時間。透過超融合平臺,用虛擬機器的方式提供服務,一套系統可能只需三天就完成資源的準備。同時,超融合支援在多個客戶之間批次快速部署上線,根據客戶要求進行隔離,使每套系統都相互獨立。基於超融合的快照備份功能,可以快速有效保護資料,當系統升級出現問題時,也可以透過快照恢復,快速回滾。


2.以較低成本快速搭建大資料預研平臺

五礦期貨基於超融合技術搭建私有云平臺,並在雲平臺上構建敏態大資料應用開發測試環境,可快速提供大資料平臺解決方案,大幅降低大資料類軟體的投入成本,也能有效促進大資料類應用的快速開發迭代,提升業務部門滿意度。如在儲存方面,透過英特爾傲騰記憶體技術提供的大記憶體,能很好滿足大資料對超大記憶體資源池的要求,在確保符合效能需求的情況下,有效降低了採購成本。

目前,五礦期貨已經開始在私有云平臺上進行 ClickHouse 叢集、Dolphin 叢集、CDH 叢集、Flink 叢集等大資料創新技術的預研或者測試。結合業務系統,該平臺已成為五礦期貨進行技術創新的一個很重要的工具。


3.滿足 DevOps 對資源池敏捷性的需求

期貨公司業務需求多,要求 IT 系統能“小步快跑”、敏捷開發和快速迭代。同時,不同的小團隊對應不同的需求,這就要求能有一整套統一的開發和測試環境,透過建立 DevOps 的體系來規範開發、應用的測試釋出流程。超融合基礎架構能快速滿足 DevOps 環境和測試資源池敏捷性的需求。


4.用分散式防火牆實現自主創新雲平臺的業務隔離

基於對 IT 系統自主可控的要求,五礦期貨透過採購滿足自主可控要求的伺服器以及交換機構建私有云平臺,並在雲平臺上部署了基於微分段技術的分散式防火牆。

分散式防火牆基於零信任模型,不依賴任何特定的硬體裝置,只需在管理頁面透過幾步簡單的操作就可制定一套完整的安全策略,並下放到雲平臺中。分散式防火牆有效解決了資料中心虛擬機器之間東西流量存在的安全隱患,併為雲平臺的業務提供了靈活細緻的安全保障,目前已經在測試使用中。


5.全國多叢集統一管理降低的運維難度

五礦期貨的 5 個資料中心共有 7 套叢集,包括 2 套辦公叢集和 5 套生產叢集,這些叢集透過分散式雲管平臺統一管理,叢集中的計算、儲存、網路資源統一排程,不必在不同的叢集中來回切換。透過雲管平臺,只需 2 名員工就可以完成 7 個叢集日常資源的申請、發放、回收及監控等工作,有效降低了運維工作量。


6.利用軟硬解耦實現異構硬體線上升級

超融合可以很好地利用軟硬解耦實現異構硬體線上升級。2018 年 2 月,五礦期貨上線第一套叢集,當時因為機房機櫃資源的問題,採購了超微的 2U 4 節點裝置完成初始的小規模叢集部署;2019 年,因小規模叢集資源不足,增加了 2 臺戴爾 R740,整個叢集擴大到 6 個節點,這時叢集中就有兩種不同的硬體配置,一個是超微四星子,一個是戴爾伺服器;2020 年,為了利舊,將剛好淘汰沒有過保的 R730 伺服器也加進叢集中,叢集擴大到 10 個節點;2021 年,超微的 2U 4 節點裝置維保過期,又將其替換成 4 臺戴爾 R740。在整個硬體升級過程中,超融合平臺能在一個叢集中同時支援不同品牌的硬體裝置,而且實現了整個替換擴容過程業務不停機,生產業務零感知。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69974533/viewspace-2923156/,如需轉載,請註明出處,否則將追究法律責任。

相關文章