銀行專家分享:生產關鍵系統儲存建設落地實踐
【作者】晝者,某省農信資深技術經理,經濟學博士,高階經濟師,銀行從業17年,在全行數字化轉型變革中,參與了科技發展規劃、組織架構調整、管理流程設計和重大專案建設,為業務與科技的融合之路,進行了有益的探索。帶領團隊獲得了10項發明專利和7項軟體著作權,2項作為第一發明人,多次獲得監管部門科技獎項。
引言
關鍵系統儲存架構設計階段,應重點關注儲存型別、容量、組網及高可用容災等關鍵點。在投產實施及運維管理階段,需關注現網調研、實施視窗、資料遷移、回退方案、投產跟蹤和常態化演練機制、日常運維機制、智慧運維工具和健全運維生態等重點方面。
一、銀行業關鍵系統對儲存的需求場景及功能特點
一般來說,銀行業按照應用系統重要等級可以分為核心、重要、外圍及管理、資料分析等類別,其中核心及重要類系統通常稱為“關鍵系統”。根據關鍵系統處理事物的特性,可以分為OLTP(聯機事務處理過程)和OLAP(聯機分析處理)等類別。聯機事物處理方式、資料量大小、系統重要程度等差異均會對關鍵系統儲存架構提出不同的需求。
二、關鍵系統儲存架構的設計原則及關鍵點
1. 關鍵系統儲存架構設計的原則
儲存架構的設計既要滿足未來業務發展需要,技術發展趨勢,也要在總體技術風險可控的前提下,對現有架構進行平滑升級,解決當前架構瓶頸。關鍵系統所用儲存架構的建設總體原則應根據不同應用對儲存效能和容災的訴求進行儲存選型。按應用的業務重要性及對RPO、RTO不同要求,重新規劃應用主機和儲存對應關係,對應不同級別容災方案。
需要注意的是,沒有最好的儲存技術,只有最適合的儲存解決方案。因此,在儲存架構方案設計時,需從行內實際情況出發,對標行業最佳實踐,充分利用廠商資源,做好技術的延續性、做好架構、產品、效能、維護和費用之間的有效平衡。
2. 關鍵系統儲存架構設計的關鍵點
2.1 儲存型別
按照關鍵系統類別及特性選擇集中式或分散式儲存,可根據關鍵系統重要性、需求特點及價效比選擇全閃、混閃及傳統機械盤儲存。
2.2 儲存配置及容量
儲存的單機配置決定著儲存架構的整體效能。通常在儲存架構規劃時採用“高階低配”(高階機型、中低配置)策略進行儲存選型,在保障技術先進、效能強大的同時,降低維護期因儲存技術落後、效能不足而帶來的最佳化和擴容等風險較大操作的頻率,同時高階機型也能夠得到原廠商更大售後服務支援。所替換的老舊儲存可用於開發測試或外圍類系統使用,保護既有投資。
容量規劃方面,根據現網儲存容量、歷史增長率以及未來增長率等指標來綜合評估。以儲存池為單位,根據當前容量大小,將近3年最大年增長率作為未來5年年均增長率進行估算,在此基礎上再預留20%-30%可用容量。
2.3 儲存及應用組網
在滿足技術先進性的前提下,保障技術選型穩定性和高可用性,確儲存儲網路架構穩健、保障業務系統效能。在實施過程中以資料完整性為核心保障體系,按計劃完成容災方案為目標,儘量減少業務系統影響,降低對業務系統的影響。
根據裝置情況,從需求、容量、效能、可用性和管理性幾個方面詳細設計,重點考慮儲存池類別、吞吐負載、關聯耦合性,尤其需要提前規劃交換機埠分配規則、Zone分配規則、跨資料中心級聯設計。
2.4 高可用及容災
儲存架構是全行容災方案的重要基礎。儲存架構方案的設計需要根據全行整體容災建設思路,結合儲存特性和業務特點統籌規劃,以確保滿足監管及全行所需RTO及RPO指標。在實際制定儲存規劃方案中,有以下方面需重點關注。
一是儲存3DC架構的建設思路。儲存3DC架構已是各大儲存產品的標準功能架構,也是各行業容災方案中均採用的成熟儲存容災解決方案。但在實際使用中,需根據各行現網容災架構、資料中心間距離、空間、頻寬質量、人員分佈等因素綜合考慮。
一般來說,儲存3DC架構在物理地點設定上有兩種方案,一是本地、同城和異地各一臺儲存,三者間形成3DC容災架構(價效比較高、容災整體架構較為靈活);二是本地(2臺雙活)和同城(1臺)組成容災架構(維護難度較小,可以最大程度應對本地主中心儲存故障),架構圖示例見圖一。
二是各資料中心承載容災功能的選擇。在金融監管部門要求及傳統銀行容災方案中,主中心、同城中心及異地中心根據所承載的容災功能情況,可以分為“大同城、小異地”和“小同城、大異地”。以“大同城、小異地”為例,“大同城”指以雙活模式構建兩個同城資料中心,透過部署必要的軟硬體裝置,逐步實現既能兩個中心共同承擔業務,又能單箇中心獨立承載全部業務。“小異地”指建立異地災備資料中心,在發生區域性災難時,保障金融機構關鍵業務的持續運營。
三是儲存網路組網。最佳化煙囪式架構,FC SAN網路採用core-edge架構,透過分層實現計算、儲存資源池化,更利於向雲化演進。儲存池間資料互聯互通,應用共享所有儲存資源。SAN及應用組網架構圖示例見圖二。
四是高可用及容災方案的選擇。容災體系規劃應該從業務視角為出發點,以終為始的制定各類業務系統RTO和RPO,找準各容災技術定位,透過各容災技術組合做好備份冗餘,按照業務類別和技術特性搭好容災技術體系框架,做好容災技術頂層設計。
圖一:同城3DC儲存容災架構圖
三、關鍵系統儲存投產實施及運維管理
1. 關鍵系統儲存投產實施的關鍵點
1.1 現網調研
對現網架構的伺服器多路徑、儲存相容性、資料量、網路頻寬、可用視窗、影響範圍等進行詳細調研。針對現網應用系統及基礎架構等差異,科學制定投產的方式、批次等投產實施方案。
1.2 實施視窗
由於遷移變更內容多,操作複雜,關鍵系統磁碟較多、操作時間較長,導致整個操作時間視窗有可能超出正常維護視窗時間。可以透過科學制定Runbook、操作指導書、操作命令、非影響業務的情況下提前開展、分階段分批實施等措施,科學規劃操作時間視窗。一般可根據各應用系統的業務邏輯、實施視窗、資料儲存和儲存類別等耦合程度,在實施風險可控前提下,規劃實施階段和批次。
1.3 資料遷移
資料遷移是儲存新架構投產的關鍵步驟。在儲存資料遷移中需重點關注資料一致性、業務完備性和系統相容性。科學安排資料遷移策略,靈活使用資料遷移工具,透過遷移演練等多種措施,儘量減少停機視窗和停機對客戶服務體驗的影響。
由於資料遷移適用場景較多,業界積累了較為全面的資料遷移步驟,我行與儲存廠商結合業界實踐經驗,將儲存資料遷移工作進一步完善,總結為4個階段,17個實施步驟。詳見圖三。
在實踐中,儲存資料遷移的物件、層級、場景和工具較多,具體參見表一。表二中以華為儲存為例,列舉了儲存常用資料遷移工具。
1.4 回退方案
回退方案作為投產實施方案中的關鍵環節,必須確保投產出現風險時,完善的回退應急預案,保障回退期間業務不受影響。需提前準備並演練不同投產場景的主要回退步驟,將回退所需時間加入到投產計劃視窗之中。下表以華為儲存為例,列出了不同遷移場景的主要回退步驟。
回退場景 | 回退主要步驟 |
儲存遷移回退 | 1、在華為儲存上刪除SmartMigration任務。 2、對映源儲存的Lun給主機,主機上掃盤,切換IO路徑到源儲存磁碟路徑。 3、刪除華為儲存和主機間的對映。 4、在華為儲存上刪除eDevLUN。 5、主機上刪除華為儲存對應的磁碟路徑。 6、刪除源儲存到華為儲存的對映。 7、主機上掃盤,並檢查路徑是否正常。 |
卷遷移回退 | 1、對映源儲存Lun到主機。 2、主機掃盤,並新增源儲存PV到VG。 3、建立mirrorvg,同步資料從華為儲存到源儲存。 4、同步完成後,刪除mirror,並從VG中刪除華為儲存的PV。 5、系統中刪除華為儲存PV,然後系統掃盤。 6、檢查業務,確保業務執行正常 |
虛擬化平臺遷移回退 | 1、虛擬化平臺會自動執行回退. 2、檢查VM、系統和裝置的執行狀態,確保業務執行正常 |
表三:儲存遷移回退場景及主要步驟
1.5 投產跟蹤
2.1 常態化演練機制
表四:常態化應急演練計劃(示例)
2.2 日常運維機制
1年24份 | ||||||
資訊收集包 | 1年12份 | |||||
1年12份 |
2.3 智慧運維工具
2.4 健全運維生態
關鍵系統儲存作為銀行機構的關鍵裝置,在提升行內技術人員能力的同時,還需建立“原廠+三方”、“一線+後臺”、“交付+研發”的立體式、全天候的支撐服務體系。
五、結語
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024922/viewspace-2927678/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 銀行業生產系統儲存資料遷移方法及實踐行業
- 中小銀行資料倉儲建設 | 最佳實踐
- 商業銀行押品管理系統建設探索和實踐
- 系統設計實踐(02)- 文字儲存服務
- 貝殼_程式設計實踐_銀行系統程式設計
- 中原銀行 AI 平臺建設實踐AI
- 大型系統儲存層遷移實踐
- HarmonyOS Next中關鍵資產儲存操作實戰指南
- 案例分享:製造業網管系統建設最佳實踐
- 銀行容器雲平臺建設的關鍵設計 | 資料
- 大型銀行組裝式應用在數字生態基座落地實踐
- 分散式系統中資料儲存方案實踐分散式
- 基於Ceph物件儲存構建實踐物件
- 分散式儲存系統的最佳實踐:系統發展路徑分散式
- 敢為天下先,郵儲銀行“新核心”構建與落地之路
- 分散式系統中的資料儲存方案實踐分散式
- 農業銀行智慧運維建設和應用實踐運維
- 微眾銀行-訊息服務平臺建設實踐
- 民生銀行資料中臺體系的構建與實踐
- 阿里雲 ACK 容器服務生產級可觀測體系建設實踐阿里
- 專欄文章 質量保障系統的落地實踐 (三) CI 管理設計 - 整合設計
- 美國銀行應用基於區塊鏈的加密貨幣儲存系統專利區塊鏈加密
- 金融機構關鍵業務系統資料儲存規劃實施與配置
- 4.5PB!杉巖物件儲存中標天威視訊“中心儲存系統建設”物件
- 合闊智雲核心生產系統切換到服務網格 ASM 的落地實踐ASM
- 滴滴資料倉儲指標體系建設實踐指標
- 杉巖資料出席廣州銀醫資訊化交流會,分享分散式儲存行業建設經驗分散式行業
- 設計專案全生命週期管理系統構建與實踐
- 專欄文章 質量保障系統的落地實踐 (三) CI 管理設計 - 基礎設計
- 中國銀行電子支付平臺建設探索與實踐
- 水銀價格,藥用水銀,水銀生產廠家
- 專欄文章 質量保障系統的落地實踐 (二) 專案管理設計 - 程式碼資訊設計專案管理
- 農業銀行湖倉一體實時數倉建設探索實踐
- 水銀生產廠家銷售價格,淘砂金專用水銀,高高純度水銀
- 儲存系統
- 水銀價格汞生產廠家
- 分散式系統關鍵路徑延遲分析實踐分散式
- 實踐:GNU構建系統