銀行業生產系統儲存資料遷移方法及實踐

danny_2018發表於2022-03-22

摘要】本文基於同城雙活中心建設中的儲存資料遷移實踐,結合行業經驗,對銀行業生產系統儲存資料遷移方法進行了研究和總結。分析了銀行業常見儲存資料遷移場景、資料遷移中資料安全性、業務連續性和技術場景複雜度等相關難點、總結了資料遷移方案的內容、步驟、相應技術、工具,提出了遷移方案的相關建議,並以華為OceanStor Dorado 18500V3為例,介紹了異構和納管兩種資料遷移實踐,希望可以為同業儲存資料遷移提供有益的參考。

【作者】晝者,某省農信社資深技術經理、經濟學博士、高階經濟師,銀行從業17年,在全行數字化轉型變革中,參與了科技發展規劃、組織架構調整、管理流程設計和重大專案建設,為業務與科技的融合之路,進行了有益的探索。帶領團隊獲得了10項發明專利和7項軟體著作權,2項作為第一發明人,多次獲得監管部門科技獎項。出版了個人經濟學學術專著並在《金融電子化》、《金融科技時代》、《中國金融電腦》、《中國農村金融》等期刊發表多篇金融科技文章。多次受邀參加金融科技峰會及專題會作主題分享,為頭部金融同業機構授課培訓金融科技創新實踐。

1前言

隨著全快閃記憶體技術與高速網路通訊、雲端計算、人工智慧等資訊科技的不斷深化融合,資料的價值更加凸顯,資料庫和應用系統的存在形式愈發豐富,全快閃記憶體技術生態以燎原之勢,呈現出上雲、開源、自主可控和分散式的趨勢。儲存之間的相互遷移已成為常態化,從同構到異構儲存之間的遷移,從資料到資料及應用系統的遷移,從本地間到上雲遷移,遷移的表現方式不一而足。

我行利用同城雙活資料中心建設契機,透過更換老舊關鍵裝置、升級基礎軟體、應用雙活改造等措施,對現有核心繫統實施升級,最佳化了技術架構,完善了管理體系。專案實施內容包括大量裝置搬遷和更替、基礎軟體升級等,均涉及多層次的資料遷移工作。透過閱讀文獻、同業借鑑和專家溝通,制定了不同場景的資料遷移方案並最終投產成功,以期為同業提供有益參考。

2 背景

我行同城雙活中心建設中,資料遷移涉及14套核心系統和56套BC類系統,共計遷移資料量280TB,涵蓋資料庫層、儲存同構和異構、同站點和多站點等多種資料遷移場景。根據同城雙活建設方案設計,需同時開展伺服器替換,作業系統、資料庫、中介軟體、應用軟體的版本升級等工作,進一步加大了資料遷移實施的難度。因此,需針對不同場景,科學安排資料遷移策略,儘量減少停機次數和時長,降低對業務系統運營的影響。

3 資料遷移場景

儲存裝置作為銀行資訊系統中最為關鍵的核心裝置,不僅存放著全行業務及管理資料,同時也是容災解決方案的主要底層技術。因此,儲存資料遷移是銀行業資料遷移中最為常見的場景之一。

以資料遷移的目的來劃分,資料遷移場景主要涉及IT架構轉型、資料中心遷移、資料整合、應用遷移、儲存及伺服器替換等。

4 資料遷移的難點

大資料時代,資料作為生產要素,其價值得到了業界的普遍認可。同時由於對客戶體驗的極致追求,銀行業須提供7X24小時不間斷的金融服務範圍愈加廣泛,這些都對資料遷移工作提出了更高的要求,特別是在資料遷移中所存在的資料安全性、業務連續性、遷移成本及工期、技術及場景複雜度等重點和難點問題。

4.1 資料安全性

資料安全性是資料遷移必須解決的首要問題,主要包括資料的一致性和完整性。

4.1.1 資料一致性

資料一致性是指資料在遷移前後必須保證其資料時間戳的一致性。主要存在兩個難點,一是如何在最少停機時間內,完成遷移工作並確保資料的一致性;二是如何進行資料一致性驗證。

4.1.2 資料完整性

資料完整性是指資料在遷移前後資料量、配置、狀態等相關資料屬性的正確完整。同樣存在兩個難點,一是如何準確評估遷移資料的範圍;二是如何進行資料完整性驗證。

4.2 業務連續性

一般來說,在業務停機、資料處於靜止狀態,最利於開展資料遷移工作,更便於保障資料的一致性和完整性。但在實踐中,由於監管管控、業務服務及客戶體驗的相關要求,須儘量採用線上資料遷移方案,犧牲部分生產儲存及伺服器效能,承擔資料可能丟失的風險。因此,在選擇資料遷移方案時必須做好視窗時間、裝置效能和實施風險之間的平衡。

4.3 技術及場景複雜度

儲存資料遷移中涉及現網和目標兩端的伺服器、SAN交換機等硬體裝置,以及作業系統和資料庫等基礎軟體等眾多產品和技術。其難點主要在於產品的相容性、技術的複雜度和場景的複雜性等方面

4.3.1 系統相容性

現網IT產品是銀行業資訊化建設歷史發展的產物,必然存在品牌多、技術多、代差大等情況,因此遷移方案中各產品和技術間的相容性是首要考慮的問題。

4.3.2 技術複雜度

現網架構中不僅存在上述多產品間相容問題,同時涉及現網儲存、伺服器、作業系統和資料庫等產品的容災高可用功能,因此在設計遷移方案時必須考慮兩個方面,一是在資料遷移中如何確保現網架構的高可用性;二是在新架構中如何規劃高可用級別不低於現網架構的高可用方案。

4.3.3 場景複雜性

從儲存資料遷移的角度來看,現網儲存架構一般涉及物理機、虛擬化、雲等多類基礎架構環境,同時所承載的業務系統重要等級也不盡相同,如何將現網架構根據不同場景分批、分類開展資料遷移是工作中的難點。

5 儲存資料遷移方案

5.1 資料遷移方案內容

一般來說,儲存資料遷移主要涉及硬體安裝、資料同步和遷移割接三類工作:

硬體安裝工作量佔比20%,主要涉及工勘、、硬體安裝、連線、組網劃Zone。

資料同步工作量佔比30%,主要涉及儲存軟調、資料同步、容災配置、資料一致性分裂。

遷移割接工作量佔比50%,主要涉及OS重新配置、多路徑替換、卷管理和叢集調整、資料庫與應用軟體調整。

5.2 資料遷移步驟

由於資料遷移適用場景較多,業界積累了較為全面的資料遷移步驟,我行與儲存廠商結合業界實踐經驗,將儲存資料遷移工作進一步完善,總結為4個階段,17個實施步驟。詳見下圖。

5.3 資料遷移場景及相應技術工具

5.4 儲存常用資料遷移工具

5.5 資料遷移方案選擇建議

雖然眾多儲存廠商針對不同場景和層級提供了豐富的遷移工具,但結合實踐經驗,在遷移方案選擇上有以下建議:

一是虛擬化平臺優選使用虛擬化層的同步功能 ;

二是對於停機時間要求不嚴格的場景,優先選擇離線接管+線上遷移 ;

三是選擇線上接管+線上遷移的要非常詳細的評估可能的影響因素,如iSCSI、SANboot、多路徑、叢集等 ;

四是Unix平臺可以考慮異構虛擬化和卷管理方案,x86下不優先採用卷管理方案 ;

五是資料遷移中一般會同時使用多個方案,以“最小風險、最短停機、最低成本”完成資料遷移工作。

5.6 實施注意點

5.6.1 資料安全性評估

制定遷移方案時,需要對資料安全性進行仔細評估。實施方案確保不會破壞源儲存中的資料,遷移完成後源儲存中需保留一份原始資料副本。同時,資料遷移完成後,所有業務資料下發到目標儲存。

有兩點建議:一是在資料遷移之前備份業務資料,需要預留足夠的備份視窗完成資料備份。二是在資料遷移之前所有現場與遠端支撐人員到位,確定具體的實施時間。

5.6.2 操作時間視窗

由於遷移變更內容多,操作複雜,核心業務磁碟多操作時間長導致整個操作時間視窗有可能超過申請時間視窗。可以透過科學制定Runbook、操作指導書、操作命令、非影響業務的情況下提前做、分階段分批實施等措施,科學規劃操作時間視窗。

5.6.3 資料驗證

一是資料量驗證。一般採用資料量驗證很簡單,對比新老資料庫的資料表數量,索引數量,觸發器數量,檢視數量等方式。透過比對版本日期、檔案時間戳、MD5校驗值等方法結合應用系統特點,制定資料一致性校驗指令碼和操作流程,加入到日常巡檢中,完善資料驗證常態化機制。透過比對資料庫時間戳、資料表記錄條數、分戶賬餘額等方法。

二是資料完整性和一致性驗證。需要結合應用系統特點,選取特定表、特定欄位進行對比。

5.6.4 遷移操作過程中誤操作

在資料遷移過程中很多操作是不可逆的,可能會導致資料丟失或資料損壞。

建議將遷移方案細化到指令級,操作過程中每條指令嚴格檢查回顯資訊、按照操作手冊指令執行、多人進行復核和確認等措施,最大程度減少誤操作機率。

5.6.5 回退方案

回退方案作為遷移實施方案中的關鍵環節,必須確保遷移出現風險時,完善的遷移回退應急預案,保障回退期間業務不受影響。下表以華為儲存為例,列出了不同遷移場景的主要回退步驟。

6 儲存資料遷移實踐案例

我行在同城雙活中心建設中,對現有儲存容災架構進行了諸多最佳化,更換升級了核心(A+類)、重要(A類)、管理監管類(BC類)儲存(池),其中涉及大量儲存資料遷移工作,在各廠商、部門的配合下順利完成資料遷移工作,為同城雙活中心建設打下了堅實的基礎。

我行BC類儲存遷移工作,歷經95天的深入調研及規劃設計,28天的縝密實施,圓滿完成從原儲存IBM V7000及SVC到華為儲存OceanStor Dorado 18500 V3的資料遷移。總計遷移資料量146TB,涉及52套業務系統,76臺主機,179個LUN。本章將以我行遷移實踐中,環境更為複雜的BC類儲存為例,介紹儲存遷移相關實踐。原儲存架構如下:

6.1 華為OceanStor Dorado 18500 V3儲存透過異構接管替換IBMv7000儲存

6.1.1 資料遷移步驟

步驟一:連結華為OceanStor Dorado 18500 V3到 384B交換機,修改交換機Zone,建立華為OceanStor Dorado 18500 V3與IBM V7000儲存之間,以及華為OceanStor Dorado 18500 V3到業務主機SAN網路;

步驟二:主機側完成資料備份,包括作業系統資訊、業務配置資訊、光交配置資訊、源儲存配置資訊和業務環境組網;上傳華為多路徑軟體到指定位置;如果存在HACMP,則需做HACMP快照;

步驟三(停止業務系統):停止業務系統,資料庫(Db2、Oracle)和叢集(HACMP、RHCS、Heartbeat),並取消掛載檔案系統,去啟用VG;對於有心跳盤的HACMP的業務主機需刪除心跳盤;

步驟四:取消V7000儲存到業務主機的LUN對映;

步驟五:業務主機安裝和配置華為多路徑UltraPath;

步驟六:在華為OceanStor Dorado 18500 V3儲存上建立eDevLun,並對映eDevLun至業務主機;

步驟七(啟動業務系統):主機識別LUN,啟用VG,掛載檔案系統,啟動叢集和主機業務;對於之前刪除心跳盤的HACMP業務系統需新增新的LUN為心跳盤;

步驟八:華為OceanStor Dorado 18500 V3針對所有eDevLun建立LUN遷移任務;

步驟九:LUN遷移全部完成後,一致性分裂並刪除遷移任務;

步驟十:確認業務正常;

備註:在停止業務系統前需做好所有停機系統的資料備份。

步驟十一:資料驗證

儲存完成異構遷移後,驗證遷移的資料是否完整,資料驗證步驟如下:

步驟一:異構接管後,啟動資料庫,應用系統維護人員驗證資料可用性;

步驟二:資料完成Migration遷移及分裂後,由應用維護人員對相應遷移系統資料的可用性、一致性和完整性進行驗證。

6.1.2 回退步驟

回退方案(1小時):

以下重大問題在凌晨4:00(視窗時間結束前1小時)前無法解決則視為資料遷移失敗,需執行回退方案:

1、異構資料同步失敗;

2、主機新增目標儲存對映失敗;

3、遷移後業務啟動失敗。

回退步驟如下:

1、停止業務、關閉資料庫;

2、解除安裝華為多路徑軟體;

3、恢復源儲存與主機的對映關係;

4、啟動業務,啟動資料庫服務;

5、完成回退。

6.1.3 資料遷移實施情況

資料遷移實施涉及人力資源等10套業務系統,10套系統,18臺主機,67個LUN,資料量15T。採用華為Migration技術將IBM V7000資料遷移至華為OceanStor Dorado 18500 V3儲存。從Migration技術角度來說,理論上可以實現儲存與伺服器間的鏈路無縫切換,但實踐中需綜合考慮鏈路穩定性、裝置系統數量和停機視窗可控等因素,最終選擇在實施鏈路切換相關步驟(見6.1.1步驟三至七)時,停止應用系統及資料庫(無業務資料IO),確保遷移資料的安全性和完整性。透過10小時(其中5小時停機)順利完成全部遷移工作。

6.2 華為OceanStor Dorado18500 V3儲存透過SVC VDM替換老舊儲存

透過SVC VDISK Mirror的功能,實現華為OceanStor Dorado18500 V3儲存替換SVC下的IBM DS5020和華為S5800T儲存。

6.2.1 資料遷移步驟

步驟一:連結華為OceanStor Dorado 18500 V3dao 384B交換機,修改交換機Zone,建立華為OceanStor Dorado 18500 V3與IBM SVC之間SAN網路;

步驟二:華為OceanStor Dorado 18500 V3儲存修改對映給SVC埠的role屬性,建立硬碟域、主機、主機組,建立LUN、LUN組,對映檢視,把LUN對映給SVC;

步驟三:SVC上掃描到新劃分到Zone裡的華為OceanStor Dorado 18500 V3儲存,修改備註名;

步驟四:SVC掃描mdisk,識別華為OceanStor Dorado 18500 V3儲存對映的LUN;

步驟五:建立mdisk group,新增華為OceanStor Dorado 18500 V3儲存LUN建立的mdisk進mdisk組;

步驟六:新增待遷移vdisk卷映象,指定到新建立的mdisk組;

步驟七:待同步完抽後,修改主copy到華為OceanStor Dorado 18500 V3儲存的mdisk組;

步驟八:分離源儲存的copy為新的卷,指定別名;

步驟九:確認業務正常;

步驟十:刪除分離後源儲存的卷;

步驟十一:源儲存接觸對SVC的對映;

步驟十二:資料驗證;

儲存完成異構遷移後,驗證遷移的資料是否完整,資料驗證步驟如下:

步驟一:異構接管後,啟動資料庫,應用系統維護人員驗證資料可用性;

步驟二:資料完成SVC VDM後,由應用維護人員對相應遷移系統資料的可用性、一致性和完整性進行驗證。

6.2.2 回退步驟

當建立完vdisk映象,資料雙寫,切換讀I/O到華為OceanStor Dorado 18500 V3儲存,出現故障或效能無法滿足生產需要,考慮回退操作。回退步驟如下:

1、切換卷的主copy回到原儲存;

2、從vdisk映象裡分裂華為OceanStor Dorado 18500 V3儲存的vdisk;

3、刪除分離後的華為OceanStor Dorado 18500 V3儲存vdisk;

4、開啟原卷的讀寫快取;

5、解除華為OceanStor Dorado 18500 V3儲存對SVC的對映;

6、完成回退。

6.2.3 資料遷移實施情況

資料遷移實施涉及ATM監控等15套系統,15套物理機系統,20臺虛擬機器叢集主機,106個LUN,遷移資料量131T。採用IBM VDM技術遷移至華為OceanStor Dorado 18500 V3儲存,透過95小時、全線上方式順利完成全部遷移工作。

7 結語

隨著人工智慧、區塊鏈、雲端計算、大資料、物聯網等技術的飛速發展,新技術在場景化的應用趨勢愈發明顯。技術的快速迭代中,我們不得不廣泛面對資料遷移的大量需求。而儲存裝置作為銀行資訊系統中最為關鍵的核心裝置,不僅存放著全行業務及管理資料,同時也是容災解決方案的主要底層技術。因此,儲存資料遷移是銀行業資料遷移中最為常見的場景之一。

本文基於同城雙活中心建設中的儲存資料遷移實踐,結合行業經驗,對銀行業生產系統儲存資料遷移方法進行了研究和總結。分析了銀行業常見儲存資料遷移場景、資料遷移中資料安全性、業務連續性和技術場景複雜度等相關難點、總結了資料遷移方案的內容、步驟、相應技術、工具,提出了遷移方案的相關建議,並以華為OceanStor Dorado 18500 V3儲存為例,介紹了異構和納管兩種資料遷移實踐。希望能拋磚引玉,為同業儲存資料遷移提供有益的參考。

來自 “ twt企業IT社群 ”, 原文作者:twt社群;原文連結:https://mp.weixin.qq.com/s/7Cx_MO0hacatYezOGH2zMw,如有侵權,請聯絡管理員刪除。

相關文章