工行內部通報6.23系統故障 系IBM軟體缺陷引發

zhengnx發表於2013-07-09
工行就6·23事件做出的正式內部通報檔案
據《消費者報導》訊息,近日,中國工商銀行資訊科技部就6月23日工行系統故障事件(以下簡稱“6·23事件”)正式作出內部通報,這份通報稱,工行資料中心(上海)主機系統出現故障,是由於IBM提供的主機DB2V10版本記憶體清理機制存在缺陷引發。
而在技術問題之外,工行本身的管理問題以及國內銀行業資訊系統落後的沉痾可能也是此次事件的誘因。
事件原因直指IBM:軟體存在缺陷
6月28日上午,工行某直屬一級分行資訊科技部員工陸續收到內部通報郵件。該通報就6.23事件的情況及原因作了基本描述,但對事件影響範圍、內部處理能力判斷均語焉不詳。
通報稱,“6月23日上午,資料中心(上海)監控發現主機CPU利用率升高,經分析判斷與6月23日凌晨實施的主機DB2資料庫軟體升級版本有關(從V9升級到V10),在緊急回退升級系統軟體版本後系統執行恢復正常。”同時,工行總行資訊科技部將該事件直接原因歸為IBM公司提供的軟體產品存在缺陷,並稱這點“經IBM公司正式確認”。
6月23日上午,全國多地中國工商銀行櫃檯、ATM、網銀業務出現故障,持續近1個小時。作為服務2.92億個人客戶及400多萬公司客戶的全國金融服務巨頭,工行此次故障波及北京、上海、廣州、武漢、哈爾濱等多個大中型城市。
當日,工行將該事故對外模糊描述為:“中國工商銀行部分地區因計算機系統升級原因造成櫃面和電子渠道業務辦理緩慢。”這也是迄今為止工行就6·23事件向使用者釋出的唯一公開解釋。
IBM公開官方資料顯示,工行與IBM的合作始於1997年,至今16年之久。針對通報中提及的“經IBM公司正式確認”,記者聯絡多位IBM相關負責人,但均未得到回應。
工行IT運維能力遭質疑
這份內部通報由一位不願透露姓名的工行在職員工提供。該員工表示,自己並不太滿意這份解釋:“對災難備份隻字未提,有意將管理問題規避為技術問題。”
通報也提及了一些管理問題,但表述頗為模糊,通報稱,“(資料中心上海)沒有按照‘第一時間恢復生產’的要求採取果斷措施及時進行回退,並且回退過程不堅決,耗時較長。”
銀行的災難備份系統,是指銀行對本地資料中心的資料、業務系統、軟硬體等資源進行同城或異地備份,以確保發生某些不可預測的災難後,重要資訊系統的資料安全的一種預防措施。
據中國銀行業監督管理委員會(以下簡稱“銀監會”)釋出的《銀行業金融機構資訊系統風險管理指引》,銀行業金融機構應制定資訊系統應急預案,並定期演練、評審和修訂;全國性資料中心要實現異地災備。
日前,國內 最大的災難備份服務商萬國資料CEO黃偉在接受福布斯中文網採訪時表示,“銀行的IT系統永遠面臨資訊保安的挑戰,但悲哀的是,銀行在IT系統和災難備份中不計成本,但遇到這樣的大面積的安全問題依然無法在短時間內恢復系統。”他認為,長久以來國內銀行的IT系統運作是在給這樣的事件埋下伏筆,他最後指出,“在國內銀行,IT系統的搭建更像是給上級和銀監會看的‘政績工程’。”
2008年,現任銀監會副主席郭利根曾就多起國內銀行資訊科技風險事件發表講話。他說,工行等國有銀行是國內在IT技術和風險管控上都比較先進的銀行,它們的問題頻發,“充分暴露出我國銀行業資訊系統的脆弱性。”
他指出,基礎建設滯後、軟硬體及核心技術受制於人和系統管理粗放是當時銀行業資訊科技建設存在的主要問題,“特別是在業務連續性規劃、業務恢復機制、風險化解和轉移措施、技術恢復方案等方面,存在明顯的‘短板’。”
整整五年過去,工行6•23事件證明了這些問題仍舊沒有得到有效解決。
[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7868752/viewspace-1060689/,如需轉載,請註明出處,否則將追究法律責任。

相關文章