從北京時間4月5號起,研發管理協同領域的海外標杆公司 Atlassian 的 Cloud 版本發生當機事故,導致 Jira、Confluence 在內的至少7款產品無法訪問。Atlassian 目前市值不到700億美元,年營業額超25億美元,其中最大收入來源就是專案管理和知識庫管理組合「Jira + Confluence 」。
根據 Atlassian 官方透露,此次當機事故影響了全球約400家企業客戶,截止4月13日,當機已持續9天,故障仍未完全被修復。
這一「曠日持久」的當機事件,再次引發了業界對於上雲如何保障資料安全的話題。
事故之謎
當機事故發生48小時後,多名使用者表示難以聯絡到官方獲得支援,部分得到官方回覆的也只是告知「問題仍需幾天修復」。
事故發生2天后的4月7日,Atlassian 在其 Twitter 賬號簡述了事故原因:「在執行例行維護指令碼時,少數網站無意中被禁用,導致他們無法訪問其產品和資料。」
同時,官方表示已投入大量工程師7/24全天候致力於修復此問題,並將在修復完成後,出具詳細的事後分析報告。
此次事故將帶來哪些具體影響,需要在日後一一計算。但資料安全顯然已經成為了眾多客戶最擔憂的事情。
官方賬號 @Ask Atlassian 在 Twitter 中的一項宣告似乎表明了此次事件將可能造成部分客戶的資料丟失,引發了大量客戶的討論與擔憂。4月8日,海外 IT 新聞媒體 TechTarget 在一則新聞中也指出,有客戶質疑了官方的事故原因,因為按照官方給的說法,是不需要這麼長時間、投入這麼多人力進行修復的。
接著,4月12日,Atlassian 官方釋出通知,目前已幫助45%的客戶完成站點重建。然而由於重建工作的複雜性,他們預計還需要2周的時間才能完成所有的重建工作。
其實,早在4月6日停服超過24小時的時候,Atlassian 已經違反了「服務水平協議」(SLA, Service Level Agreement)。根據該協議,Atlassian 雲產品的每月正常執行時間應在99.9%(Premium)或99.95%(Enterprise)以上,即停機時間不能超過45分鐘/月。
而今,事故已經持續9天甚至更久,遠遠超過了 Atlassian 在協議中承諾的停機時間。
去年10月底,Atlassian 市值最高曾超1200億美元,其後股價一直下滑,今年3月初相比去年11月,市值已經「腰斬」。截止4月11日,其市值為688.55億美元。此次事故對其股價持續下跌的趨勢或許是「雪上加霜」。
儘管此次事故原因和影響還有待進一步調查和核算,但業界的焦點一致指向了「上雲如何保障資料安全」這個話題。
安全!安全!
Atlassian 雲版本當機事故在整個雲端計算行業並不罕見。實際上,在過去的幾年裡,國內外的雲服務廠商、SaaS 軟體廠商當機事故頻發。
2010年至2019年間,AWS 平均每年當機次數達2.4次。而僅在2021年12月,AWS 就連續發生了3次當機。IBM Cloud 在2021年5月,5天內發生2次當機事件;Google Cloud 於2021年發生2次當機;Microsoft Azure 於2021年10月發生長達6小時的當機。
國內外 SaaS 廠商同樣發生了幾次嚴重當機事故。2021年,SaaS 鼻祖 Salesforce 因為一位運維工程師未遵守規範,企圖走捷徑修 Bug 而造成了長達5小時的全球當機,使15萬客戶的 CRM 系統陷入癱瘓。在國內,2020年的微盟程式設計師刪庫跑路事件也導致了300萬餘使用者無法正常使用該公司的 SaaS 產品,給公司造成了近億元的直接損失。
造成雲產品當機的原因多種多樣,包括產品漏洞未及時修復、操作不規範、負載過重、黑客入侵、刪庫跑路等都可能導致當機。
在當前全球化環境下,90%以上的國際通訊業務基本都由海底光纜承擔。而海底電纜作為連線全球使用者的重要基礎設施,也影響著雲服務的穩定性與安全性。因為,海底電纜無法避免地會受到自然環境或人類活動的損害,也可能造成網路通訊、雲服務的故障。
由此可見,即使近年來雲端計算在全球範圍內不斷髮展成熟,基礎設施日趨完善,但依舊存在著雲安全風險。在雲端計算環境下,使用者資料直接在雲端計算與儲存,資料所有權與管理權分離,帶來了雲環境下的資料安全問題。此外,虛擬化技術使得傳統物理安全邊界逐漸缺失。不僅如此,不同終端和大量應用的出現,同樣給新的安全環境帶來了不可預知的威脅。
擁抱混合雲
從2021年2月起,Atlassian 正式停售 Sever 本地部署版本,鼓勵企業上雲。
數字化轉型趨勢下,企業上雲成為未來趨勢。但一味鼓勵上雲,而沒有提供安全的上雲環境,或是像 Atlassian 這樣一刀切的上雲政策,可能會引起更大的資料安全隱患。
對中大型企業而言,由於其複雜的業務架構,傳統的公有云和私有云都很難滿足上雲需求。一方面,公有云雖然具備更高的可擴充性,能夠降低企業運營成本,但無法滿足關鍵行業對安全的要求,例如金融、通訊等行業出於對客戶資金、資訊保安、行業監管的考慮,很難一步上公有云;另一方面,私有云雖然能夠更好地滿足企業對安全合規的要求,但其敏捷、靈活度低,企業的運維成本也更高。
在此需求背景下,混合雲成為了近年來中大型企業的選擇。根據 Flexera 統計,全球企業使用混合雲部署的比例超80%。而國內使用雲端計算服務的企業中,也有超過50%的企業選擇了混合雲。“十四五”規劃更是明確了以混合云為重點的雲服務產業發展路線。
資料來源:Flexera、中國信通院
與單一的公有云或私有云相比,混合雲通過將內部基礎架構、公有云和私有云服務相連線,打造出兼備公有云的靈活開放性和私有云的安全性的雲環境,從而幫助企業更有效且經濟地實現其技術和業務目標。
ONES 作為國內領先的企業級研發管理解決方案提供商,提供了公有云、私有云、混合雲等多種部署方案,以滿足不同行業和企業的個性化需求。同時,ONES 通過了可信雲、ISO27001、ISO27018 等多項國內外權威的雲端計算及資訊保安認證,能夠為企業提供安全可靠的服務。
目前,ONES 已成功幫助小米、浪潮軟體、招商基金、貴州茅臺、上汽等多個500強在內的企業實現高效安全的軟體研發管理,在各行各業均有成熟的解決方案,助力企業數字化轉型。
zhuanlan.zhihu.com
圖示