解決資料災難需要回答的十個問題
良好的業務依賴於好的計劃。場景預測、響應描述和結果分析是業務生存的關鍵。技術也不例外,我們都希望得到一個好結果,但從統計學上講,麻煩是不可預知的,可能就在你的面前。這也是您為您的房子和汽車上保險的原因。
技術層面,冗餘、高可用性和災難恢復就是您業務的保險措施。如果您為你的企業制定了正確的技術保障措施,那麼您的業務可能就會在資料災難中倖免。
什麼可能導致資料災難?
在資料災難中倖存的最佳方法就是提前為災難做好準備。很多公司最大的錯誤就是在災難發生之際才採取措施。
說到災難,我們可能會立即想到龍捲風、颶風、地震、火災、暴風雪、洪水等。那麼在技術層面,災難又是什麼呢?
技術災難更多的是由技術控制人員的人為錯誤或者系統故障導致的,可能包括軟硬體損壞,惡意軟體,勒索軟體,更新失敗等。
人為錯誤
技術中的人為錯誤因素被定義為“行為者無意行為”,例如:缺乏計劃、簡單的輸入錯誤導致程式碼嚴重損壞、無法更改密碼、意外刪除資料等。
人為錯誤很容易導致病毒或惡意軟體侵入系統。並且世界上任何一項技術都無法阻止人為錯誤對企業業務的影響。
人們意外被電線絆倒,誤拔掉正確的電源線,或者在錯誤的伺服器上以正確的方式進行維護。並且心懷不滿的員工也會惡意破壞系統。不要過分依賴技術而忽略了人為因素的影響。
考慮可能性
仔細考慮資料災難發生的任何可能以及能夠造成的一切影響是災難恢復計劃的關鍵部分。
例如:硬體冗餘,自動異地備份和地理分離等措施都能夠在資料災難中很大程度保障您的業務盈利。
您可以把它當成一場賭注,但我相信跟您的業務價值相比,任何賭注都是值得的。
一個正確的災難恢復策略最重要的是確定好以下兩點:
-
恢復時間目標(RTO)
-
恢復點目標(RPO)
一旦您確定了某項任務的“災難點”,您便可以開始為這些可能做準備。與其去討論這樣做的意義,不如討論它對您業務的意義。
恢復時間目標(RTO)
恢復時間目標(RTO) 是指災難發生後,從IT系統當機導致業務停頓之刻開始,到IT系統恢復至可以支援各部門運作,業務恢復運營之時,此兩點之間的時間段。需要考慮的因素包括訂單丟失、生產力下降、上市時間延遲等影響商業信譽和客戶忠誠度的一切因素。
其中同一因素對不同企業的影響程度是不一樣的。例如:停工時間。
一個資訊網站停機一個小時,可能只會遭受投訴,幾乎沒有直接性的經濟損失。但是,如果是一家電子商務零售商的網站在黑色星期五或者網路星期一停機一個小時,可能就會威脅到這家公司的底線,甚至威脅到整個企業的生存。
案例:Macy 百貨公司
Macy百貨在2016年和2017年都經歷過在黑色星期五和網路星期一兩天的網路減速和停電事件。
根據Adobe Insights資料,2017年美國的網路星期一的線上交易記錄又創新高,達到65.9億美元,比上一年增長了16.8%。週五又帶來了50.3億美元的線上交易。移動銷售也是第一次在24小時內達到20億美元。
由此便可預知Macy百貨的一天故障造成的損失有多大。
恢復點目標(RPO)
恢復點目標(RPO)是指災難發生後,容災系統能把資料恢復到災難發生前時間點的資料。亞特蘭大市是實施災難恢復解決方案的一個重要例子。
案例:亞特蘭大市
在今年的3月,您可能聽到過關於亞特蘭大市勒索軟體攻擊的新聞。亞特蘭大市是一個擁有600萬人口的大都市,2018年3月22日,多個市的計算機系統被一個稱為SamSam的大規模勒索軟體攻擊癱瘓,影響了將近1/2的部門業務。
駭客將重要檔案加密,並要價1000美元的比特幣才給提供解密密碼,否則就刪除資料。亞特蘭大官員表示,當地有關部門正在與聯邦調查局、國土安全部等部門合作,調查勒索軟體訪問了什麼資訊,如何破解等等。該官員表示,與亞特蘭大市打過交道的所有公司或個人都有可能面臨網路攻擊的風險,建議大家清查自己的銀行賬戶。
有一個經過測試的備份系統
一個未經測試的備份系統等同於沒有備份。根據Ponemon Institute2016年資料違規成本顯示,經歷過重大資料丟失的企業,43%沒有再次開業,51%兩年內倒閉。恢復資料需要的時間越長,情況就越糟糕。到第十天,93%的公司在一年內申請破產。
因此,一個企業想要在資料災難中倖存下來,必須有一個經過測試的備份系統。
解決資料災難需要回答的十個問題
1. 您的關鍵系統和資產是什麼?
2. 如果您的核心應用程式故障一小時,您的企業將面臨哪些風險?如果是一天呢?一週呢?
3. 您要防範哪些災難?
4. 您的恢復時間目標(ATO)是多少?是針對每個應用程式或面向客戶的系統嗎?
5. 您的恢復點目標(RPO)是多少?是針對每個應用程式或面向客戶的系統嗎?
6. 資料恢復過程的關鍵利益相關者或決策者是誰?他們清楚自己的身份嗎?
7. 您是否有書面的恢復計劃?如果有,是否符合所有的合規目標?
8. 您目前是否正在備份資料?是否在外地?
9. 重新建立所有的專有資料需要多長時間?是否有這樣的能力?代價是什麼?
10. 您組織的最後一次完成完整恢復測試是什麼時候?
來自 “ https://www.liquidweb.com/blog/ten-questions-you-n ”,原文連結:http://blog.itpub.net/31545816/viewspace-2214957/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 巨大的科學難題需要大資料解決方案大資料
- MDS:解決SOA的資料難題
- 細數基於ORACLE 資料庫環境的常見資料災難解決方式Oracle資料庫
- 新手大資料必問十個問題大資料
- 大資料成為解決這一難題的一個“抓手”。大資料
- 解決兩個難懂的安全性問題(轉)
- Veeam助力TrendMicro解決資料保護和災難恢復挑戰
- 微軟:解決Windows盜版問題可能需要幾十年微軟Windows
- Oracle資料庫備份、災備的23個常見問題Oracle資料庫
- Mycat分片方案需要解決的問題
- 解決AI的小資料問題AI
- 十步法原則解決資料質量問題
- Oralce 資料庫的災難恢復(轉)資料庫
- 原來每設定一個KPI 都需要回答17個問題!KPI
- 挑戰10個最難回答的Java面試題(附答案)Java面試題
- 【轉載】分享我是如何解決問題的—尊重每一個回答問題的人
- 工作疑難問題解決4例
- 基於UNIX系統,邏輯故障的資料災難解讀
- MySQL資料災難挽救之truncate tableMySql
- MySQL資料災難挽救之drop tableMySql
- MySQL資料災難挽救之Delete\UpdateMySqldelete
- 景聯文科技:您的模型效能問題需要標註資料來解決模型
- 啟動大資料專案之前需要問的5個問題大資料
- 關於資料倉儲的十個最長問的問題 (轉)
- 解決hive資料庫 插入資料很慢的問題Hive資料庫
- 資料補丁中需要注意的幾個問題
- 乾貨|兩個資料分析模型,快速解決使用者分析難題模型
- 幽默:程式設計中困難的不是解決問題,而是確定要解決的問題 - Paul程式設計
- 解決ecplise提示需要移除@Override的問題IDE
- 難解決的記憶體洩露(OutOfMemory)問題!!!記憶體洩露
- 解決Sql Server警報的疑難問題(轉)SQLServer
- 解決兩相同資料庫資料同步的問題 (轉)資料庫
- 解決Gson解析Date資料格式的問題
- 解決被掛起的資料庫問題資料庫
- 選擇 NoSQL 資料庫需要考慮的 10 個問題SQL資料庫
- pps資料無法回答“哪種SDN解決方案更好”,你需要考慮這些
- 亞馬遜雲資料庫Redshift解決叢集難題WE亞馬遜資料庫
- 這個jndi連線資料來源的問題怎麼解決?