大資料意味著向黑客暴露更多資料?

知與誰同發表於2017-09-04
本文講的是大資料意味著向黑客暴露更多資料,當有朋友問我是否瞭解“大資料”的安全問題時,我想到的是,大資料只是更多的資料,所以大資料面對著與其他資料相同的問題,是這樣嗎?

  這似乎過度簡化了大資料的問題。在某種程度上說,管理大資料就像帶小孩一樣,帶兩個小孩的工作量並不只是一個小孩的兩倍,更像是指數關係。隨著大資料的增長,潛在的管理問題也會呈指數增長。

  對於大資料,你必須明白,它不僅意味著更多資料,它也意味著更復雜的資料,更敏感的資料,它還意味著可能向成功滲入網路的攻擊者暴露更多資料。如果潛在攻擊者知道你有大量高質量資料,這可能會增加你的攻擊面,因為你被視為是極具吸引力的目標。當你進行企業風險分析時,應該考慮這一點。

  但當我們談及大資料時,我們不只是談論體積或者數量。大多數人都會談到Velocity(速度),即資料進入企業環境的速度。就個人而言,我認為Variety(種類)的概念更有趣。這是什麼資料?管理大量PHI資料要比管理混合資料(包括PHI資料、PCI資料、醫療資料和人口資料)簡單得多。資料的相似度對資料管理有著巨大的影響。這些資料的相似度如何?資訊更多樣化,用於支援這些資訊的基礎設施就更復雜。

  支援大資料的IT部署與支援資料的操作更相關,而不是資料的安全性。可擴充套件基礎設施、並行處理、資料複製和大量記憶體中處理只是關於大資料操作的一些討論。但對於我們這些安全人員來說,大資料安全意味著什麼?

  1.瞭解資料

  你擁有大量資料,但是你瞭解這些資料嗎?你有PCI資料,還是PHI資料,還是隱私企業資料/客戶資料?在你擔心別的事情之前,你需要了解大資料中包括哪些資料。瞭解大資料可以幫助你更好地管理這些資料,並讓你能夠發現異常資料。清理不相關的或者錯誤的資料是不可以掉以輕心的工作。

  2. 基礎設施問題

  可用性絕對是一個安全問題,所以請確保你具有適當大小的基礎設施。你的網路速度足夠快以支援資料吞吐量需求嗎?你具有足夠的CPU容量來支援資料在應用程式、資料庫和儲存裝置間的移動和管理嗎?你有足夠的磁碟空間來儲存這些資料嗎?你有足夠強大的硬碟管理程式嗎?這些都是管理大量資料所需要考慮的標準IT問題。在很多方面來看,資料越多,越難保護,你的解決方案需要隨著資料的增加和資料需求來擴充套件。你可以實時加密PB級或EB級的資料以確保資料滿足業務要求(包括會議時間要求)嗎?

  3. 瞭解時序限制

  時序是非常重要的因素。你的資料有生命週期嗎?例如,從時序性來看,臨床醫療資訊顯然要比典型的製造業指標資料更重要。更直白地說,有些資料如果不能及時管理和分析的話,將會失去部分價值。你認為如果Phalanx導彈防禦系統花五分鐘來評估威脅和響應,這個系統還會有任何價值嗎?答案顯然是否定的。這無疑推動了IT容量和吞吐量要求,有時候,時序性並不重要,不過在很多情況下,舊資料可能已經不相關了,資料的生命週期比我們想象的更重要。

  4. 瞭解內容資料

  這是對上述三個問題的直接擴充套件,幫助我們瞭解大資料。當資料有具體內容,我們可以將其作為資訊來管理,而不是位元組和位元。它是PHI資料,還是PCI資料,或者個人資訊?我們可以更深入地挖掘這種資料,通過內容來管理這些資料,而不只是將其作為“資料”對待。以智慧的方式來處理這些資料還可以讓我們以類似的方式來處理具有類似內容的資料,我們可以在這些資料間建立關係。

  雖然大資料可能只是“資料”,我們真的不希望它們只是“資料”,我們希望它們是“資訊”(即具有內容的資料)。大資料作為資料分析來源比單純作為“資料”更具價值,這也是為什麼資料內容和相關性非常重要的原因,我們可以通過資料內容和相關性讓資料變得更加“智慧”,你不只是談論“醫療資料”,而是談論獨特的病人標識、過敏症、當前處方等資訊;你不僅僅是談論“製造資料”,而是談論具體的庫存物品、供應商、商品價格、銷售價格、買方等;你不只是在談論安全事件資料,而是在討論IDS和內部系統報告針對Modor系統(這是一個執行Oracle 11g Enterprise的Windows Server 2008 R2 SP1,包含所有臨床病人資訊)的攻擊。

  從某種角度來看,這一切只是加劇了這個問題。我們需要處理大量具有潛在價值、動態的、複雜的資料,然後對這些資料進行內容分析。這些分析本身,以及用於建立這些分析的流程,也是非常有價值的。畢竟,如果我們不能從大資料分析中得到相關情報資訊的話,大資料真的只是一堆資料。這也讓我們認識到有必要保護這些分析建模和結果,以及對它們的訪問。

作者:鄒錚/譯
來源:it168網站
原文標題:大資料意味著向黑客暴露更多資料?


相關文章