北京郵電大學教授楊義先:大資料背景下的資訊保安風險及防禦

玄學醬發表於2018-04-12

2017-04-25-17b678ee39-bef5-430d-a15c-54a

【嘉賓檔案】

楊義先,北京郵電大學教授、博士生導師、首屆長江學者特聘教授、首屆國家傑出青年基金獲得者、國家級教學名師、國家級教學團隊(“資訊保安”)帶頭人、全國百篇優秀博士學位論文導師、國家精品課程負責人,《安全簡史》和《安全通論》的作者。

現任北京郵電大學資訊保安中心主任、災備技術國家工程實驗室主任、中國密碼學會副理事長、公共大資料國家重點實驗室主任。長期從事網路與資訊保安方面的科研、教學和成果轉化工作,在國際四大學術名刊《PNAS》、Nature子刊《Scientific Report》等頂級刊物上發表過多篇論文。

曾獲得榮譽:政府特殊津貼、國家級有突出貢獻的中青年專家、國家級有突出貢獻的中國博士學位獲得者、第四屆“中國青年科學家”、第四屆“中國青年科技創新獎”、全國優秀科技工作者、中國科協第三屆青年科技獎、“有可能影響中國21世紀的IT青年人物”。

◆大資料及大資料探勘

讀者朋友們,恭喜你們,到了大資料時代,你們就成“皇帝”了!當然,別高興太早,我說的是那位“穿新衣的皇帝”。

為什麼我會這樣說呢?因為在大資料面前,你真的就是赤裸的:你說過什麼話,做過什麼事,有什麼愛好,生過什麼病,家住哪裡,親朋好友都有誰,等等,它都知道。可以說,你自己知道的,它幾乎都知道,或者說它都能夠知道。

甚至連你自己都不知道的事情,大資料也可能知道,比如,它能夠發現你的許多潛意識習慣:集體照相時你喜歡站哪裡呀,跨門檻時喜歡先邁左腳還是右腳呀,你喜歡與什麼樣的人打交道呀,你的性格特點都有什麼呀,哪位朋友與你的觀點不相同呀,等等。

再進一步地說,今後將要發生的事情,大資料它還是有可能知道,比如,根據你“飲食多、運動少”等資訊,它就能夠推測出,你可能會“三高”。當你與許多人都在購買感冒藥時,大資料就知道:流感即將爆發了!實際上,大資料已經成功地預測了包括世界盃比賽結果、總統選舉、多次股票的波動、物價趨勢、使用者行為、交通情況等一系列問題的發展趨勢。

當然,這裡的“你”並非僅僅指“你個人”,還包括但不限於,你的家庭、你的單位、你的民族、甚至你的國家。

那麼,到底什麼是大資料呢?國際權威諮詢機構Gartner說:“大資料,就是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的資訊資產。”麥肯錫全球研究所說:“大資料是一種規模大到在獲取、儲存、管理、分析方面大大超出了傳統資料庫軟體工具能力範圍的資料集合,具有海量的資料規模、快速的資料流轉、多樣的資料型別和價值密度低四大特徵。”還有更多的權威專家們,總結了大資料的若干其他特性,比如,容量的超大性、種類的多樣性、獲取的快速性、管理的可變性、質量的真實性、渠道來源的複雜性、價值提取的重複性,等等。

其實,形象地說,所謂大資料,就是由許多千奇百怪的資料,雜亂無章地堆積在一起的東西。比如,你主動在網上說的話、發的微博微信、存的照片、收發的電子郵件、留下的諸如上網記錄等行動痕跡,都是大資料的組成部分。在不知道的情況下,你被採集的眾多資訊,比如,被馬路攝像頭獲取的視訊、手機定位系統留下的路線圖、在各種情況下被錄下的語音、駕車時的GPS訊號、電子病歷檔案、公交刷卡記錄等被動資訊,也都是大資料的組成部分。還有,各種感測器裝置自動採集的有關溫度、溼度、速度等萬物資訊,仍然還是大資料的組成部分。總之,每個人、每種通訊和控制類裝置,無論它是軟體還是硬體,其實都是大資料之源。

一句話,無論你是否喜歡,大資料它就在那裡;無論主動還是被動,你都在為大資料作貢獻。大資料是人類的必然。

大資料到底是靠什麼法寶,才知道那麼多祕密的呢?用行話說,它利用了一種名叫“大資料探勘”的技術,採用了諸如神經網路、遺傳演算法、決策樹方法、粗糙集方法、覆蓋正例排斥反例方法、統計分析方法、模糊集方法等高大上的方法。大資料探勘的過程,可以分為資料收集、資料整合、資料規約、資料清理、資料變換、挖掘分析、模式評估、知識表示等八大步驟。

大資料探勘,從正面來說,是創造價值;從負面來說,就是洩露隱私了!大資料隱私是如何被洩露的呢?請先跟我來分解一下經典的“人肉搜尋”吧!

一大群網友,出於某種約定的目的,比如,搞臭某人或美化某人,充分利用自己的一切資源渠道,儘可能多地收集當事人或物的所有資訊,包括但不限於網路搜尋得到的資訊(這是主流)、道聽途說的資訊、線下知道的資訊、各種猜測的資訊,等等;然後,將這些資訊按照自己的目的精煉成新資訊,反饋到網上與其同志們分享。這就完成了第一次“人肉迭代”。接著,大家又在第一次“人肉迭代”的基礎上,互相取經,再接再厲,交叉重複進行資訊的收集、加工、整理等工作,於是,便誕生了第二批“人肉迭代”。如此迴圈往復,經過N次不懈迭代後(新聞名詞叫“發酵”),當事人或物的醜惡(或善良)畫像就躍然紙上了。如果構成“滿意畫像”的素材確實已經“坐實”,至少主體是事實,那麼,“人肉搜尋”就成功了。

其實,所謂的大資料探勘,在某種意義上說,就是由機器自動完成的特殊“人肉搜尋”而已。只不過,現在“人肉”的目的,不再限於抹黑或頌揚某人,而是有更加廣泛的目的,比如,為商品銷售者尋找最佳買家、為某類資料尋找規律、為某些事物之間尋找關聯,等等,總之,只要目的明確,那麼,大資料探勘就會有用武之地。

如果將“人肉”與大資料探勘相比,那麼,此時網友被電腦所替代;網友們收集的資訊,被資料庫中的海量異構資料所替代;網友尋找各種人物關聯的技巧,被相應的智慧演算法替代;網友們相互借鑑、彼此啟發的做法,被各種同步運算所替代;各次迭代過程仍然照例進行,只不過機器的迭代次數更多、速度更快而已,每次迭代其實就是機器的一次“學習”過程;網友們的最終“滿意畫像”,被暫時的挖掘結果所替代,因為,對大資料探勘來說,永遠沒有盡頭,結果會越來越精準,智慧程度會越來越高,使用者只需根據自己的標準,隨時選擇滿意的結果就行了。當然,除了相似性外,“人肉”與“大資料探勘”肯定也有許多重大的區別,比如,機器不會累,它們收集的資料會更多、更快,資料的渠道來源會更廣泛,總之,網友的“人肉”,最終將輸給機器的“大資料探勘”。

◆安全、黑客與程式碼

“安全”是一個很主觀的概念,與角度密切相關。同一個事件,對不同的人,從不同的角度來說可能會得出完全相反的結論。所以,研究“安全”,必須只鎖定一個角度,比如,“我”的角度。

其次,“安全”是一個與時間密切相關的概念。同一個系統,在昨天安全,絕不等於今天也安全;同樣,在今天安全,也絕不等於明天就安全。當然,一個“在昨天不安全”的系統,今天也不會自動變為安全。

還有,“安全”是一個與物件密切相關的概念。若A和B是兩個相互獨立的系統,若我們只考慮A系統的安全,那麼,B系統是否安全就應該完全忽略。

談到安全的概念,很多讀者會立刻想到危害安全的黑客。如果說安全的核心是對抗,那麼在對抗的兩個主角(攻方與守方)中,攻方(黑客)又是第一主角,原因在於守方(紅客)是因攻方(黑客)而誕生的。

廣義地說,系統(或組織)的破壞者都統稱為“黑客”,他們以擾亂既有秩序為目的。

人們開發軟體、研製資訊產品、建設網路系統時,肯定都希望安全第一。但是,“理想很豐滿,現實很骨感”,任何系統都不可能絕對安全,其安全性也無法事先嚴格證明,只能由實踐來檢驗。無論多麼認真,無論花費多少時間和精力,只要是人造的東西,就一定會有安全缺陷;而且,這些缺陷有時還很難被發現。怎麼辦呢?當然只好由專門檢測人員,利用特製工具,來挖掘、修補和處理這些潛在的缺陷。

除了帶工資外,從純技術角度看,這些檢測人員與黑客其實沒啥區別;而且,他們顯然都是絕不可少的,因為,“帶著缺陷執行的系統”更危險、更可怕。從這個角度看,黑客的產生也是不可避免的。因為,即使是經過高階專門人員檢測後,也還會遺留一些未被發現的缺陷,於是,社會上便出現了一批“志願者”,他們不分晝夜,不辭辛勞,對這些系統反覆進行地毯式搜尋,希望找到更多的漏洞去換錢,或以此證明自己的能力。這批“志願者”就俗稱黑客。

電腦由硬體和軟體兩部分組成,前者決定了它的體力,後者決定了它的智力。軟體的具體表現形式,其實就是稱作程式碼的東西,它們不過只是一些邏輯命令而已,讓電腦第一步這樣,第二步那樣,等等。電腦也很聽話,指令讓它幹什麼,它就幹什麼;讓它做好事,它就做好事;讓它做壞事,它就做壞事;甚至讓它自殺,它也會毫不猶豫地遵令行事。

雖然人類一廂情願地,將做好事的程式碼稱為善意程式碼,簡稱為程式碼;將做壞事的程式碼稱為惡意程式碼,但是,從電腦角度來看,它們都是程式碼,都是應該一視同仁地執行的命令。

僅僅從程式碼的角度來看,編寫惡意程式碼更容易,編寫善意程式碼更難,因為,善意程式碼的目標是要把某些工作做成,而惡意程式碼則是要把這些工作搞砸;而普遍規律是:敗事容易,成事難。惡意程式碼是一個龐大的家族,甚至已經形成了一個個黑色部落。比如病毒、蠕蟲、殭屍、木馬等,都是典型的惡意程式碼的代表。

計算機病毒能夠像寄生蟲那樣,把自己附著在各種型別的檔案上,當檔案被複制或在網上傳播時,病毒也就隨同檔案一起快速蔓延。由於其獨特的複製能力,而且還很難從正常檔案中被切割,所以病毒對資源的消耗和破壞能力都很強,並且不易根除。

蠕蟲病毒既可無限再生,又可迅速傳播。蠕蟲病毒是能夠獨立作戰的“自包含程式”,它能將其自身功能的全部或部分,傳染到網上的其他終端。蠕蟲主要包括主機蠕蟲和網路蠕蟲,前者完全包含在其執行的主機中,並且通過網路將自身拷貝到其他終端。一旦它完成拷貝動作後,就會自殺,讓其克隆物繼續作惡;因此,在任何時刻,都只有一個蠕蟲拷貝在執行。

殭屍病毒通過“網際網路中繼聊天伺服器(IRC)”來控制一大群計算機;此時這些所謂的“計算機”已經失去了獨立的行動能力,而只能聽由“趕屍者”,即黑客指揮。目前,殭屍已經成為網際網路上黑客最青睞的作案工具之一了。針對手機使用者,殭屍的攻擊更加傳奇。輕者,其手機被莫名扣費、朋友被廣告簡訊深夜騷擾;重者,存款泡湯、為害八方。手機殭屍的擴散特點很像傳銷組織,一級感染一級,時間越長,被感染和控制的手機也就越多,呈指數級爆炸型增長。而且,它還在不斷變異。有些變異後,竟然能夠在關機或鎖定的情況下,讓手機仍然自動傳送資訊;甚至,還能反過來將“試圖消滅它的防毒軟體”殺死。

木馬病毒通過特定程式(木馬程式)來控制另一臺計算機,它不會自我繁殖,也並不刻意感染其他檔案,相反它要儘量偽裝自己,別引起外界的注意,讓人在不知不覺中將其植入自己的電腦,使其成為“被控制端”。待到衝鋒號響起後,黑客在控制端發出命令,木馬就開始行動,或毀壞被控制端,或從中竊取任何檔案、增加口令,或瀏覽、移動、複製、刪除、修改登錄檔和計算機配置等。木馬病毒一旦啟動,就很難被阻止,因為,它會將自己載入到核心軟體中,系統每次啟用,它就自動開始執行;幹完壞事後,它還會立刻隱形(自動變更檔名),或馬上將自身複製到其他資料夾中,還可以不經使用者准許就偷偷獲得使用權。

◆風險防禦建議

大資料時代背景下,針對過去已經遺留在網上的海量碎片資訊,如何進行隱私保護呢?如果單靠技術,顯然無能為力,甚至會越“保護”就越“洩露隱私”,因此,必須多管齊下。比如,從法律上,禁止以“人肉搜尋”為目的的大資料探勘行為;增加“網民的被遺忘權”等法律條款,即,網民有權要求相關網路刪除“與自己直接相關的資訊碎片”。從管理角度,也可以採取措施,對一些惡意的大資料行為進行發現、監督和管控。另外,在必要的時候,還需要重塑“隱私”概念,因為,畢竟“隱私”本身就是一個與時間、地點、民族、宗教、文化等有關的東西,在某種意義上也是一種約定俗成的東西。

針對今後的網路行為,應該如何來保護自己的隱私,至少不要把過多的沒必要的碎片資訊遺留在網上呢?在這裡,我想提供一個很實用的策略,那就是:匿名!只要做好匿名工作,那麼,談論什麼“隱私洩露”,就是無本之木、無源之水了。匿名的重點包括:

身份匿名。任何緋聞或醜事兒,當大家並不知道你就是當事人時,請問你的隱私被洩露了嗎?當然沒有!沒準你還踮著腳、伸著長脖子往前擠,還想多看幾眼熱鬧呢!

屬性匿名。如果你覺得自己的某些屬性(比如,在哪裡工作、有啥愛好、病史記錄等)需要保密,那麼,請記住:打死也不要在網上釋出自己的這些訊息,甚至要有意避開與這些屬性相關的東西。這樣別人就很難對你順藤摸瓜了。關係匿名。如果你不想讓別人知道你與張三是朋友,那麼,最好在網上離張三遠一點兒,不要去關注與他相關的任何事情,更別與他搭訕。

位置匿名。這一點用不著我來教你了吧。至少別主動在社交媒體上隨時暴露自己的行蹤,好像生怕別人不知道“你現在正在某飯店吃飯”一樣。

概括一下,在大資料之前,隱私保護的哲學是:把“私”藏起來,而我的身份可公開。今後,大資料隱私保護的哲學將變成:把“私”公開(實際上是沒法不公開),而我的身份卻被藏起來,即匿名。

楊教授支招

對於我們普通的個人使用者,應該如何防範惡意程式碼呢?希望以下這幾招能對你有幫助。

1.永遠不要執行任何來歷不明的軟體或程式,除非您確信自己的防毒水平已登峰造極;

2.永遠不要相信你郵箱不會收到含有惡意程式碼的郵件;

3.用電郵給朋友發軟體時,記得叮囑對方先查毒,因為,在你電腦上不發作的病毒,沒準在朋友電腦上就復活了;

4.永遠不要因為對方是你的好朋友,就輕易執行他發過來的軟體或程式,因為你無法確信他是否安裝過病毒防火牆,也許你的朋友中了黑客程式還不知道,還以為是什麼好東西寄來與你分享呢;

5.千萬不要隨便留下你的個人資料,因為你永遠不會知道是否有人會處心積慮地收集起來,用於今後找你麻煩;

6.千萬不要輕易相信網路上認識的新朋友,因為“在網路上,沒有人會知道你是一隻狗”!你無法判斷,對方是否想把你當作實驗品。

面對各種各樣的黑客,我們更要注意保護自己,以下十點建議也許對你有益。

1.使用防毒軟體並經常升級,從而使惡意程式遠離你的計算機;

2.別允許網店儲存你的信用卡資料,哪怕是為了方便你今後購物;

3.設定口令時,請使用由數字和字母混排而成的、難以破譯的口令;

4.對不同的網站和程式,使用不同的口令,以防止被黑客破譯;

5.使用最新版本的瀏覽器、電子郵件和其他網路軟體;

6.別向可疑網站傳送信用卡卡號,留意瀏覽器底部資訊欄中顯示的掛鎖圖示或鑰匙圖示;

7.確認你要點選的網站地址正確無誤,別被黑客用“李鬼”釣了魚;

8.使用“對cookie程式有控制權”的安全程式;

9.如果你在用數字使用者專線或調變解調器連線因特網,請安裝防火牆軟體,並監視資料流動;

10.別輕易開啟電子郵件的附件,除非你確認資訊的來源安全。

在一個充滿陷阱的網路世界裡,要想保護自己,的確很不容易。請你時刻提醒自己:在某個角落裡,某些毫無道德的人,正在刺探你的漏洞,並利用它們來竊取你的敏感祕密。最後,我願將“世界頭號黑客”凱文·米特尼克親自總結的“反欺騙十大招”分享給讀者朋友們,希望你們不是下一位上當者!

1.備份資料,記住你的系統永遠不會是無懈可擊的,災難性的資料損失會發生在你身上,只需一條蠕蟲或一隻木馬就已足夠;

2.選擇很難猜的口令,不要隨意填上幾個與你有關的數字當作口令,在任何情況下,都要及時修改預設口令;

3.記得安裝防毒軟體,並讓它及時更新升級;

4.及時更新作業系統,時刻留意軟體製造商釋出的各種補丁,並及時安裝應用;

5.不用電腦時,千萬別忘了斷開網線和電源;

6.在瀏覽器中會出現一些黑客釣魚,對此要保持清醒,拒絕點選,同時將電子郵件客戶端的自動指令碼功能關閉;

7.在傳送敏感郵件時要加密,也可用加密軟體保護你的硬碟資料;

8.安裝一個或幾個反間諜程式,並且要經常執行檢查;

9.使用個人防火牆並正確設定它,阻止其他計算機、網路和網址與你的計算機建立連線,指定哪些程式可以自動連線到網路;

10.關閉所有你不使用的系統服務,特別是那些可以讓別人遠端控制你的計算機的服務,如RemoteDesktop、RealVNC和NetBIOS等。

本文出處:暢享網
本文來自雲棲社群合作伙伴暢享網,瞭解相關資訊可以關注vsharing.com網站。


相關文章