圖靈獎獲得者:大資料、AI、網路安全將是改變世界的“三大元素”

dicksonjyl560101發表於2019-07-01

https://www.toutiao.com/a6695332447397085707/


“我們已經見到的遠遠不是全部!”在2019數博會開幕式上,圖靈獎獲得者、美國電腦科學家惠特菲爾德·迪菲發表了極為精彩的主旨演講,用二戰盟軍破解德軍密碼的故事向世人剖析了人類歷史上從沒來沒有面臨過的雲時代偉大變遷,“我們整個社會正在走向雲端,雲將是未來社會的重心、它的核心、它的光芒,而大資料、AI人工智慧、網路安全這三要素,將是未來網路治理中的關鍵。”

圖靈獎獲得者:大資料、AI、網路安全將是改變世界的“三大元素”

圖靈獎獲得者、美國電腦科學家惠特菲爾德·迪菲

整個社會正在走向雲端

“今天我們所討論的一切,是5千年或者7千年以來我們一直都沒有做過的。”惠特菲爾德·迪菲說,此前人們是生活在自然世界中的,人們走在大地上,生活在最原始的建築結構裡,靠農耕來為生,但是幾千年前,人們搬進了城市,從這個時候開始,人們首次住在人造的環境當中,“現在我們又在這樣做,而且力度更大。我們整個社會正在走向雲端。”

在過去,城市可以控制一個大帝國,比如羅馬人想做的一切不能僅僅在羅馬城裡完成,而是要依靠其所控制的省邦。“同樣我們也可以設想一下雲社會、網際網路社會,它也是汲取廣泛存在的物理社會的資源,但是雲是它的重心、它的核心、它的光芒,而大資料、AI人工智慧、網路安全是最重要的三大要素。”惠特菲爾德·迪菲說。

計算為大資料而生

到底大資料是什麼?惠特菲爾德·迪菲解釋,這是人類所能夠處理的最大極的資料,所以它會隨著技術的變化而變化,但有一點是永恆的,就是大資料從現在開始會永遠與我們同在,而且不斷的變化。

所以,大資料是人們所能夠處理的最大的資料集,目的是幫助人類實現新的目標。

“在某種意義上,計算是為了大資料應運而生的。”惠特菲爾德·迪菲介紹,二戰要破解 密碼就需要處理當時人類無法自行處理的資料集,那個時候就有了百萬字元級別的資料量。

“大資料當時的三個屬性今天也絲毫沒有改變,分別是數量、多樣性、速度。當時有幾千個竊聽人員,而且很多都是女性,她們都被訓練得非常熟練,她們在聽電話、語音包括竊聽電報,歸根結底,這是各種通訊訊號,而且是包括多種語言,德語、英語、法語,而且是用不同的密碼,他能夠處理各種的語言資訊格式,而且每天甚至每小時都在變。”

“所以今天我們所傾注的資料屬性在二戰的時候,在計算機誕生的時候就已經有了,其資料量是10的15次方,或者是10的18次方這麼大。”惠特菲爾德·迪菲認為,相比過往,今天資料的多元、多樣性應該說是無限的,感測器可以捕捉到任何訊號並執行在網路上,以前一個小時之內資料可能不會有太大的變化,現在1秒鐘的幾分之一時間資料就會有巨大的變化。

AI的能力迭代:從取代行動到取代思考

惠特菲爾德·迪菲認為,大資料幾乎與網際網路同步開始產生商業價值。

大資料這個詞語從上世紀90年代開始流行,當時有了網際網路,全球資訊網可以誕生出大量的資料,大資料可以被所有人或者是為一小批人進行加工、抓取價值、盈利。

“大資料必須由感測器來獲取,在二戰當中就是幾千名竊聽人員;大資料還必須有足夠的儲存空間,當時又有紙質、磁帶、手寫記錄,今天我們所依賴的電子儲存裝置當時還沒有被髮明;在二戰結束之時,英國破解 密碼組織開發出了現在被認為是當代計算機的前身,它的速度是每秒5千字。”

儘管當時的電腦處理能力與現在天差地別,但惠特菲爾德·迪菲特別指出,AI技術在當時已經開始萌芽,並得到應用。

當時盟軍的密碼破解系統之所以能夠夠破解德國最高階的密碼系統,另外一個重要的要素是人工智慧。“我更加喜歡英國人的說法,它叫機器智慧。所謂機器智慧就是任何一種技術用機器來做之前,需要人才可以做得到的事情。”

那麼,哪些事情是人類曾經擅長的呢?最早的時候比如國際象棋,從上世紀60年代末就已經有了這樣的機器智慧,可以把終端擺到象棋比賽當中,在實時比賽當中跟人對弈。幾十年後,很快機器就超過了人,現在象棋已經是機器決勝的領域。後來,機器智慧又進軍到圍棋了。

“還記得60年代的時候,我們當時非常振奮,因為50年代喬姆斯基發明了深層語法,60年代我們非常希望結合他這個理論打造一種機器翻譯的軟體,能夠很好地把人類不同的語言做一個最好的轉換。後來很遺憾沒有能夠開發出好的分析系統,今天最好的系統也只是湊合能用,還不是特別好。”惠特菲爾德·迪菲回憶道。

“未來我想AI最重要的方面應該是機器可以就人們所無法思考的事情去思考。”惠特菲爾德·迪菲舉例,“比如說有個資料庫,裡面有幾萬億或者是萬萬億個維度,這是人類想不通的,人沒有辦法去想。我們只能想非常區域性的一些維度,但是機器可以直接理解這樣的大資料集。這個時候機器可能會有些行為,讓我們覺得非常意外,因為人類根本就不理解。再比如說有一個高維度數學可以證明一些命題,現在人類數學家是無法去求證的,未來我覺得會有些高維度的數學命題機器是可以求證的。”

“大浪淘金”的資料安全能力

最後,惠特菲爾德·迪菲強調了網路和資訊保安。“我將其成為‘可利用性’。”他說,“可利用性通常是各種系統的最高、最嚴肅的要求。你要旅行或者你辦理銀行業務的時候,如果突然系統中斷不可用,你可能會非常不高興;尤其是自動駕駛汽車,比如變成不可用了,把你甩到路邊溝裡去了,你肯定不高興。這是有危險的。”

“資訊的完整性、真實性同樣重要。”他說,“真實性說明你知道這個司機的資訊來自哪裡,不見得來自一個人,可能來自政府,這個資訊也可能來自一家公司,這個資訊可能來自任何地方。然後,你可以確信這個資訊是沒有被篡改過,沒有發生任何破壞和變樣的。同時,資訊也不總是需要保密,也就是說要保證只有一部分人能夠理解這些資訊,你傳輸的資訊或者你收到的資訊,溝通的資訊只有一部分人可以理解他。”

惠特菲爾德·迪菲進一步解釋,“值得說明的是真實性和保密性之間有一定關聯的。而違反保密,一個常見的攻擊方式是釣魚方式,看似真實的請求,電子郵件或者打電話要你的一些資訊,以這種方式來打破你的保密性,給到應該給到的人。”

“我個人希望人工智慧可以帶來新的思考方式,可以對計算機運算,對程式設計方面有新的思維,從而改變安全性。”惠特菲爾德·迪菲說,有一句話人們經常愛講,比錯誤還錯,就是垃圾進、垃圾出,所謂垃圾進、垃圾出,在大資料的場景下是大錯特錯,“大資料應該是垃圾進、黃金出。從垃圾當中能夠找到黃金。”

什麼是大資料的安全呢?惠特菲爾德·迪菲舉例,有三個最有價值的搜尋流量,一個是百度的,一個是Google的,另一個是亞馬遜的,這些流不是公開的,專門流向這三家公司,這三家公司嚴格保密,一方面是保護自身的利益,也是在保護使用者的保密性。通過搜尋流量,比如可以讓我們知道很多關於疾病發生的情況,哪些疾病在哪些地方更加常見,這三個公司的搜尋流量非常有價值。

“還有控制資料採集,未來很多資料採集的過程會變得比較公開。比如人臉識別技術,亞馬遜的人臉識別技術現在很值錢,但是他只會把結果給到某些人,但是經過一段時間以後,我想這種人臉識別技術可以用在自己的手機上,然後人們可以用它來識別人群中其他人的臉呢。這一天有可能很快就到來。”

“這個結果是什麼?是黃金,是含金量很高的礦石。控制它就好比控制任何有價值的資源一樣。大資料將是無所不在,將會影響一切,影響個人、影響政府,也會影響關鍵基礎設施。”惠特菲爾德·迪菲強調,“到現在為止,我們只看到小規模的關鍵基礎設施的失靈,但是大家設想一下,以後交通系統、電信系統不能中斷,它們的中斷會影響社會的平穩執行。這是 習 近 平主席的觀察,‘沒有網路安全就沒有國家安全’,國家如果不能在網路空間保護自己,那這個國家就是沒有國防的能力了。那有些人可能會說,那我們資訊不要放到線上?但是習主席也預見到了這一點,他說沒有資訊化就沒有現代化,增加數字化引入資訊科技這是未來的方向。”


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2649182/,如需轉載,請註明出處,否則將追究法律責任。

相關文章