AI新貴上位記:圖網路是怎麼火起來的?
誰是2018年AI圈最靚的仔?
這頂“桂冠”只有兩位候選人:俗話說,前端能打看BERT,底層深度看圖網路。
其實並沒有這句俗話……但是BERT和圖網路在今天的AI界並駕齊驅,堪稱被討論最多的兩種技術,這一點是毫無疑問的。
谷歌的BERT作為一種演算法模型,在語言任務上展現出了不講道理的應用效果,熠熠奪目自然很容易理解。
但另一個最近大家聽到很多次的詞,圖網路,可能就沒那麼容易理解了。相比某種演算法,圖網路更像是一個學術思考下若干種技術解決思路的集合,非常抽象和底層。它的價值到底在哪?為什麼甚至能被抬高到“深度學習的救星”這種程度?
我們發現,目前關於圖網路的解釋,大多都是從論文出發。非技術背景的讀者可能會看得有點暈。所以這裡想用一些“大白話”,來描述一下:風口浪尖上的圖網路,究竟有什麼秘密?
想讓自己在AI圈潮酷起來嗎?聊Graph和GNN吧
所謂圖網路,並不是指有圖片的網站……而是指基於圖(Graph)資料進行工作的神經網路。
Graph,翻譯成“圖”,或者“圖譜”。這是一個數學概念,指由頂點(nodes)和邊(edges)構成的一種數學關係。後來這個概念引申到了電腦科學中,成為了一種重要的資料形式,用來表示單元間相互有聯絡的資料網路。
此外,這個概念還引申到了生物學、社會科學和歷史學等無數學科,甚至變成了我們生活中的常見概念。在警匪片裡,警局或者偵探辦公室的牆上,往往掛著罪犯的關係網路圖,這大概是我們生活中最常見的Graph。
回到電腦科學領域,圖資料和基於圖的分析,廣泛應用於各種分類、鏈路、聚類任務裡。人工智慧領域有個重要的分支,叫做知識圖譜。基本邏輯就是將知識進行Graph化,從而在我們尋找知識時,可以依據圖譜關係進行追蹤和定位。比如我們在搜尋引擎中搜某個名人時,相關推薦會跳出來跟這個人字面意義上無關的其他人。這就是知識圖譜在起作用。
那麼圖網路是怎麼搞出來的呢?
大家可能知道這樣一個“唱衰AI”的小故事:用機器視覺技術,AI今天可以很輕鬆識別出來一張照片上的幾張人臉。但它無法像真人一樣,一眼看出來圖上是朋友、戀人還是家庭聚會。
換句話說,一般意義上AI無法獲得和增強用人類常識去進行邏輯推理的能力。很多人以此判斷,今天的AI並不怎麼智慧。
AI科學家們琢磨了一下,表示這事兒有辦法搞定。
如果把圖/圖譜作為AI的一部分,將深度學習帶來的學習能力,和圖譜代表的邏輯關係結合起來,是不是就好很多?
事實上,Graph+Deeplearning並不是一個全新概念。最早在2009年,就有研究提出了二者的結合。近幾年這個領域陸續在有研究出來。對於這個組合產物,學術界有人稱之為圖卷積網路(GCN),也有人稱呼其為圖神經網路(GNN)或者圖網路(GN,Graph Networks),其技術內涵和命名思路也各不相同。這裡暫且使用圖網路這個籠統稱呼。
圖網路作為一種新的AI研究思路,之所以能夠在2018年被點燃,很大程度還是號稱AI扛把子的DeepMind的功勞。
在火種丟擲、全球跟進以及反覆爭論之後,圖網路變成了AI學術圈最靚仔的那個關鍵詞。今天大有一種,聊深度學習不說圖網路就很low的感覺……
從識別小能手到推理專家:AI新貴求職記
有種論調是這麼說的:深度學習已死,圖網路才是未來。
這句話怎麼琢磨都有問題。因為從圖網路在去年被“翻新”出來那一刻,它在本質上還是對流行的多層神經網路的一種補充。
讓我們來打個比方,看一下跟傳統深度學習相比,圖網路應該是如何工作的。
舉個例子,假如我們想讓教育我們的孩子,讓他認識新來的鄰居一家人。我們應該怎麼辦呢?可以選擇給他講,隔壁新來了某個小朋友,他爸爸是誰媽媽是誰。但是這樣不直觀,孩子很容易記不住。而更快的方式或許是拿著照片給他看,告訴他照片上的人都是什麼關係。而在這個工作之前,其實我們已經完成了一個先覺條件:我們已經告訴過孩子,爸爸媽媽爺爺奶奶這些稱呼,分別指代的是什麼意思。他理解這些“邊”,然後再代入新鄰居一家人具體的樣貌性格交談作為“頂點”,最終構成了對鄰居一家這個“圖”的網路化認識。
而我們在用深度學習教導AI時,往往是省略掉第一步。直接給出大量照片和語音文字資料進行訓練,強迫AI去“記住”這一家人的關係。然而在AI缺乏對家庭關係的基本常識情況下,它到底能不能記住,是怎麼記住的,會不會出現偏差,其實我們都是不知道的。
某種程度上,這就是深度學習的黑箱性來源之一。
所以圖網路的思路是,首先讓AI構建一個“圖”資料,先理解爸爸媽媽這一類關係的含義,再去學習具體的家庭資料。這樣AI就可以依靠已經積累的節點間的訊息傳遞性,來自己推理下一個要認識的家庭究竟誰是爸爸誰是兒子。
這也就意味著,圖網路某種程度上有了自己推理的能力。如果將這種能力推而廣之,AI就將可能在非常複雜的聯絡和推理中完成智慧工作。
前面說了,這個領域的工作其實一直沒有停止。但是之所以沒有廣泛流行,一方面是因為這個領域相對小眾,缺少重磅研究來引發大家的關注;另一方面也是因為看不見摸不著,缺少開源模型來檢驗理論的正誤。
去年6月,DeepMind聯合谷歌大腦、麻省理工等機構的27位學者,共同發表了關於圖網路的論文《Relational inductive biases, deep learning, and graph networks.》,接著開源了相關的演算法包GraphNet。
這篇文章中,DeepMind不僅提出了新的演算法模型,希望能用圖網路實現端到端的學習;同時也總結歸納了此前圖網路各個流派的研究方法,並將其在新演算法上進行了融合。
在這個有點承上啟下意味的研究出來後,大量關於圖網路的綜述、應用檢驗,以及新演算法的探討開始在學術界萌生。隨著全球AI圈的共同發力,這門AI技術新貴正在嘗試走向臺前。
圖網路,到底有什麼用?
這個問題或許可以分遠近兩方面看。
近的方面,有一些AI要面對的任務,天然就屬於圖結構資料。因此用圖網路來學習和處理可謂事半功倍。比如說社交網路、智慧推薦、化學分子預測、知識圖譜等領域,都被證明可以廣泛應用圖網路技術來提升智慧化效率,降低算力消耗。
而在非結構化資料,比如語音、文字、圖片等場景,圖網路可以用來提取結構化資訊。比如在圖片中更好地識別家庭成員關係,認識圖片中正在發生的行為等等。此外,圖網路還能為資料的最佳化組合提供更加智慧化的應用。
而從長遠方面看,圖網路是對圖譜技術和深度學習技術兩個技術領域的融合與再擴充。這不僅讓沉睡已久的,AI中的知識表示流派具備了復活的潛力。更重要的因素在於,圖網路可能讓深度學習開啟因果推理這扇大門。
具體一點,作為一種底層邏輯上的更新,圖網路似乎可以起到對深度學習幾個原生缺點的彌補:
1、增強AI可解釋性。
“臭名昭著”的深度學習黑箱,來自於大量非結構資料輸入之後,演算法進行歸納的邏輯無從掌握。而圖網路可以操作知識的歸納邏輯,看出行為的因果關係,顯然對是黑箱性的一次突破。
2、減少“人工智障”式的視覺錯判。
在機器視覺領域,AI另一個廣為人知的問題,就是對對抗攻擊的低抵抗力。比如AI本來已經認識這是鳥了,結果照片上沾一個黑點,它又不認識了。這個問題來自於AI本身識別的是畫素,而不是物體概念本身。圖網路如果將物體關係帶入其中,或許會讓AI的視覺判斷力更像人類。
3、小樣本學習的可能性。
深度學習的另一個問題,就是很多演算法必須經歷超大規模訓練來提升精度。而這也是對算力和資料的暴力消耗。如果能讓AI具備邏輯上的遷移可能,那麼具備人類常識的AI,將可以在很小的資料樣本中完成相對複雜的工作。
4、向著通用智慧的一小步。
我們知道,AI今天的主要能力是識別和理解,而推理是其若想。假如圖網路彌補了這一弱勢,是否意味著AI將從單體智慧向通用智慧走上一步呢?
這麼多價值的圖網路,顯然想不火都難。2019年,或許將是圖網路放出更多光芒的一年。
然而也別太樂觀,這個更多光芒完全是個相對值!雖然今天很多聲音高調吹捧圖網路的價值,但要看到,圖網路並不是AI的萬能解決方案。
心頭一動,道阻且長:如何看待圖網路的發展現狀?
雖然今天產業端對於圖網路的應用還沒有怎麼被提及,但就我所接觸過的AI學術界人士,確實普遍對圖網路報以非常強烈的興趣。
當然了,對圖網路的爭議今天也普遍存在。整體而言,對它的整體評價分為了三個流派:
1、悲觀派。有一種觀點認為,圖網路無非是對深度學習劣根性打的一個補丁,屬於深度學習走不下去了,打算繞繞路。而且這個補丁並沒有被證明有效。今天還只是停留在概念和淺層實驗階段。
2、客觀派認為,圖網路是深度學習發展的必然趨勢和重要補充,恰恰證明了AI作為一種底層技術正在不斷髮展成長,擴充自己的邊界。不管圖網路是不是真的能做到暢想的一切,至少證明了深度學習體系在今天是有發展能力的。
3樂觀派則提出,圖網路的關鍵意義,是讓AI能夠獲取常識和推理能力,這種能力顯然是人類智慧的一個重要代表。我們一直期待的AI走向通用化的強人工智慧,會不會就從圖網路開始呢?在他們看來,圖網路是關乎於AI去往下一個時代的關鍵開關。
到底哪一派更接近未來的真相呢?可能就交給諸位和未來一起檢驗吧。
總體而言,圖網路是一種對今天流行的AI體系,從技術思想,到技術邏輯的一次重要修補和升級。它在某種程度上是一個未來,但今天還缺乏實踐檢驗和有效工作。
在實踐中,圖網路的限制還非常多。比如其表示能力不足,無法承擔太複雜的圖結構資料。並且對計算複雜度要求很高,對今天的計算架構又提出了新的挑戰。
而且圖網路主要解決的是AI對結構化資料的處理,而在動態資料、大規模資料、非結構化資料等領域,圖網路的作為依舊有限。
再一個,雖然AI是一個高度產學一體化的學科,從前瞻性研究到技術實踐的週期已經被大大縮短。然而要客觀看到,二者並不是無縫對接的,從演算法理論提出到實際應用,還是會有一個比較長的蟄伏期。我們不能指望去年的AI學術明星,今年就走進千家萬戶。
總之呢,這是個讓人動心的技術,但今天還僅僅是發現了藏寶圖。真正的寶藏,大概還在千山萬水之外。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2640974/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 網際網路是怎麼連起來的?一文讀懂網路5層結構模型模型
- 網際網路新貴向支付寶、微信支付發起挑戰
- 新火種AI|比爾蓋茲:人工智慧的未來是AI AgentAI人工智慧
- 深度學習已入末路,AI未來是圖網路深度學習AI
- 新火種AI | 誰是AI時代的“抖音”?AI
- 新火種AI | 三季度營收344億,AI撐得起百度的“未來”嗎?AI營收
- 2020,AI演算法市場能火起來嗎?AI演算法
- Python是如何火起來的 為何發展如此迅速Python
- 《明日方舟》為什麼可以火起來
- HttpRunner3的用例是怎麼執行起來的HTTP
- 半年漲粉1000萬,這個AI聊天搭子是怎麼火的AI
- 網路不可用怎麼辦?無法訪問網際網路怎麼辦?網路故障原因大起底
- 神經網路是怎麼“看”東西的?啟用圖告訴你神經網路
- 《網路是怎樣連線的》讀書筆記筆記
- 美團上位,網際網路再無BATBAT
- 為什麼移動辦公APP火不起來APP
- 灰豚AI數字人興起,AI數字人直播將成網際網路新寵兒!AI
- 網路安全的學習方向和路線是怎麼樣的?
- 《網路是怎麼樣連線的》讀書筆記 - 認識網路基礎概念(一)筆記
- 新火種AI | 市場規模200億,短劇未來靠AI?AI
- 讀書筆記之《網路是怎樣連線的》筆記
- 《網路是怎樣連線的》讀書筆記一筆記
- 菜鳥學網路——HTTPS是怎麼實現的?HTTP
- 和超3萬玩家一起擠在安防市場,AI技術公司是滄海一粟還是收割新貴?AI
- Secureworks 威脅評分迎來網路安全 AI 新時代AI
- 【機器學習】李宏毅——類神經網路訓練不起來怎麼辦機器學習神經網路
- 資料中心網路技術新貴:VXLAN與園區網路虛擬化
- 火幣網是用什麼記住使用者登入狀態的?
- AI儲存的需求是什麼?未來趨勢是怎樣的?AI
- 新火種AI | 馬斯克的AI大模型來了!其他AI不能回答的問題,它能回答嗎?AI馬斯克大模型
- 網路安全宣傳週來了,網路安全防線怎麼築?
- 為什麼說雲端計算運維是新“貴”?運維
- Serverless這麼火,來看看雲開發在Serverless方面取得了怎樣的新成果?Server
- win10網路id是灰色的怎麼解決_win10網路id灰色按不了怎麼辦Win10
- 新火種AI|未來幾年,哪些行業會因為AI而失業?AI行業
- DV SSL證書是怎麼誕生的?一起來了解一下
- win10怎麼顯示網路連線圖示 win10電腦沒有網路圖示怎麼辦Win10
- 什麼型別是未來的方向呢?從梳理遊戲新分類談起型別遊戲