像FIFA一樣踢球的AI,比打遊戲更強嗎?

遊資網發表於2019-08-26
所謂的“下一代AI”,核心還是彌補深度學習在理解能力、多模態仿生、應用價效比等方面的不足。
還記得被阿爾法狗支配的恐懼嗎?最新的“AI恐怖故事”,是谷歌教AI踢足球,打造“AI版貝克漢姆”。

其實,這個足球人工智慧研究專案Google Research Football,早在今年6月就出現在了谷歌報告上,而更早一些時間,就在Github上以開源的形式釋出了足球環境遊戲的測試版程式碼。

以谷歌“AI界頂流”的咖位,加上當今的資訊效率,現在才突然一波走紅,反射弧委實有點過長了。難道是媒體們集體不蹭熱點,改成冷飯熱炒了?

答案或許處在“下一代AI”這個充滿遐想的泛濫標題裡,用一個上古時期的網際網路話術來說,就是聽起來很性感。

此前在《星際爭霸》《DOTA2》裡超越人類電競隊伍的AI,都沒能獲此殊榮,踢個足球就引領未來,AI和AI的差別咋就這麼大呢?


這一代AI的上升空間還有多大?

大眾已經越來越明白,AI不能變魔術了。然而將時間倒回到2016年,相信絕大部分人都不會否認,擔心工作被AI替代,被機器人網紅索菲亞嚇得瑟瑟發抖,覺得《終結者》《黑客帝國》《西部世界》早晚要來,都是切身體會過的心路歷程。

傳統的“AI恐怖故事”宣告破產,一方面得益於各路技術大牛日積月累地科(懟)普(人),同時也跟建立在深度學習基礎上的技術上限有關。

比如建立在龐大的資料運算基礎上,訓練AI玩電子遊戲往往就需要花費數十萬美元;比如黑箱性,沒有一個深度學習結構(卷積、RNN、LSTM、GAN 等)可以解釋自己的決策,暗搓搓地搞歧視、罵人、發明新語種之類的事情層出不窮;再比如只會做“填空題”,面對需要引用常識、共識、推理等問題的時候就會表現的像個智障,容易被糊弄,比如將列印的人臉識別成真的,要麼就是智商不及預期,醫療診斷、機器人、自動駕駛等始終進展緩慢……一貫反骨的馬斯克,前不久就推出了基於計算機視覺感知的無人駕駛新方案。

總體來說,深度學習真正能成功做到的,還是在給定大量人為標註資料的情況下,實現兩個空間事物之間的對映。距離人們預想中的AGI強人工智慧真是“事倍功半”,極其遙遠。

所以,著名的“唱衰AI”專家 Filip Piekniewski聲稱將“AI寒冬”的鍋甩給了深度學習,雖然有些聳人聽聞,也未嘗不是指出了一個切實而嚴峻的問題——如果以深度學習為基礎的AI應用不再繼續提升,那麼相關產業走到“窮途末路”(尤其是那些to VC專案),也是早晚的事~

DL不是終極演算法,不妨繼續沉迷遊戲

既然都這樣了,那還怎麼做AI?理論上有兩個角度:一是深度學習的自我進化,在原有的基礎上引入新技術彌補一些先天不足;另一個則是尋找“備胎”,扶持AI領域的其他流派上位。

目前看來,科技企業也確實都極其渴盼變數出現,不過他們更青睞於做溫和的“改良派”。

以谷歌Football Engine為例,就讓智慧體藉助獎勵機制來自己get動態策略,從而學會規則與踢球技能(強化學習)。

像FIFA一樣踢球的AI,比打遊戲更強嗎?

不過,要稱之為“下一代AI”未免有點拔苗助長。

首先,“可玩性足球”(Gameplay Football)並沒有完全擺脫深度學習的窠臼。系統根據對手的實力不同,提出了簡單、終極、困難這三個版本的基準問題,其中簡單級別的比賽應用單一機器演算法,而困難級別則是由分散式深度學習演算法來處理的。

而且,系統所採用的訓練方式(即強化學習),與OpenAI Five在遊戲Dota 2中擊敗了世界級電子競技隊OG,deepmind在《魔獸爭霸》人機對戰中獲勝時所採用的訓練方式,並沒有本質上的區別,都是讓智慧體在複雜的即時戰略遊戲中學會與環境互動,並解決複雜的任務。

同時,作為機器學習的一個分支,強化學習之於AGI依然遙遠。深度學習三巨頭的Yann LeCun 和Hinton都認為,當前用來實現“人工智慧效果”的技術,對實現(真正的)人工智慧是行不通的。就像怎麼優化馬車的核心技術,也無法造出汽車一樣。

更何況,類似的彌補深度學習不足的機器學習方法還有很多。

比如小樣本學習、無監督學習就擺脫了對大規模資料集和人類專家監督的需求,提升自主訓練效率;元學習解決了深度學習訓練出的智慧體技能單一、缺乏常識的問題。深度學習大神Hinton在2015年還提出了一個黑科技——知識蒸餾(Knowledge Distillation),通過遷移知識,藉助訓練好的大模型得到更加適合推理的小模型,從而提升深度學習在大規模計算叢集上的訓練表現。

總而言之,所謂的“下一代AI”,核心還是彌補深度學習在理解能力、多模態仿生、應用價效比等方面的不足。作為過渡型方案,這種“深度學習+”估計還會持續很長時間。不過距離真正實現AGI的預期,依然相去甚遠。

追尋下一代AI,或許要走向更寬廣的技術海域

今日我們看到的大多數AI產品思路,都是以DL(Deep Learning) + GOFAI (Good Old Fashioned AI) 的模式建立起來的。也就是將深度學習與其他演算法相結合,讓“AI”走向千行萬業。

不過也有不少科學家是徹底的“革命派”,想了不少幫助AI的新辦法,其中或許也隱藏著破局的可行性。

比如Hinton就試圖通過膠囊網路Capsule Networks來顛覆傳統的深度學習演算法,用神經元向量代替傳統神經網路的單個神經元節點,讓不同的神經元攜帶不同屬性的資訊傳導到下一層運算,已經證明可以像人類的視覺系統一樣,自動將學到的知識推廣到不同的新場景中,這被認為是未來讓AI被賦予常識推理的關鍵技術。

還有的專家堅持基於邏輯規則的符號系統能夠實現AI推理,一些學者和創業公司就正在用Prolog(一種基於符號學的程式語言)開發新工具。理論上可以通過非常少的資料來進行訓練,自己處理事實和概念,然後自動生成事實推論。

但總體而言,其他分支的AI流派想要撼動“深度學習2.0”的主流地位,仍然比較困難。除了產業端正在大舉投入對深度學習及衍生技術的應用之外,美國國防高階研究計劃局DARPA甚至籌備了一個名為“機器常識(Machine Common Sense)”的計劃,旨在推進和分享模擬人類常識性推理的技術創意,總投資預計約為6000萬美元。

像FIFA一樣踢球的AI,比打遊戲更強嗎?

作為標杆的深度學習及延伸技術,其商業化潛力,即使“靠山吃山”,也有數年的好光景可以期待。但必須承認,面對其自身的瓶頸,大眾的腎上腺素與技術期待也開始迴歸正常值,甚至有點審美疲勞。技術專家們再不搞個大事件,熱愛“AI鬼故事”的科技編輯們都要被逼禿頭了……

值得探索的下一代產業AI方向會在哪裡,恐怕與我們的現有認知都相去甚遠。畢竟世界上每一次巨大的變革,總是開始於某一些被忽視的技術角落。除了繼續挑戰技術的穹頂,谷歌們似乎別無選擇。

來源:腦極體


相關文章