人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的

天美妙妙屋發表於2021-09-29
人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
首發知乎“天美妙妙屋”
https://zhuanlan.zhihu.com/p/414832131

<天美妙妙屋>是天美遊戲工作室群內部由遊戲策劃、運營和熱愛遊戲的朋友組成的非官方組織,都是有感而發的遊戲及產業研究,並不構成遊戲開發及投資建議。

19世紀初,英國數學家查爾斯·巴貝奇發明了一種叫做「分析機」(Analytical Engine)的可程式設計裝置,儘管最終沒有建造完成,但它的設計邏輯、輸入和輸出概念、支援的程式語句已經具備了電子通用計算機的特性。也難怪被稱為世界上第一個程式設計師的愛達·勒芙蕾絲預言,這臺機器可以創作出具有無限寬度和深度的科學樂章。

一個多世紀後的1956年,學者們就在樂章上寫下了濃重一筆,他們在達特茅斯學院敲定了「人工智慧」的名字和研究方向,為製造、農業和教育等領域的科技革命和產業變革帶來了新的驅動力。

不過一個有趣的事實是,雖然很多人習慣用「高精尖內容」給這個概念做包裝,但人工智慧在計算機領域的最早實踐,有一條路線卻是通過特別接地氣的電子遊戲來實現的,就連大名鼎鼎的「人工智慧之父」艾倫·圖靈也有參與。

所以本文的基調並不是強行去講晦澀難懂的技術,還是讓我們從一些不太有人提及的故事開始吧。

老古董上的人工智慧

可能眾所周知的是,上世紀40年代的計算機數量非常少,很大程度上只能在大學、大型企業和國家政府的研究實驗室中看到,而且這些裝置對應的功能非常有限,不僅很難重新程式設計,大多數也缺乏執行儲存程式的能力。

什麼,你說要是想換個功能怎麼辦?那就把機器給拆了重新造……

因此,即使是學者覺得遊戲對工作有幫助,也幾乎沒什麼實踐的機會。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
1940年代由英國工程師設計的計算機「巨像」,作用純粹是破解納粹的密碼

直到又過了將近10年時間,計算機可以執行的任務開始變得多樣起來,圍繞人工智慧進行更多實踐,讓公眾認識到這些裝置的巨大潛力,才成為當時很多研究人員的目標。可想而知,一旦某件事情要面對公眾來做文章,遊戲就變成了最合適的宣傳載體。

1950年,加拿大國家博覽會上出現了一臺名為《大腦伯蒂》(Bertie the Brain)的井字棋遊戲,機器有四米高,垂直的大螢幕由電燈組成。玩法很簡單,人類和計算機相繼在九宮佈局的棋盤上行棋,後者會有一個短暫思考的過程,然後根據當前的局面落子。因為最高難度下人類很難取勝,它有時會被認為是人工智慧最早在大眾領域的應用。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
藝人丹尼·凱耶在加拿大國家博覽會上慶祝戰勝「大腦伯蒂」

最初造這臺機器的目的,是加拿大工程師約瑟夫·凱特(Josef Kates)為了宣傳他發明的「加法管」(Additron tube),以尋找潛在的投資人。這是一種比傳統真空管更輕的電子管(雖然也更耗電),原本打算應用於多倫多大學的電子計算機(UTEC)上,但因為申請專利的過程太漫長,到1957年被美國批准時效能更強勁的電晶體都開始普及了,最終不了了之。

所以雖然《大腦伯蒂》在展出期間很受歡迎,很多人排長隊都要玩上一把,它和喜劇演員丹尼·凱耶(Danny Kaye)的合照甚至還登上了著名雜誌的專題,但它還是失去了進一步推廣的機會,展後就被拆除了。凱特此後也沒有選擇在人工智慧領域深造,而是跑去設計了世界上第一個自動交通訊號系統。

不過所謂西邊不亮東邊亮,恰好也是在1950年,英國物理學家克里斯多福·斯特雷奇(Christopher Strachey)萌生了一個基於人工智慧創造棋類遊戲的想法。

物質基礎是,他有機會接觸到英國國家物理實驗室的試驗計算機(Pilot ACE Computer);而理論基礎,則來自《企鵝科學新聞》(Penguin Science News)上一篇同行的文章:《井字棋理論》(A Theory of Chess and Naughts and Crosses)。

斯特雷奇在1951年5月嘗試製作了《西洋跳棋》的最初版本,並於7月首次在ACE上執行,但因為程式錯誤而以失敗告終。

幸運的是,沒過幾天他就在曼徹斯特大學參觀Ferranti Mark 1期間遇到了圖靈,後者才剛剛寫完這臺機器的《程式設計師手冊》。圖靈聽聞其遭遇後,慫恿他在Ferranti Mark 1上再幹一次,沒想到這回倒是成功了。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
計算機Ferranti Mark 1和《西洋跳棋》

斯特雷奇《西洋跳棋》的重要性遠超出遊戲行業的範疇,它或許是第一個以科研為目的展示的人工智慧程式。

值得一提的是,人工智慧全面進入大眾視野正是以此為契機的。因為在1952年7月做完遊戲後,斯特雷奇就拿著該案例在多倫多的某個會議上講了一課,讓當時還在IBM工作的電氣工程師亞瑟·塞繆爾(Arthur Samuel)備受鼓舞。

塞繆爾和其它學者有所不同,很擅長把複雜的技術以容易理解的方式講出來,他認為教計算機玩遊戲有助於研究具有普遍意義的開發策略,其中跳棋非常適合,規則簡單又有策略性。所以在1952年底,塞繆爾在IBM的第一臺商用計算機701上創造了一個初版的跳棋遊戲。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
正在測試跳棋程式的塞繆爾

由計算機扮演的棋手被他賦予了一種能力,可以綜合考慮每邊棋子的數量以及棋子與「國王」之間的距離。它在接下來的幾年中又得到了進化,到1955年時已經變得能夠分析每局的過程並從失敗中成長。由於該程式一度登上美國國家電視臺的節目,讓民眾看到了硬體和程式設計技術的進步,瞬間引發轟動,IBM的股票受此影響一夜之間漲了15個百分點。

塞繆爾後來又在1959年的文件中推廣了「機器學習」的說法,比起《大腦伯蒂》和《西洋跳棋》死板的程式行為表現,他的跳棋能夠自我學習,可以說是真正意義上現代人工智慧概念的鼻祖之一。

但必須得承認的是,那個年代機器學習的速度並不快,在1966年舉行的世界跳棋錦標賽上,該程式輸給了兩名真正的專業選手,而從過去十多年中的戰績來看,它也只達到了業餘棋手的水平。

不過更重要的是,遊戲事實上成為了最早輔助人工智慧應用和開啟民眾對計算機認知的工具之一,自此之後一直被認為是評價人工智慧行業進展的標準,如今也反饋到實體經濟和社會工程的援助上。

電子遊戲的魔力

遊戲中的人工智慧現在發展到什麼程度了?其實可以從2016年育碧成立的研究分部 「La Forge」看出一點端倪。這是一個由開發人員和院校學者組成的團隊,著手領域主要是人工智慧和機器學習,並不直接參與遊戲開發,而是利用遊戲的現成資源來補足研究中的空缺。

例如測試自動駕駛系統用真實場地的成本太高,那就在已經構建好的開放世界裡跑上幾圈,遊戲裡車輛和NPC的人工智慧剛好可以作為干擾項拿來應用。

個人印象最深的,是2020年穀歌DeepMind、布朗大學和英偉達組織的一場研討會,方向是討論強化學習(Reinforcement Learning)如何在真實環境下運用。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
DeepMind曾經用人工智慧預測蛋白質結構(AlphaFold)和打《星際爭霸2》(AlphaStar)

籠統的看,強化學習是一種基於「獎勵期望行為」和「懲罰不期望行為」的機器學習訓練方法。La Forge當時提到了一個主題,正是利用強化學習來輔助地圖導航。

因為以往遊戲場景的複雜度不高,開發者用導航網格(NavMesh)應付得過來,但現在的遊戲裡充滿了鉤爪、噴氣揹包、瞬間移動和二段跳這些東西,用NavMesh來做會變得非常麻煩,需要手動指定每個單獨的連結,所以作為一種替代方法,可以讓系統來處理導航操作。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
傳統導航網格的邏輯

而他們丟擲的解決方案如下:

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的

作為輸入,代理將接收到一個本地世界檢視,其中包含2D深度圖、3D佔用圖,當前目標位置以及其它一些基本狀態(如當前速度和加速度),然後這些輸入通過前饋、卷積神經網路和LSTM(長短期記憶)的處理後生成一些預測路線,輸出到策略和價值網路,接著用Soft-Actor Critic(一種演算法,可以直接應用於真實的機器人)進行訓練。這種方法在育碧蒙特利爾開發的《超獵都市》中執行得非常好,在點對點的導航中至少有90%的準確率。

實際生活中,我們知道地圖導航在「大路」上已經比較精確了,但要是你走個小路、上個天橋或是往樓裡一鑽,它就未必那麼好用了。而除了遊戲之外,La Forge也在測試強化學習的導航方法如何儘可能泛用,它在實際生活中應該也是很有潛力的。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
育碧La Forge的深度強化學習導航示例

遊戲結合人工智慧和機器學習的例子還有不少,以Metacritic媒體均分90、拿過十幾個獎項的模擬遊戲《黑與白》為例,它的核心玩法恰恰是基於玩家行為,來影響人工智慧的成長過程。

具體來說,你扮演一位神,通過點選螢幕與人類和生物進行互動。要是某隻生物做了玩家不願意看到的事情,那就打它一巴掌,反之則摸一摸。久而久之這種生物會記住你對各種行為的反應,逐漸改變行為,執行更復雜的功能。幾乎每個行動都會影響遊戲環境,你的追隨者可能建立明亮鮮豔的善神廟宇,也可能把神殿裝潢得令人生畏,以彰顯玩家的邪惡。

開發商獅頭工作室引入了美國哲學家邁克·布拉特曼(Michael Bratman)的理論,讓生物行為圍繞「信念-慾望-意圖」的模型呈現。

從開發的層面來看,各種世界物件的儲存資料作為「信念」,「慾望」是生物想要實現的目標,用簡化的感知器來表達。最後結合達成目標所需的行為樹,實現複雜的生物「意圖」。遊戲設計師彼得·莫力紐(Peter Molyneux)甚至一度想拿這套系統通過圖靈測試,雖然一直沒有成功。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
黑與白2

國內也有開發團隊進行過類似的嘗試,像是筆者稍有了解的天美工作室,前幾年做了款名叫《瘋狂貪吃蛇》的遊戲,其中就包含一種基於生物進化基本原理的人工智慧系統(中國專利號CN201710261467.5)。

大體邏輯是,在遊玩過程中,玩家行為會觸發一個生物種群進化的概率事件,類似於自然界中優勝劣汰的淘汰機制 —— 孱弱的敵方個體被消滅後,存活下來的生物和後代將越來越強。由於不需要使用複雜的狀態機,無需列舉大量事件邏輯,開發工作量會大幅降低。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
可以去專利局網站查詢專利號CN201710261467.5

現在一般遊戲中所說的人工智慧,在沒有加入機器學習前,是通過設定規則和列舉行為兩種方法實現的。所謂設定規則就是明確的一系列規則,給相關物件賦值,智慧物件就會按照規則限制的範圍開始行動,這些個體的行為基本都是可預測的。

而列舉行為就是把物件所有可能的行為都設想到,有點類似於窮舉法,人工設定好所有響應,由此各個行為分支就組成了一個樹形結構,或者使用狀態機來維護各個行為之間的觸發條件和切換邏輯。稍微想想也知道工作量非常大,要是考慮得不夠全面,玩家摸清楚規律便會發現是固定的機器行為。

前文提到的人工智慧先驅《大腦伯蒂》和《西洋跳棋》可能就存在這些問題,直到塞繆爾將機器學習融入遊戲後才往前跨出一步,La Forge、獅頭和天美以及更多的遊戲工作室在此基礎上繼續深化,使得相關內容更親民的同時,也有望援助演算法研究,讓一部分研究成果落地到實體經濟和其它的產業環境。

其實無論是人工智慧本身,還是一部分源自遊戲的機器學習成果,說它們反哺實體經濟會讓人覺得很「虛」。微軟亞洲研究院提到的一個觀點可能講出了原因,因為這些研究成果貼近經濟學家所說的「通用技術」,就和蒸汽機、內燃機和電力一樣。在我看來,由於和什麼領域都能聯絡起來,再加上有很多東西太術語化,比較前沿,不容易觸及大眾的實感。

但稍微搜一下就能找到不少應用案例。比如La Forge的執行官伊夫·雅基耶(Yves Jacquier)在2019年的GDC上提到,有些遊戲廠商收集了很多不同語言發音的嘴脣動畫資料,通過人工智慧可以讓虛擬角色自動對口型。同理也可以把大量動捕資料儲存,利用人工智慧自動匹配到某些場合,減少工作量,這些研究無疑可以跨行業去援助電影製作甚至機器人的設計。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
用人工智慧對口型在《刺客信條 奧德賽》裡也有應用

又比如,天美的生物進化專利也只是機器學習裡一種很特化的應用,還有更大的暢想空間。國網江蘇省電力在2020年的一份期刊裡提到—— 為了保證新一輪電改的順利進行,深度學習能從樣本資料中挖掘出歷史電價、社會因素等內外在因素與電價間的關係,可以考慮用這項技術去預測電價,幫助專家制定對策,這就和民生以及實體經濟的發展強相關了。

另外IBM的Watson系統還給輔助診療提供瞭解決方案,可以快速收集病症和病史,在人工智慧的幫助下,通過醫學圖譜和模型實現診斷決策,判斷患者得了什麼病。當然這只是給醫生提供參考意見,把病症的範圍縮小以加快確診時間,目的並不是取代人工。

人工智慧研究的萌芽年代,遊戲是怎麼成為開荒利器的
IBM Watson

我國對人工智慧的應用也是比較認可的,前幾年國務院就印發過通知,認為它在引導下可以給社會建設帶來新的機遇。為了加快建設創新型國家和世界科技強國,按照黨中央部署要求制定了一系列規劃,到2025年時希望我國人工智慧的基礎理論實現重大突破。

其中也有和遊戲相關的條目,例如實施全民智慧教育專案,在中小學階段設定人工智慧相關課程,鼓勵社會力量參與寓教於樂的程式設計教學軟體、遊戲的開發和推廣。

具體到資料,中國電腦科學家、中南大學教授蔡自興表示,2018年中國人工智慧產業產值預估達230億元人民幣,併為實體經濟帶來了1000多億元的增長。這和調研機構艾瑞諮詢的預測相符:到2022年,我國人工智慧賦能實體經濟市場規模將達到1573億人民幣。

如此來看,在人工智慧研究的萌芽年代,遊戲是作為開荒利器而存在的,如今它仍然是一件趁手的工具,愛達·勒芙蕾絲的預言現在還遠沒有走到終點。


原文:https://zhuanlan.zhihu.com/p/414832131

相關文章