AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

差評發表於2020-06-09
AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

不知道各位差友們玩的第一款遊戲是什麼呢?《 魂鬥羅 》、《 拳皇系列 》還是 1980 年面世的《 吃豆人 》?

不過大家即使沒有玩過也一定見過被困在藍色迷宮的的畫素風格開口小黃豆以及四個顏色各異的小精靈。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

在當時,《 吃豆人 》作為遊戲史上第一個擁有自己名字的遊戲角色,依靠簡單可愛的形象,虜獲了女性和兒童在內的各個層次年齡段的玩家,銷售額屢創新高,即使現在周邊產品也一直層出不窮。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

而今年作為《 吃豆人 》面世四十週年,整個網際網路都在舉辦各式各樣的慶祝活動!而英偉達作為一個 “ 豪橫 ” 的GPU大廠,也用獨特的方式參與了這場致敬活動!

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

在 5 月 22 日也就是《 吃豆人 》1980 年問世的同一天,英偉達公開了一款利用 AI 模型 GameGAN 復刻的完整版《 吃豆人 》遊戲,並宣佈在下半年開放此 AI 復刻版遊戲供玩家試玩。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

那麼完成這次復刻任務的核心 GameGAN 是一個什麼來頭呢?官方解釋為:GameGAN 是利用生成式對抗網路( GAN )模仿電腦遊戲引擎的一個神經網路模型,也就是一個可以通過 “ 我打我自己 ” 來自我提升的 AI。

要理解 GameGAN,就要先把 GAN 揪出來瞭解一下,傳統的深度學習模型我們可以大致分為兩類:生成模型( Generative Model )與判別模型( Discriminative Model )。

在 2014 年 Goodfellow 將生成模型與判別模型緊密結合,就形成了 GAN( Generative Adversarial Networks )

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

為了便於理解,我們可以將生成模型比作推銷員小 G,而判別模型可以比作用來識別並遮蔽垃圾推銷簡訊的攔截軟體小 D,小 G 的目的就是騙過攔截軟體小 D 將推銷資訊發給我們。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

小 D 的目標就是幫我們過濾識別並遮蔽垃圾簡訊傳送者小 G,當小 G 發現推銷資訊被遮蔽以後,他會吸取經驗,然後換一種口吻或者號碼再次傳送。

而小 D 也會通過學習不斷提升自己識別垃圾簡訊的能力。雙方會不斷重複這個相互競爭的學習過程,直到達到某種平衡。

完成這次出色復刻任務的 AI 模型:NVIDIA GameGAN,就屬於應用於遊戲領域的 GAN。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

而當 GameGAN 進行初始學習時,會對我們在遊戲中的行為進行記錄,並作出反應生成新的遊戲框架,同時通過使用不同的遊戲版本以及遊戲視訊進行訓練後,依靠著 GAN 的動態學習能力,GameGAN 可以不斷摸索遊戲內容與遊戲規則,甚至可以生成從未有過的遊戲關卡。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

總結來說,GameGAN 是首個利用 GAN 模擬計算機遊戲引擎的神經網路模型,通過上述的小 G 與小 D 兩個神經網路的相互競爭,在不需要知道遊戲底層的程式設計邏輯與開發規則的前提下,僅僅通過觀看了五萬個遊戲回合視訊,就自己 “ 山寨 ” 出了《 吃豆人 》。

整個自主學習過程主要由動態引擎、記憶模組以及渲染引擎三部分組成。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

我們可以將 GameGAN 的三部分理解成我們去買一塊蛋糕的過程!

動態引擎就是用來將眼睛所看到的蛋糕顏色、形狀等資訊傳送給大腦。

渲染引擎通過將眼睛看到的基礎資訊進行分析,例如紅色是櫻桃,黑色是巧克力,當然,紅色也有可能是葡萄。

記憶模組則負責將我們這次完整的購買過程進行記憶並儲存以供後續的學習進步。

整個自主學習過程就是我們通過與店員交流,不斷更新我們對蛋糕的瞭解,從最開始只對顏色形狀提出意見,到最後我們可以對材質、做工方法作出要求。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

其實 AI 自誕生以來就一直參與著各式各樣的體育競技和電子遊戲,當然也不斷重新整理人們對 AI 的認知。

比如在 2017 年,DeepMind 所開發的 AlphaGo 與當時世界第一的圍棋手冠軍柯潔進行對抗,最終 AlphaGo 以 3 比 0 的碾壓優勢獲勝,從那時開始圍棋界也公認了 AlphaGo 的棋力已經超過人類職業圍棋的頂尖水平。

而在遊戲這塊,Open AI 也在 2018 年 Dota2 5V5 比賽中,幾乎碾壓戰勝了均分 4000 分的 Dota2 玩家,並且在之後的開放 5V5 模式中,577 場的比賽中人類僅獲勝了兩場。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

而在復刻版的《 吃豆人 》遊戲中,GameGAN 依靠自主學習能力,不僅保證 AI 模型生成了與原版遊戲一樣的靜態環境元素,例如迷宮形狀、豆子以及強化道具等,還生成了敵方幽靈以及吃豆人本身這樣的動態元素。並且能夠對遊戲規則進行學習復刻,例如吃豆人無法穿越圍牆、吃到強化道具會使幽靈四處逃竄、被鬼魂抓到即遊戲結束等規則。

並且 AI 渲染模組也可以方便的對遊戲內各類元素進行替換或更改,例如改變遊戲的背景或將吃豆人換成我們熟知的馬里奧等!

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

其次,GameGAN 不僅僅開發了《 吃豆人 》,英偉達也在原有學習模型基礎上開發另一款《 毀滅戰士(Doom)》遊戲。

《 毀滅戰士(Doom)》是由 id Software 開發的第一人稱射擊遊戲,在近兩年《 毀滅戰士 》也一直是人工智慧研究的寵兒。來自卡耐基梅隆大學、清華大學等人工智慧團隊分別開發各自的 AI 機器人,在《 毀滅戰士(Doom)》遊戲中展開生存競賽,以各自 AI 的總擊殺數與自殺數進行最終排名。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

而英偉達完成對 Doom 的復刻,也意味著 GameGAN 可以通過從錄製的遊戲視訊以及玩遊戲時的物理按鍵軌跡來學習任何一款遊戲的內容及規則,並進行復刻,而不僅僅是參與到遊戲中。

不過雖然是一個簡單的畫素級《 吃豆人 》小遊戲,英偉達投入的開發成本卻是十分之高,不僅包括遊戲開發商萬代南夢宮為英偉達團隊提供的 50000 集( 共幾百萬幀 )的《 吃豆人 》劇本,英偉達 AI 研究團隊還動用了 4 臺配備 Quadro GV100GPU 的 DGX 計算機進行學習訓練。

AI在遊戲裡碾壓了我們之後,又準備去開發遊戲了

同時由於 GameGAN 的動態引擎對影像捕捉的能力還不夠成熟,使現有模型存在保真度的問題,導致 GameGAN 復刻的遊戲畫面都比較模糊。復刻的吃豆人遊戲解析度最高只有 128x128,每秒也只有 50 幀。

但是 NVIDIA 實驗室也表示:GAN 的最終目標是隻需要通過觀看視訊和觀察目標在環境中所採取的行動,就能模仿駕駛規則或物理規律。

比如對遊戲開發者來說,他們不再需要再苦思冥想新的遊戲關卡或模式,完全可以交給成熟的 GAN 通過自主學習來生成新的遊戲內容,而 GameGAN 復刻的《 吃豆人 》就是實現這一目標的第一步。

作者:差評
來源:遊民星空
原地址:https://club.gamersky.com/activity/416975?club=163

相關文章