AlphaStar被職業玩家戲耍：在星際2上，人工智慧無計可施

機器之心發表於2019-09-09

原文網址 : http://www.jiqizhixin.com/articles/2019-09-09-20

為了提高人工智慧水平，DeepMind 與暴雪在戰網天梯中開放了 AlphaStar：玩家只要進行申請並通過就可以和這個最強 AI 進行線上對決了。而且現在，AlphaStar 已經可以使用全部三個種族。

然而，與圍棋人工智慧 AlphaGo 走過的軌跡完全不同，在幾個月的發展之後，人工智慧的遊戲似乎完全沒有長進，反而是各路人類玩家獲得了經驗：他們找到了各種各樣「戲耍」AI 的方法。

我們找到了 AlphaStar 近期人機大戰錄影中的三個：

在兩場神族對戰蟲族的比賽中，AlphaStar（P）面對目前全球排名第 50 的 Bly（Z），從頭到尾毫無還手之力。

首先是第一場：相比此前和 AlphaStar 交手的 LiquidTLO，蟲族選手 Bly 更加年長一些——他是一名從魔獸爭霸 3 轉型的星際 2 選手，已年過 30。然而，在兩場比賽中人類玩家使用簡單的單礦 Rush 戰術獲得了幾乎相同的勝利。人們紛紛表示：AI 最近的發展似乎僅限於「學會了在聊天頻道里發表情」。

AlphaStar 的人族實力如何？在對戰全球排名第 3 的 Neeb（神族）時，AlphaStar 的表現。

可以看到，雖然 AI 在使用人族時已經學會了使用女妖和死神對敵人進行騷擾，但在正面進攻不利，又被 Neeb 偷家的情況下還是敗下陣來，整場比賽用時 13 分鐘。

這可能是目前最為高階的「人機大戰」了：AlphaStar vs Serral。

DeepMind 當然也找來了目前星際爭霸 2 最強的玩家，芬蘭蟲族選手 Serral 進行了人機對決。在這場 16 分鐘的比賽裡，Serral 和 AI 進行了正面的硬碰硬戰鬥。然而看起來在這種比賽裡任何一方出現短板就會造成最終的失利。有評論表示：看起來 Serral 比 AlphaStar 更像是 AI。

以下引用一位網友對比賽的深度解讀：

更糟糕的是，人類玩家似乎找到了對抗 AlphaStar 的方法。但現在，DeepMind 頻繁地更改自己的賬號，使得它們更加難以追蹤。從比賽中可以看出智慧體（agent）具有幾點特徵：
1. 在對抗人類玩家上實現了巨大飛躍，但它依然無法真正理解遊戲概念；
2. 未能對大量常見遊戲策略做出適時回應；
3. 無法在比賽中根據人類對手做出調整，始終堅持設定的遊戲指令碼；
4. 除了人族外，其他智慧體在巨集觀和微觀行動中表現出了嫻熟的技能，但在建築物走位方面存在困難，經常將己方單位鎖在基地內；
5. 在人族遊戲中表現最差，蟲族表現最佳（有爭議）；
6. 在蟲族遊戲中策略最為單調。

DeepMind《星際爭霸 2》AI 對抗人類玩家的發展歷程

星際爭霸 2 是人類遊戲史上最困難、最成功的即時戰略遊戲，這一系列遊戲的歷史已經超過 20 年。星際爭霸長盛不衰的部分原因在於其豐富的多層次遊戲機制，對於人工智慧研究來說，這是一個非常接近現實世界的虛擬環境。

星際爭霸擁有平衡的遊戲規則，以及諸多資訊和需要控制的變數。此外，一場比賽的時間通常為幾分鐘到一小時不等，這意味著遊戲中提早執行的操作也許會很長時間不見成效。最後，由於戰爭迷霧的存在，地圖對於玩家只有部分顯示，這意味著智慧體必須結合記憶與規劃才能成功。

2017 年，DeepMind 宣佈開始研究打即時戰略遊戲《星際爭霸 2》的人工智慧。

2018 年 12 月 10 日，AlphaStar 擊敗了 DeepMind 公司裡的最強玩家 Dani Yogatama；到了 12 月 12 日，AlphaStar 已經可以 5:0 擊敗職業玩家 TLO 了（雖然 TLO 是蟲族玩家，但解說們認為他在遊戲中的表現大概能有 5000 分水平）；又過了一個星期，12 月 19 日，AlphaStar 同樣以 5:0 的比分擊敗了職業玩家 MaNa。

那麼 AlphaStar 是如何學會打《星際爭霸 2》的呢？

AlphaStar 的行為是由一種深度神經網路生成的，該網路從原資料介面（單位列表與它們的特性）接收輸入資料，輸出構成遊戲內行為的指令序列。具體來說，該神經網路在單元中使用了一個 transformer 作為軀幹，結合了一個深度 LSTM 核、一個帶有 pointer 網路的自動迴歸策略 head 以及一箇中心價值基線。

AlphaStar 也使用到了全新的多智慧體學習演算法。神經網路最初通過暴雪公開的匿名人類遊戲視訊以監督學習進行訓練。這讓 AlphaStar 能夠通過模仿進行學習天梯玩家的基礎微操與巨集觀操作策略。

AlphaStar被職業玩家戲耍：在星際2上，人工智慧無計可施 AlphaStar 聯盟。最初是通過人類玩家的遊戲回放視訊進行訓練，然後與其他對手對抗訓練。每次迭代就匹配新的對手，凍結原來的對手，匹配對手的概率和超引數決定了每個智慧體採用的的學習目標函式，保留多樣性的同時增加難度。智慧體的引數通過強化學習進行更新。最終的智慧體取樣自聯盟的納什分佈（沒有更換）。

AlphaStar被職業玩家戲耍：在星際2上，人工智慧無計可施

隨著自我博弈的進行，AlphaStar 逐漸開發出了越來越成熟的戰術。DeepMind 表示，這一過程和人類玩家發現戰術的過程類似：新的戰術不斷擊敗舊的戰術。

DeepMind AlphaStar 現場首秀落敗於人類玩家 MaNa

今年 1 月，DeepMind 的 AlphaStar 終於首次在世人面前亮相。但在對陣人類職業玩家、前 WCS 亞軍 MaNa 的一場現場比賽中，人工智慧卻被人類「狡詐」的戰術迷惑，遺憾落敗。

AlphaStar被職業玩家戲耍：在星際2上，人工智慧無計可施

在幾場展示 AI 實力的 Replay 鋪墊之後，AlphaStar 現場比賽卻輸了。面對剛剛從電腦前起身的 MaNa，DeepMind 的兩位科學家 David Sliver 與 Oriol Vinyals 只能露出尷尬的微笑。

在這場比賽中，AI 的一個缺陷暴露出來：除了特定的分兵戰術，智慧體並沒有形成靈活的兵力分配概念。MaNa 採取的策略是：稜鏡帶著兩不朽在 AI 的基地不停騷擾，AlphaStar 一旦回防立刻飛走，等 AI 兵力出門又立刻繼續騷擾。因此，面對 MaNa 靈活的出兵策略，AlphaStar 只能被動應戰，因而也無法形成對 MaNa 的有效進攻，也導致了最終的落敗。

毫無疑問，作為人工智慧領先技術的研究機構，DeepMind 的 AlphaGo 和 AlphaFold 等專案不僅引發了全球對於人工智慧技術的關注熱潮，同時也為新技術在一些領域的落地找到了方向。然而在星際爭霸 2 上，人工智慧遭遇了前所未有的挑戰，不斷燒錢的 DeepMind 能否最終找到解決之道？

2:0！谷歌 AI “AlphaStar“ 虐殺職業星際玩家
2019-01-25
谷歌AIAST
「擊敗星際爭霸II職業玩家」的 AlphaStar是在作弊？
2019-01-28
AST
10：1，AlphaStar橫空出世，碾壓星際爭霸2人類職業玩家 TLO 和 MaNa
2019-01-28
AST星際爭霸2
人工智慧-星際爭霸2教程
2021-12-20
人工智慧星際爭霸2
寶付揭秘求職被耍，只因不懂事？長
2019-09-26
求職
DeepMind AlphaStar星際爭霸2首秀：Demo很強大，現場比賽竟然輸了
2019-01-25
AST星際爭霸2
遊戲廠商在宣傳上耍的花招能有多離譜？
2021-07-12
遊戲
累計玩家超3.6億，小米遊戲在MIDC上提到的「無界分發」是什麼？
2020-11-09
遊戲
實現無限界限的星際網路計算
2022-02-19
在格鬥遊戲比賽裡，被侮辱與被損害的女玩家們
2019-08-14
遊戲
星際穿越+降臨+明日邊緣？星際拓荒重新定義星際探索題材遊戲
2020-02-10
遊戲
ADAMoracle實現了無界限的星際網路計算
2021-09-27
Oracle
首款宇宙星際探索類卡牌遊戲震撼上線
2022-01-13
遊戲
遊戲廣告如何避免被“職業打假人”碰瓷？
2020-11-11
遊戲
2017年人工智慧行業9大預測：某些職業將被取代
2018-04-23
人工智慧行業
教師是唯一無法被人工智慧取代的職業
2019-09-11
人工智慧
商湯《星際爭霸2》AI智慧體公開首秀，AI大裝置成就職業級決策水平
2022-06-13
星際爭霸2AI智慧體
視障玩家被忽略的遊戲史
2019-05-17
遊戲
蝸牛星際改造計劃
2020-10-10
在AWS無伺服器架構上實施應用程式介面
2024-07-18
伺服器架構
AMD展示VenueVRGateway，為玩家帶來逼真的星際穿越體驗
2018-03-07
VRGateway
在遊戲設計中引導玩家剖析2D射擊遊戲設計中的壓縮和漏斗理論
2019-11-11
遊戲設計
SpaceX星際移民計劃：馬斯克心中的星際飛船明年完工
2018-09-17
馬斯克
在設計遊戲的時候，如何讓玩家跟遊戲中的角色產生情感上的聯絡？
2019-09-04
遊戲
《星際爭霸II》AI機器人挑戰頂級職業選手，你Pick誰？
2020-06-11
AI機器人
《星鳴特攻》上線2周即停服下架歐美遊戲業是否病入膏肓了？
2024-10-09
遊戲
深圳人工智慧產業條例實施
2022-11-03
人工智慧產業
女玩家在遊戲追求中和男玩家有何不同？
2020-01-06
遊戲
Value Gamers：資料顯示職業遊戲玩家Twitch平均粉絲為1920名
2018-10-28
GAM遊戲
Dota 2被攻陷！OpenAI 人工智慧5V5模式擊敗人類玩家（4000分水平）
2018-06-26
OpenAI人工智慧模式
VIM在CentOS7上的無root許可權安裝
2022-05-29
CentOS
《星際拓荒》為何有望成為年度遊戲？
2019-07-26
遊戲
職業金字塔的程式設計師，被996打回原形
2019-04-29
程式設計師996
茅臺元宇宙遊戲被玩家質疑“割韭菜”
2023-02-27
元宇宙遊戲
被移動遊戲與主機遊戲越甩越遠，可PC遊戲還是“無所畏懼”
2019-06-21
遊戲
為什麼程式設計是獨一無二的職業？
2019-06-27
程式設計
NPD：2021年玩家在PC遊戲硬體和配件上的支出增加25%
2022-01-29
遊戲
在MWC2018上看工業網際網路走向
2018-03-05

AlphaStar被職業玩家戲耍：在星際2上，人工智慧無計可施

相關文章