星際爭霸遊戲是一款經典的即時戰略(RTS)遊戲,自 1998 年發行以來在全球範圍內備受歡迎。星際爭霸 AI 競賽自 2010 年出現後,每年都會舉行,且參與者越來越多。參賽者提交星際爭霸 AI bot,這些人工智慧體將在《星際爭霸:母巢之戰》零售版中互相格殺。受早期 RTS 遊戲競賽(如 Open RTS (ORTS) 競賽)的啟發,星際爭霸 AI 競賽逐漸成為展示當前最優 RTS 遊戲人工智慧體的絕佳場地。開發者使用 BWAPI 控制星際爭霸 AI 智慧體。BWAPI 於 2009 年首次提出,是為 StarCraft AI 競賽的服務的開發介面,也就是用程式碼玩 StarCraft,它提供了一個 C++的程式設計介面,可自由程式設計生成 dll 格式的 AI 檔案。
SAIDA、CherryPi 比賽視訊演示
AIIDE StarCraft AI 挑戰賽自 2010 年起已連續舉辦九屆,目前三星、Facebook、史丹佛大學、中科院自動化所等知名機構與高校都在研究星際爭霸 AI,以提升 AI 智慧體的通用能力。
2018 AIIDE StarCraft AI 全球挑戰賽共吸引了全球 27 支隊伍參加競賽,其中確定來自中國的隊伍包括:
BlueBlueSky,團隊成員來自地平線侯鵬飛、中科院自動化所張恂、薄紫彤、興軍亮等;
CES,來自中科院自動化所智慧系統與工程研究中心的張俊格研究團隊;
KillAll,來自中國國家重點實驗室的 Zhentao Tang 獨自參賽;
LastOrder,來自 Bilibili 的 Sijia Xu
2018 AIIDE StarCraft AI 挑戰賽參賽隊伍概覽。圖源:https://www.cs.mun.ca/~dchurchill/starcraftaicomp/2018/
不久之前,2018 AIIDE StarCraft AI 全球挑戰賽結果最終出爐,三星 SAIDA 獲得冠軍,Facebook 團隊開發的 CherryPi 獲得亞軍,中科院自動化所智慧系統與工程研究中心的張俊格研究團隊獲得季軍。
2018 AIIDE StarCraft AI 挑戰賽結果,圖源:https://www.cs.mun.ca/~dchurchill/starcraftaicomp/2018/
SAIDA 戰隊
今年獲勝的是三星 SAIDA 團隊,它在 10 張地圖的 2590 場比賽中獲勝了 2484 場,總勝率達到了 95.91%。SAIDA 團隊負責人 Chang-hyeon Bae 說:「我們的 AI bot 獲勝的祕訣在於,它會積極響應對手的策略,並在適當的時間給對手強硬的打擊,這一過程需要非常精細的單位控制。我們同樣會在 110000 組專業競賽團隊的重播資料上應用機器學習技術,以進一步提高 AI bot 的競爭力。」
SAIDA 在所有比賽中都使用人族(terran),它在初期傾向於使用保守策略,而在比賽中期後就嘗試使用更激進的策略並組織大規模攻擊。SAIDA 認為人族可以應對大多數對手的策略,並且缺點也少。
SAIDA 團隊主要使用有限狀態機控制所有作戰單位和建築,每一個單位和建築在每一種情況下都有特定的狀態。且他們還會使用一些搜尋演算法搜尋敵方基地。
此外,SAIDA 團隊不僅能通過卷積神經網路抽取電子競技視訊中的策略資訊,並將這些資訊解碼為戰鬥決策,同時還會利用多智慧體強化學習學習如何微觀操作。不過這些技術暫時還沒有加入到比賽系統中。
Facebook 團隊開發的 CherryPi
CherryPi 由 Facebook AI Research 開發,它使用蟲族(Zerg)進行戰鬥,在每次對決(matchup)中使用 8-13 個策略。CherryPi 使用的 AI 技術包括:
搜尋:使用區域級路徑搜尋對地圖障礙派送偵查單位,使用 threat-aware 路徑搜尋指引單位退出戰場。
離線機器學習:基於論文《An LSTM model for high level strategy selection》中的人類資料的卷積網路模型。
離線強化學習
線上學習
地圖分析:使用 BWEM 庫(即 Brood War Easy Map)。
分析之前在離線訓練階段的競賽。
CherryPi 具備高效的巨集觀管理能力、策略選擇能力、軍隊定位能力、基本單位控制能力。在這次競賽中取得了亞軍的好成績。
中科院自動化所開發的 CSE
中科院自動化所張俊格團隊本次設計開發的「CSE」bot 在 2591 場比賽中以 87.11% 的勝率榮獲中國參賽隊伍第一名、全球第三名的優異成績。張俊格團隊在具有自主進化的多智慧體控制、基於敵對方意圖分析的態勢認知、博弈對抗機理分析、強化學習等領域開展了一系列研究與應用工作,同時還公開了星際爭霸基準資料集以進一步促進星際 AI 的發展。此外,張俊格團隊去年開發的 CPAC bot 獲得了該競賽的國際第四名。
CSE 使用神族(Protoss),採用的是規則和學習聯合驅動的方式,比如,在 build order queue 為空的時候,CSE 使用深度學習來預測待訓練單位。
總之,AIIDE StarCraft AI 挑戰賽的比賽結果、獲勝團隊的技術介紹如同前文所展示的。至於在這些 bot 在比賽視訊中展示出的效果我們就不一一擷取 GIF 展示了,畢竟作為一家年輕的公司,小編們會玩 Dota2、擼啊擼、王者榮耀以及守望屁股、吃雞,就是沒人會玩星際爭霸~~~
參考地址:https://www.cs.mun.ca/~dchurchill/starcraftaicomp/2018/