戰無不勝的撲克機器人讓人類見識到遊戲 AI 的未來

遊資網發表於2019-07-22
編者按:如果AI不再死板,而是開始學會模仿人類的狡詐行為,比如「虛張聲勢」或「聲東擊西」,那麼把這種程式應用到電子遊戲裡會產生什麼樣的效果呢?對未來的AI技術又將有什麼樣的推進作用呢?

無論是玩「大表哥2」的迷你遊戲還是牌類遊戲,愛打牌的玩家經常會被遊戲AI惹惱,因為他們深暗的那些「牌桌箴言」,比如抓牌技巧和如何棄牌等,用在AI身上都是徒勞無功。

有些機器人不論用什麼樣的牌都能唬住它,有的則從不上鉤;有些機器人,你稍微激它一下,它就棄牌了,有的則比較倔強,哪怕手牌比你的還爛,依然堅持加註。所以玩家不僅看不到電腦對手的牌面,對它們的行為模式也是兩眼一抹黑。

這周,Facebook和卡耐基梅隆大學的那些攻堅能手們釋出的一篇研究論文引起了我的注意。他們的Pluribus撲克AI非比尋常,因為工程師們再一次模擬出了一種被視為人類本性的行為,那就是「虛張聲勢」。

「其實模擬人性這一點在許多AI技術上都得以實現了。」Facebook研究科學家暨該機器人的聯合創始人諾姆·布朗在週四接受我的採訪時說道,「許多事我們都假定只有人類才能做到,然而AI也是可以實現的。」

「50年代,人們認為國際象棋只有人能對局,電腦做不到。」布朗繼續說道,「後來人們又覺得AI實現不了宗師段位的圍棋水平。如今,大家又覺得AI做不到虛張聲勢。但我們認為,AI甚至比人類更擅長虛張聲勢。」

戰無不勝的撲克機器人讓人類見識到遊戲 AI 的未來

六名選手正在一局遊戲中測試Pluribus撲克AI

布朗的這類科學研究專案最後取得成功的並不多,科學家們以前也曾用過撲克來研究AI的行為和學習能力。2015年,阿爾伯塔大學的科學家們研製出一種在雙人德州撲克上幾乎無人能敵的撲克機器人。當然,這些機器人沒少被用在電子遊戲裡,尤其是本世紀初撲克熱潮正高的時候。

我所熟知的AI通常來說分析能力都不強,與其說智慧,不如說它們是特定情況下觸發某種行為,比如判斷總勝率高低或是否先下小盲注等。多年以來,這些撲克模擬器都能讓玩家自己選擇它們的行為是激進還是保守,主要功能無非就是訓練牌技,讓人不論面對哪類對手都能保持高水平。

「虛張聲勢」這一牌桌技藝之所以被稱為「人類的藝術」,是因為人類能主動表現出他們對手中的牌是否有信心。Coresoft曾為PS2開發的《世界撲克錦標賽》也嘗試模擬這種行為,並把這項技藝變成一種實用的AI策略。只可惜,玩家常常碰上各種奇葩狀況,比如某回合的對手持續跟注,莫名其妙地加註,或明明拿著一手臭牌,還一副手握一對J的迷之自信等。這樣玩遊戲一點都不盡興,大多玩家很快便沒了耐心。

戰無不勝的撲克機器人讓人類見識到遊戲 AI 的未來

Pluribus的不同之處在於,AI會去試探虛張聲勢的效果(比如拿一手爛牌下注),而非單純讓對手相信自己拿了一手好牌。布朗表示:「機器人不會將這種行為看作是欺騙或說謊,而會把它客觀分析為『能帶來更多收益』的行為。」

如何定義「虛張聲勢」?究竟是行為更重要,還是結果更重要?

Pluribus是布朗和卡耐基梅隆大學的同事圖奧馬斯·桑德赫爾一起搗鼓出來的,它有點像一個會計算結果,且會事先做出假設的棋類AI。布朗和桑德赫爾打造的這款機器人只會提前兩手或三手牌來考慮對策。這種偏向即時的演算法讓其他五位人類專業牌手毫無頭緒,難以預判其行為,並屢戰屢敗。

這讓我們不禁深思,究竟什麼是「虛張聲勢」?是行為更重要,還是結果更重要?

不過,布朗並不打算就此陳述自己的觀點。他的心思全在研究撲克上,15年前他還在羅格斯大學念本科的時候就開始了。「只要能找到這個遊戲的數學邏輯,並熟練掌握這一完美的策略,你就能戰無不勝。」布朗入神地描繪著自己的想法。

布朗從某些方面向大家證實了撲克遊戲中穩賺不賠的策略(在測試的牌局裡,該AI的賺錢速度快至每小時1000美元),但人類是不可能有如此快的計算能力的。

「這就是AI的有趣之處,它並不是在適應對手。」布朗說,「它有自己的策略,而且這個策略是設計好了的,不會因為人類的套路而改變。把特定策略用於撲克遊戲的想法讓我無比痴迷,也是我持續研究的動力。」

有一篇關於Pluribus的新聞稿還對其驅動來源進行大肆宣傳,因為它的硬體基礎可以說是車庫實驗室級別的:一臺64核伺服器,加上不到512 GB的記憶體,夜以繼日地工作了八天將這個AI開發出來。研究人員保守估算,使用雲伺服器對它進行充分訓練僅需150美元。

戰無不勝的撲克機器人讓人類見識到遊戲 AI 的未來

但不要指望Pluribus會被投入各種虛擬棋牌室去完虐人類,或用來訓練出一代人類棋牌高手,以每小時1000美元的速度瘋狂斂財。布朗表示他們不會將Pluribus投入任何形式的商業用途,它只是某個觀點的有力證明罷了,而且可以在日後被用來處理更為複雜的計算機操作,比如用在自動駕駛領域。

此處不得不提到某個經典的電子遊戲型別,想必各位玩家都很熟悉了:賽車遊戲中的駕駛員。這裡頭CPU需要處理的東西就更為複雜了,不但要考慮速度,還要計算出最優線路,以及給其它駕駛員預留多少空間等等。

「賽車遊戲是這類AI運用的絕佳範例之一,因為這類遊戲實現了多主體之間的互動,有多個玩家以及多層面資訊要處理。」布朗若有所思地說,「據我所知,現在許多遊戲AI用的技術都不是基於理論層面的,更像是硬編碼,與特定遊戲型別直接相關。因為這樣他們更容易除錯,也方便弄清原理。」

「但現在我們開發出了這些關鍵的AI技術,我相信這些技術將會慢慢滲入電子遊戲產業,併成為其中非常重要的一環,」他補充道,「其實這也沒什麼好驚訝的,畢竟這是AI被被廣泛應用的產業之一。」


來源:篝火營地編譯
原地址:https://gouhuo.qq.com/content/detail/0_20190719185832_go7KZHdY3

相關文章