戰無不勝的撲克機器人讓人類見識到遊戲 AI 的未來
無論是玩「大表哥2」的迷你遊戲還是牌類遊戲,愛打牌的玩家經常會被遊戲AI惹惱,因為他們深暗的那些「牌桌箴言」,比如抓牌技巧和如何棄牌等,用在AI身上都是徒勞無功。
有些機器人不論用什麼樣的牌都能唬住它,有的則從不上鉤;有些機器人,你稍微激它一下,它就棄牌了,有的則比較倔強,哪怕手牌比你的還爛,依然堅持加註。所以玩家不僅看不到電腦對手的牌面,對它們的行為模式也是兩眼一抹黑。
這周,Facebook和卡耐基梅隆大學的那些攻堅能手們釋出的一篇研究論文引起了我的注意。他們的Pluribus撲克AI非比尋常,因為工程師們再一次模擬出了一種被視為人類本性的行為,那就是「虛張聲勢」。
「其實模擬人性這一點在許多AI技術上都得以實現了。」Facebook研究科學家暨該機器人的聯合創始人諾姆·布朗在週四接受我的採訪時說道,「許多事我們都假定只有人類才能做到,然而AI也是可以實現的。」
「50年代,人們認為國際象棋只有人能對局,電腦做不到。」布朗繼續說道,「後來人們又覺得AI實現不了宗師段位的圍棋水平。如今,大家又覺得AI做不到虛張聲勢。但我們認為,AI甚至比人類更擅長虛張聲勢。」
六名選手正在一局遊戲中測試Pluribus撲克AI
布朗的這類科學研究專案最後取得成功的並不多,科學家們以前也曾用過撲克來研究AI的行為和學習能力。2015年,阿爾伯塔大學的科學家們研製出一種在雙人德州撲克上幾乎無人能敵的撲克機器人。當然,這些機器人沒少被用在電子遊戲裡,尤其是本世紀初撲克熱潮正高的時候。
我所熟知的AI通常來說分析能力都不強,與其說智慧,不如說它們是特定情況下觸發某種行為,比如判斷總勝率高低或是否先下小盲注等。多年以來,這些撲克模擬器都能讓玩家自己選擇它們的行為是激進還是保守,主要功能無非就是訓練牌技,讓人不論面對哪類對手都能保持高水平。
「虛張聲勢」這一牌桌技藝之所以被稱為「人類的藝術」,是因為人類能主動表現出他們對手中的牌是否有信心。Coresoft曾為PS2開發的《世界撲克錦標賽》也嘗試模擬這種行為,並把這項技藝變成一種實用的AI策略。只可惜,玩家常常碰上各種奇葩狀況,比如某回合的對手持續跟注,莫名其妙地加註,或明明拿著一手臭牌,還一副手握一對J的迷之自信等。這樣玩遊戲一點都不盡興,大多玩家很快便沒了耐心。
Pluribus的不同之處在於,AI會去試探虛張聲勢的效果(比如拿一手爛牌下注),而非單純讓對手相信自己拿了一手好牌。布朗表示:「機器人不會將這種行為看作是欺騙或說謊,而會把它客觀分析為『能帶來更多收益』的行為。」
如何定義「虛張聲勢」?究竟是行為更重要,還是結果更重要?
Pluribus是布朗和卡耐基梅隆大學的同事圖奧馬斯·桑德赫爾一起搗鼓出來的,它有點像一個會計算結果,且會事先做出假設的棋類AI。布朗和桑德赫爾打造的這款機器人只會提前兩手或三手牌來考慮對策。這種偏向即時的演算法讓其他五位人類專業牌手毫無頭緒,難以預判其行為,並屢戰屢敗。
這讓我們不禁深思,究竟什麼是「虛張聲勢」?是行為更重要,還是結果更重要?
不過,布朗並不打算就此陳述自己的觀點。他的心思全在研究撲克上,15年前他還在羅格斯大學念本科的時候就開始了。「只要能找到這個遊戲的數學邏輯,並熟練掌握這一完美的策略,你就能戰無不勝。」布朗入神地描繪著自己的想法。
布朗從某些方面向大家證實了撲克遊戲中穩賺不賠的策略(在測試的牌局裡,該AI的賺錢速度快至每小時1000美元),但人類是不可能有如此快的計算能力的。
「這就是AI的有趣之處,它並不是在適應對手。」布朗說,「它有自己的策略,而且這個策略是設計好了的,不會因為人類的套路而改變。把特定策略用於撲克遊戲的想法讓我無比痴迷,也是我持續研究的動力。」
有一篇關於Pluribus的新聞稿還對其驅動來源進行大肆宣傳,因為它的硬體基礎可以說是車庫實驗室級別的:一臺64核伺服器,加上不到512 GB的記憶體,夜以繼日地工作了八天將這個AI開發出來。研究人員保守估算,使用雲伺服器對它進行充分訓練僅需150美元。
但不要指望Pluribus會被投入各種虛擬棋牌室去完虐人類,或用來訓練出一代人類棋牌高手,以每小時1000美元的速度瘋狂斂財。布朗表示他們不會將Pluribus投入任何形式的商業用途,它只是某個觀點的有力證明罷了,而且可以在日後被用來處理更為複雜的計算機操作,比如用在自動駕駛領域。
此處不得不提到某個經典的電子遊戲型別,想必各位玩家都很熟悉了:賽車遊戲中的駕駛員。這裡頭CPU需要處理的東西就更為複雜了,不但要考慮速度,還要計算出最優線路,以及給其它駕駛員預留多少空間等等。
「賽車遊戲是這類AI運用的絕佳範例之一,因為這類遊戲實現了多主體之間的互動,有多個玩家以及多層面資訊要處理。」布朗若有所思地說,「據我所知,現在許多遊戲AI用的技術都不是基於理論層面的,更像是硬編碼,與特定遊戲型別直接相關。因為這樣他們更容易除錯,也方便弄清原理。」
「但現在我們開發出了這些關鍵的AI技術,我相信這些技術將會慢慢滲入電子遊戲產業,併成為其中非常重要的一環,」他補充道,「其實這也沒什麼好驚訝的,畢竟這是AI被被廣泛應用的產業之一。」
來源:篝火營地編譯
原地址:https://gouhuo.qq.com/content/detail/0_20190719185832_go7KZHdY3
相關文章
- AI智慧對人類未來的利弊AI
- 無人不識又無人不迷糊的this
- 機器人戰勝人類時間表:2061年機器人能完成所有人類任務!機器人
- 未來AI智慧對人類的影響的利弊AI
- 無人機、無人車與機器人,未來誰更適合當快遞員?無人機機器人
- Human vs AI,人類和機器的學習究竟誰更勝一籌?AI
- 人機對話,不再尬聊:聊天機器人的未來機器人
- 人類未來:性愛機器人是美女還是野獸機器人
- 遊戲AI:AI的遊戲還是遊戲的未來遊戲AI
- 戰勝人類的Dota 2 AI作弊?AI專家稱比賽不公平AI
- 遊戲的無障礙之戰:讓快樂屬於每個人遊戲
- 未來50%的工作會被機器人替代?機器人
- 展望未來的「暗黑」類遊戲遊戲
- 如何設計出讓人玩不膩的策略遊戲?遊戲
- 你認識ERICA嗎?她是當今最像人類的機器人機器人
- 透過認識AI智慧機器人的功能,全面瞭解電話機器人AI機器人
- 識別特定影象的AI玻璃來了,未來或可用於人臉識別AI
- 讓人沉浸遊戲的魅力機制:隨機與策略遊戲隨機
- 遊戲化機制研究:遊戲是如何讓人“上癮”的?遊戲
- 機器人—馬克1.1機器人
- 讀人工智慧時代與人類未來筆記17_人類未來人工智慧筆記
- 遊戲大作紛紛來襲,一臺高階主機讓你無懼遊戲的挑戰遊戲
- 記一次講故事機器人的開發-我有故事,讓機器人來讀機器人
- 安德森:無人機未來的發展會與智慧手機趨同無人機
- 讓AI像人類一樣操作手機,華為也做出來了AI
- 如何提升遊戲中機器人的表現?遊戲機器人
- 無人車、無人機、超級高鐵、智慧城市......這是一份來自未來的出行報告無人機
- AI助各地返工:重慶語音機器人、北京無人配送、廣州人臉識別測溫AI機器人
- AI人工智慧的4個未來趨勢,人類集體失業?AI人工智慧
- 「RPA機器人」民宿AI管家機器人機器人AI
- 達到人類專業玩家水平,中科院自動化所研發輕量型德州撲克AI程式AlphaHoldemAI
- RPA機器人:未來行業應用的新焦點機器人行業
- 過來人的增收絕招:跨平臺讓遊戲ARPU翻倍遊戲
- 遊戲的未來遊戲
- 偶像企劃類遊戲的未來在哪裡?遊戲
- 口袋無人機DOBBY:我的“人臉識別”已上線無人機
- 未來,人類將何去何從?
- 機器人託管2.0,更智慧、更個性的AI客服機器人機器人AI