戰無不勝的撲克機器人讓人類見識到遊戲 AI 的未來
無論是玩「大表哥2」的迷你遊戲還是牌類遊戲,愛打牌的玩家經常會被遊戲AI惹惱,因為他們深暗的那些「牌桌箴言」,比如抓牌技巧和如何棄牌等,用在AI身上都是徒勞無功。
有些機器人不論用什麼樣的牌都能唬住它,有的則從不上鉤;有些機器人,你稍微激它一下,它就棄牌了,有的則比較倔強,哪怕手牌比你的還爛,依然堅持加註。所以玩家不僅看不到電腦對手的牌面,對它們的行為模式也是兩眼一抹黑。
這周,Facebook和卡耐基梅隆大學的那些攻堅能手們釋出的一篇研究論文引起了我的注意。他們的Pluribus撲克AI非比尋常,因為工程師們再一次模擬出了一種被視為人類本性的行為,那就是「虛張聲勢」。
「其實模擬人性這一點在許多AI技術上都得以實現了。」Facebook研究科學家暨該機器人的聯合創始人諾姆·布朗在週四接受我的採訪時說道,「許多事我們都假定只有人類才能做到,然而AI也是可以實現的。」
「50年代,人們認為國際象棋只有人能對局,電腦做不到。」布朗繼續說道,「後來人們又覺得AI實現不了宗師段位的圍棋水平。如今,大家又覺得AI做不到虛張聲勢。但我們認為,AI甚至比人類更擅長虛張聲勢。」
六名選手正在一局遊戲中測試Pluribus撲克AI
布朗的這類科學研究專案最後取得成功的並不多,科學家們以前也曾用過撲克來研究AI的行為和學習能力。2015年,阿爾伯塔大學的科學家們研製出一種在雙人德州撲克上幾乎無人能敵的撲克機器人。當然,這些機器人沒少被用在電子遊戲裡,尤其是本世紀初撲克熱潮正高的時候。
我所熟知的AI通常來說分析能力都不強,與其說智慧,不如說它們是特定情況下觸發某種行為,比如判斷總勝率高低或是否先下小盲注等。多年以來,這些撲克模擬器都能讓玩家自己選擇它們的行為是激進還是保守,主要功能無非就是訓練牌技,讓人不論面對哪類對手都能保持高水平。
「虛張聲勢」這一牌桌技藝之所以被稱為「人類的藝術」,是因為人類能主動表現出他們對手中的牌是否有信心。Coresoft曾為PS2開發的《世界撲克錦標賽》也嘗試模擬這種行為,並把這項技藝變成一種實用的AI策略。只可惜,玩家常常碰上各種奇葩狀況,比如某回合的對手持續跟注,莫名其妙地加註,或明明拿著一手臭牌,還一副手握一對J的迷之自信等。這樣玩遊戲一點都不盡興,大多玩家很快便沒了耐心。
Pluribus的不同之處在於,AI會去試探虛張聲勢的效果(比如拿一手爛牌下注),而非單純讓對手相信自己拿了一手好牌。布朗表示:「機器人不會將這種行為看作是欺騙或說謊,而會把它客觀分析為『能帶來更多收益』的行為。」
如何定義「虛張聲勢」?究竟是行為更重要,還是結果更重要?
Pluribus是布朗和卡耐基梅隆大學的同事圖奧馬斯·桑德赫爾一起搗鼓出來的,它有點像一個會計算結果,且會事先做出假設的棋類AI。布朗和桑德赫爾打造的這款機器人只會提前兩手或三手牌來考慮對策。這種偏向即時的演算法讓其他五位人類專業牌手毫無頭緒,難以預判其行為,並屢戰屢敗。
這讓我們不禁深思,究竟什麼是「虛張聲勢」?是行為更重要,還是結果更重要?
不過,布朗並不打算就此陳述自己的觀點。他的心思全在研究撲克上,15年前他還在羅格斯大學念本科的時候就開始了。「只要能找到這個遊戲的數學邏輯,並熟練掌握這一完美的策略,你就能戰無不勝。」布朗入神地描繪著自己的想法。
布朗從某些方面向大家證實了撲克遊戲中穩賺不賠的策略(在測試的牌局裡,該AI的賺錢速度快至每小時1000美元),但人類是不可能有如此快的計算能力的。
「這就是AI的有趣之處,它並不是在適應對手。」布朗說,「它有自己的策略,而且這個策略是設計好了的,不會因為人類的套路而改變。把特定策略用於撲克遊戲的想法讓我無比痴迷,也是我持續研究的動力。」
有一篇關於Pluribus的新聞稿還對其驅動來源進行大肆宣傳,因為它的硬體基礎可以說是車庫實驗室級別的:一臺64核伺服器,加上不到512 GB的記憶體,夜以繼日地工作了八天將這個AI開發出來。研究人員保守估算,使用雲伺服器對它進行充分訓練僅需150美元。
但不要指望Pluribus會被投入各種虛擬棋牌室去完虐人類,或用來訓練出一代人類棋牌高手,以每小時1000美元的速度瘋狂斂財。布朗表示他們不會將Pluribus投入任何形式的商業用途,它只是某個觀點的有力證明罷了,而且可以在日後被用來處理更為複雜的計算機操作,比如用在自動駕駛領域。
此處不得不提到某個經典的電子遊戲型別,想必各位玩家都很熟悉了:賽車遊戲中的駕駛員。這裡頭CPU需要處理的東西就更為複雜了,不但要考慮速度,還要計算出最優線路,以及給其它駕駛員預留多少空間等等。
「賽車遊戲是這類AI運用的絕佳範例之一,因為這類遊戲實現了多主體之間的互動,有多個玩家以及多層面資訊要處理。」布朗若有所思地說,「據我所知,現在許多遊戲AI用的技術都不是基於理論層面的,更像是硬編碼,與特定遊戲型別直接相關。因為這樣他們更容易除錯,也方便弄清原理。」
「但現在我們開發出了這些關鍵的AI技術,我相信這些技術將會慢慢滲入電子遊戲產業,併成為其中非常重要的一環,」他補充道,「其實這也沒什麼好驚訝的,畢竟這是AI被被廣泛應用的產業之一。」
來源:篝火營地編譯
原地址:https://gouhuo.qq.com/content/detail/0_20190719185832_go7KZHdY3
相關文章
- 會打撲克的機器人?連續2個月與2400萬人打撲克機器人
- AI智慧對人類未來的利弊AI
- 撲克遊戲的必勝法則遊戲
- 無人不識又無人不迷糊的this
- 性愛機器人攻陷人類:未來男人或失業機器人
- 機器人戰勝人類時間表:2061年機器人能完成所有人類任務!機器人
- 應該讓機器人幫助人類,還是讓人類幫助機器人?機器人
- 未來AI智慧對人類的影響的利弊AI
- 日本無人駕駛汽車上路 計程車機器人時代到來機器人
- 機器人將搶走人類的飯碗?不 它只會讓人類更強大機器人
- 啪啪啪還不夠,未來人類還將與機器人步入“愛情墳墓”機器人
- 性愛機器人不會讓人類性工作者失業機器人
- 未來人工智慧會愈發強大 人類真的沒有機會戰勝嗎?人工智慧
- 人機對話,不再尬聊:聊天機器人的未來機器人
- 人類未來:性愛機器人是美女還是野獸機器人
- 程式設計自動化,未來機器人將超越人類?程式設計機器人
- Human vs AI,人類和機器的學習究竟誰更勝一籌?AI
- 戰勝人類的Dota 2 AI作弊?AI專家稱比賽不公平AI
- 機器人—馬克1.1機器人
- 機器人來了 機器人替代人類還要多久?機器人
- 人工智慧機器人搶小編工作,還讓不讓人活?人工智慧機器人
- GCF:預計未來五年自殺式機器人或將滅絕人類GC機器人
- 透過認識AI智慧機器人的功能,全面瞭解電話機器人AI機器人
- 無人機、無人車與機器人,未來誰更適合當快遞員?無人機機器人
- 谷歌AlphaGo的勝利:不是計算機打敗了人類,而是人類打敗了人類谷歌Go計算機
- 未來,人類與機器究竟是什麼關係?
- 識別特定影象的AI玻璃來了,未來或可用於人臉識別AI
- 未來50%的工作會被機器人替代?機器人
- 當隨機不夠隨機:一個線上撲克遊戲的教訓隨機遊戲
- Travelzoo:中國人更期待未來旅行使用機器人機器人
- Master60場不敗橫掃棋壇 人類已無法戰勝人工智慧?AST人工智慧
- AI助各地返工:重慶語音機器人、北京無人配送、廣州人臉識別測溫AI機器人
- 你認識ERICA嗎?她是當今最像人類的機器人機器人
- 人工智慧機器人取代人類 未來誰說了算?人工智慧機器人
- AI人工智慧的4個未來趨勢,人類集體失業?AI人工智慧
- 信不信:這些機器人會讓人類廚師失業機器人
- 機器人有助於安眠 未來竟然要被機器睡了?機器人
- 機器人傷人事件:沒有意識的它只是人類操控下的傀儡機器人事件