繼人工智慧攻陷圍棋,德州撲克也淪陷了

行者武松發表於2018-03-02

相對於圍棋,德州撲克的非完美資訊給了人工智慧更大的壓力。

繼AlphaGo披著“Master”在中韓圍棋界大獲全勝後,德州撲克也不幸淪陷,只不過這次的主角並不是AlphaGo。

繼人工智慧攻陷圍棋,德州撲克也淪陷了

近日,來自加拿大Alberta大學、捷克Charles大學、布拉格捷克理工大學的10位研究員在arXiv網站(一個收集物理學、數學、電腦科學與生物學論文預印本的網站)上傳了一篇題為《DeepStack:無限注德撲的專業級人工智慧玩家》的論文,介紹了一種能在一對一無限注德州撲克中擊敗人類玩家的新演算法“DeepStack”。

在圍棋等棋類遊戲中,玩家能夠獲得的確定性資訊是對稱的,而德州撲克不同,這是一種包含了欺騙、推測的非完美資訊遊戲。在德州撲克的遊戲中,玩家只能掌握自己手上的牌,通過推理非對稱的資訊,從而與對手進行博弈。而這裡就是該論文的意義所在,論文中提到“DeepStack是一種通用演算法,可用於一大類非完整資訊的序列博弈 ”。

不同於過去研究人員所採用的一種壓縮型的策略,這個加拿大和捷克的合作團隊在開發新演算法“DeepStack”過程中更注重培養人工智慧出牌時的“直覺”。在運用深度學習,反覆自我博弈之後,“DeepStack”學會了在每一個具體情境出現時進行推理,這種做法非常接近於人類玩家的習慣。

去年年末,該團隊邀請了33名專業撲克選手與“DeepStack”進行了44852次博弈。在最後的結果中,DeepStack成為了首個在一對一無限注德撲中戰勝人類玩家的人工智慧,並且平均勝率達到了492mbb/g(milli-big-blinds per game,用於衡量撲克玩家表現的指數,一般職業玩家認為50mbb/g是個門檻,750mbb/g就是對手每局都棄牌的贏率)。

原文釋出時間:2017-01-11 10:55
本文作者:韓璐
本文來自雲棲社群合作伙伴鎂客網,瞭解相關資訊可以關注鎂客網。


相關文章