強化學習實戰 | 表格型Q-Learning玩井字棋(四)遊戲時間

埠默笙聲聲聲脈發表於2021-12-12

強化學習實戰 | 表格型Q-Learning玩井字棋(三)優化,優化 中,我們經過優化和訓練,得到了一個還不錯的Q表格,這一節我們將用pygame實現一個有人機對戰,機機對戰和作弊功能的井字棋遊戲。至於勝率統計這個功能,其實沒有必要了——因為Q表格AI內戰永遠是平局。基本的pygame用法可以學習 Create a game with Pygame and Design Patterns 中的部分章節。總得來說就是逐幀繪製,迴圈重新整理。專案地址:碼雲

機機對戰

Q表格 vs Q表格

點開 CHEAT 可以檢視藍方在決策時使用的Q表格: 

 Q表格 vs 隨機

 人機對戰

 

 

相關文章