在 強化學習實戰 | 表格型Q-Learning玩井字棋(三)優化,優化 中,我們經過優化和訓練,得到了一個還不錯的Q表格,這一節我們將用pygame實現一個有人機對戰,機機對戰和作弊功能的井字棋遊戲。至於勝率統計這個功能,其實沒有必要了——因為Q表格AI內戰永遠是平局。基本的pygame用法可以學習 Create a game with Pygame and Design Patterns 中的部分章節。總得來說就是逐幀繪製,迴圈重新整理。專案地址:碼雲。
機機對戰
Q表格 vs Q表格
點開 CHEAT 可以檢視藍方在決策時使用的Q表格:
Q表格 vs 隨機
人機對戰