BetaMeow：利用機器學習做五子棋AI

發表於2016-05-07

BetaMeow的起源

前段時間AlphaGo和李世石廣受關注，作為人工智慧的腦殘粉，看完比賽後激動不已，因為有一定的機器學習的基礎，便打算擼一個棋類的AI，但我還算有點自知之明，圍棋AI，甚至google打算做得通用AI是做不出的了，所以打算擼一個五子棋的AI。

選取五子棋作為試手專案主要是以下幾點原因：

規則簡單。為了簡單起見，BetaMeow只要有一方練成五子就可以判輸贏。
受眾多。因為五子棋的規則相對簡單，使得其受眾遠比圍棋多，換句話來說，我把BetaMeow做出來了，那麼可以測試的人也多。

機器學習的簡單介紹

近年機器學習，資料探勘,人工智慧很火，但其實不少人對這些名詞其實是一頭霧水，我嘗試用我自己的語言解釋，如果有什麼需要完善的地方，歡迎提出。

比如說，有一個模型能夠能夠根據一個人的社交動態，推斷出他是喜歡蘋果還是香蕉，那麼，我現在想知道某個社交平臺上市喜歡蘋果的人多，還是喜歡香蕉的人多。顯然，我把社交平臺的資料扔進模型中跑一遍就可以了，但社交平臺資料肯定不是說一兩個txt檔案這麼簡單啊。這時就可能涉及網路爬蟲(收集資料)，分散式儲存(資料量巨大的時候)，過濾無關的資料(資料清洗),修改模型使得符合當前業務場景(花式調參)，跑完資料獲得結果後決定採取什麼商業措施等。(BI)

機器學習就是負責考慮如何建立模型，而資料探勘則是負責其他地方，不過一般來說，資料探勘部分的工作可能會分開幾個部門來做。

簡言之，機器學習是內功，而資料探勘則是機器學習的一種用途。而人工智慧，就是更廣的概念了

五子棋AI

回到正題上，傳統的五子棋AI採用的搜尋演算法，這個方面其實已經很完善，聽聞已經出現了無解的結果(玩家無法取勝)。但BetaMeow本質上是我在學習機器學習方面的實戰專案，所以我想辦法利用機器學習的方面的演算法實現。

最後選擇決策樹演算法。通過決策樹判斷該局的狀況，屬於對方（玩家）佔優還是己方（AI）佔優。

什麼叫決策樹

至於什麼叫決策樹，有時真的是一圖勝千言。

BetaMeow：利用機器學習做五子棋AI

圖片來至於http://www.52analysis.com/shujuwajue/2441.html

簡單來說，通過一層層的篩選下來，你就能獲得相應的結果。

如何構建決策樹

關於如何構建決策樹，如果需要了解文字說明，可以參考這裡,如果需要參考python的程式碼實現，可以參考下文給出的github地址，這裡只給出簡單總結。

簡單描述

在一個二維集合（可以看成矩陣）中，第二維代表每一個決策的例項，用某種方式（例如資訊增益（首先要計算熵））在確定一個最佳分割點（p），然後以該點作為根節點，此時剩下的子集有兩種情況，要麼作為決策樹的結果，要麼遞迴下去建立子樹。

選取特徵

有句話叫好的資料勝過好的模型，經過這番實踐我算是真正認識到這句話的意思。機器學習的演算法不是你隨便扔一個資料集下去，他都能訓練出一個有效的模型。我曾經把整個棋局扔給他它訓練，然而並沒有什麼亂用。幾番周折才角色以連子形式作為訓練的內容。

舉個例子

[1,1,0,1,2]

1	[1,1,0,1,2]

這個訓練集表明，玩家的連子形式已經是1，1，0，1（0表示空位），如果玩家順利連成了4子，那麼AI則徹底出於劣勢，因為如果4子是在棋盤中間的話，那麼ai只能堵一邊，玩家還是可以在另一邊連成5子。

所以ai應該下在2號位，阻止其連成4子。

我的程式碼中有大量如此的資料，用於教會ai決定是及時阻止對方，還是提高自己的連子數。(跑兩次不同的決策樹)

BetaMeow的未來與本文後話

BetaMeow現在顯然是不完善的。

首先是五子棋規則的本身，首先是五子棋棋盤應該15x15，然後無知的我把它弄成了19x19,然後規先後手的規則好像也有不同的規定，但我沒有考慮太多這方面，畢竟我的主要目的是機器學習的實踐，並非做出一個五子棋遊戲。五子棋只是一個載體。
同樣是因為我的目的在於演算法，所以介面不太美觀，甚至在不同解析度上可能有問題(使用的bootstrap應該問題不大)，所以如果有較為熟悉前端的朋友，歡迎修改修改後Pull Requese給我。
第二點，演算法本身也有不完善的地方。
因為目前的方案是遍歷棋局，分析各店的形式，可能因為迴圈的原因，會導致後面的選擇覆蓋掉前一個選擇，從而錯過了一些最好的選擇。

下一步會是給每一個選擇的結果加上權重，從而避免上述問題。

嗯，說了這麼多，最後給出這個專案的github地址

my_github

重要的事情再說一遍。

前端真的做得很爛，如果有熟悉前端的朋友幫我修改一下，真的萬分感謝。

這個github地址會記錄下我學習機器學習和資料探勘的各種小專案(包括我之前的圖片識別的專案)，將會持續更新很長一段時間，如果你對這個有興趣，歡迎關注和支援。

如果你也有機器學習和資料探勘等相關的專案，歡迎推薦給我，大家互相學習的同時，我也會在我的專案的README中給出你專案的URL(你也要給出我專案的URL哦，親)

感謝關注和支援。

python做一個人機對戰五子棋，AI版本
2020-12-25
PythonAI
Java做的五子棋
2013-07-17
Java
用 AI 發電？機器學習激發風能利用價值
2019-02-28
AI機器學習
五子棋AI演算法（一）
2019-10-18
AI演算法
AI時代 IT工程師如何利用自身優勢做量化投資
2020-04-04
AI工程師
【火爐煉AI】機器學習054-用ICA做盲源分離
2018-10-31
AI機器學習
利用RMAN做TSPITR
2009-07-22
做機器學習專案的checklist
2020-01-21
機器學習
機器學習、深度學習、和AI演算法可以在網路安全中做什麼？
2018-03-29
機器學習深度學習AI演算法
如何利用機器學習創造價值？
2018-11-20
機器學習
如何輕鬆利用GPU加速機器學習？
2018-12-13
GPU機器學習
Java學習筆記(七)：五子棋AI演算法
2019-02-08
Java筆記AI演算法
利用notion做知識管理
2024-06-03
利用Python，四步掌握機器學習
2016-02-23
Python機器學習
嘗試 H2o 做機器學習
2022-11-27
機器學習
五子棋AI：實現邏輯與相關背景探討（上）
2024-09-07
AI
五子棋AI：實現邏輯與相關背景探討（下）
2024-09-07
AI
node.js利用socket.io實現多人線上匹配聯機五子棋
2018-05-31
Node.js
利用LSTM做語言情感分類
2018-09-08
利用cookie做五星好評
2020-11-01
Cookie
利用RDA對Oracle做健康檢查
2015-05-04
Oracle
如何利用fiddler做mock測試
2024-09-13
Mock
做資料分析需要學習機器學習嗎？
2020-01-15
機器學習
關於五子棋電腦AI演算法的一些思考
2012-04-22
AI演算法
自動機器學習和AI初學者指南
2018-12-04
機器學習AI
五子棋java
2024-06-14
Java
機器學習大神邁克爾 · 喬丹：我討厭將機器學習稱為AI
2018-03-21
機器學習AI
利用機器學習進行惡意程式碼分類
2020-08-19
機器學習
如何利用機器學習甄別淘寶優質店鋪
2019-01-07
機器學習
gitPic,利用Github做圖床小工具
2018-03-13
Github圖床
優秀的機器學習開發者都是這樣做的！
2018-09-12
機器學習
機器學習能在遊戲開發中做什麼？
2018-05-12
機器學習遊戲開發
如何利用AI做互動設計？北美互動設計師推薦10個顯著幫助UI/UX設計的AI工具！
2023-11-30
AIUIUX
腦洞大開！機器學習與AI突破（附連結）
2019-05-07
機器學習AI
什麼是AI、機器學習與深度學習？
2019-01-21
AI機器學習深度學習
AI=機器學習²，我們在去往²的路上
2018-10-07
AI機器學習
什麼是 AI、機器學習與深度學習？
2019-01-24
AI機器學習深度學習
AI與機器學習：探索智慧未來的前沿
2024-03-27
AI機器學習

BetaMeow：利用機器學習做五子棋AI

機器學習的簡單介紹

五子棋AI

什麼叫決策樹

如何構建決策樹

簡單描述

選取特徵

BetaMeow的未來與本文後話

相關文章