比AlphaGo Zero更強的AlphaZero來了!8小時解決一切棋類!

lt發表於2017-12-06

https://zhuanlan.zhihu.com/p/31749249
使用與AlphaGo Zero一模一樣的方法(同樣是MCTS+深度網路,實際還做了一些簡化),它從零開始訓練:
•4小時就打敗了國際象棋的最強程式Stockfish!
•2小時就打敗了日本將棋的最強程式Elmo!
•8小時就打敗了與李世石對戰的AlphaGo v18!

訓練AlphaZero所需的計算資源也是海量的。這次Deepmind直接說了,需要5000個TPU v1作為生成自對弈棋譜。

相關文章