DeepMind 把自己的“殺手鐗”開源了

AIBigbull2050發表於2019-08-29
2019-08-28 18:38:09
DeepMind 把自己的“殺手鐗”開源了

雷鋒網注:圖片來自DeepMind

眾所周知,強化學習(Reinforcement Learning)是一種人工智慧訓練技術,無論是在棋 牌遊戲方面打敗人類選手的機器人,還是在訓練自動駕駛系統方面,強化學習都起著至關重要的作用。

近日,Alphabet 旗下的 DeepMind 發表了一篇由 27 位研究人員共同完成的論文,詳細介紹了一個名為 OpenSpiel 的針對遊戲的強化學習框架——這正是 DeepMind 的長處所在。

OpenSpiel 厲害在哪兒?

這個名叫 OpenSpiel 的框架可以看作是一個強化學習環境和演算法的集合(其中大部分環境和演算法已經進行了全面測試),可以用於通用強化學習的研究和遊戲的搜尋/規劃研究;它還為分析學習動態和其他常見評估指標提供了工具。

雷鋒網在論文中發現,OpenSpiel 旨在許多不同的遊戲中促進多智慧體強化學習,重點是學習,而不是競爭;而且,該框架的建設基於兩個重要標準,即簡單和輕量——簡單主要體現在程式語言方面,即便是來自不同領域的研究人員也能輕易理解;輕量則體現在 OpenSpiel 將依賴關係保持在最低限度,降低了出現相容性問題的可能性。

就目前而言,OpenSpiel 框架中包含了 28 款遊戲和 24 種演算法。正如“Spiel(棋 牌遊戲)”一詞所含之意那樣,該框架支援的也都是相關的遊戲;而且,這些遊戲也包括多種博弈方式,比如,常和博弈、零和博弈、協調博弈和一般博弈。在程式語言方面,OpenSpiel 的遊戲通過 C++ 來實現、演算法則通過 C++ 和 Python 來實現,程式碼的一個子集也被移植到 Swift。

不過,DeepMind 的研究人員指出,OpenSpiel 只在 Linux 系統上進行了測試(Debian 10 和 Ubuntu 19.04),但由於 MacOS 和 Windows 上可自由使用程式碼,Openspiel 在這些平臺上編譯和執行時應該也不會出現問題。

怎麼安裝 OpenSpiel?

  • 在論文中,DeepMind 也給出了 OpenSpiel 的安裝方式,他們已經在 Debian 和 Ubuntu 兩個 Linux 系統上測試了框架。安裝方式如下:

DeepMind 把自己的“殺手鐗”開源了

值得一提的是,DeepMind 目前還沒有在 Linux 以外的平臺上測試 OpenSpiel,所以,一些指令碼和指令目前是假定基於 Debian 的發行版(Debian 和 Ubuntu)。如果使用的是其他 Linux 發行版本,install.sh 裡安裝依賴項的命令依然可用,不過,安裝命令需要自行修改。

  • 為了能夠從任何位置匯入 Python 程式碼,需要將根目錄和 open_spiel 目錄新增到 PYTHONPATH 之中。

  • 在遵循上述步驟構建好 OpenSpiel 之後,從 build 目錄中執行示例。

  • 接下來就可以看到框架裡的遊戲列表,並且執行遊戲了。

雷鋒網注:論文連結為 https://arxiv.org/pdf/1908.09453.pdf

專案地址為 https://github.com/deepmind/open_spiel


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2655384/,如需轉載,請註明出處,否則將追究法律責任。

相關文章