Google開源TensorFlow強化學習框架!
今天,谷歌宣佈開源基於 TensorFlow 的強化學習框架——Dopamine。
GitHub repo:https://github.com/google/dopamine
強化學習是一種人工智慧(AI)技術,它使用獎勵(或懲罰)來驅動agent朝著特定目標前進,比如之前大火的Alpha Go擊敗人類頂尖圍棋選手,還有在 Dota2 對戰人類職業玩家的Open AI Five。同時,強化學習也是DeepMind 的深度Q 網路(DQN)的核心部分,可以在多個workers 中分配學習,例如,在Atari 2600遊戲中實現“超人”效能。麻煩的是,強化學習框架需要時間來掌握一個目標,往往是不靈活的,也不夠穩定。
這就是谷歌提出替代方案的原因:基於TensorFlow的開源強化學習框架——Dopamine,從今天開始,它可以從Github獲得。
(https://github.com/google/dopamine/tree/master/docs#downloads)
谷歌研究人員表示,他們開源的這個 TensorFlow 強化學習框架強調三點: 靈活、穩定和可重複性。
受到主要元件之一大腦中獎勵動機行為行為的啟發,以及反映神經科學和強化學習的研究之間的聯絡,這個平臺的目的是使推測性研究推動根本性的發現,此版本還包括一組闡明如何使用整個框架的colabs。
易用性
為此,它包括了一套精心編寫的程式碼(15個Python檔案),專注於Arcade學習環境(一個用視訊遊戲評估AI技術的平臺)以及四種不同的機器學習模型:上述提到的深度Q 網路(DQN); C51; Rainbow agent的一個簡化版本; Implicit Quantile Network agent。清晰和簡潔是這個框架設計中的兩個關鍵考慮因素。
可重複性
為了實現強化學習的可重複性,程式碼在Arcade學習環境支援的60個遊戲中提供完整的測試覆蓋率和訓練資料(採用JSON和Python pickle格式),並遵循標準化結果以進行實證評估的最佳實踐。
基準測試
對於新的研究者來說,對自己的想法進行快速的基準測試是非常重要的。谷歌提供四個智慧體的完整訓練資料,包括ALE 支援的60 個遊戲,格式為Python pickle 檔案(對於使用谷歌框架訓練的智慧體)和JSON 資料檔案(用於對比其他框架訓練的智慧體)。谷歌還提供了一個網站,研究者可以使用該網站對所有提供智慧體在所有60 個遊戲中的訓練執行進行快速視覺化。
除此之外,谷歌還推出了一個網站,允許開發人員將多個訓練中智慧體的執行情況快速視覺化。它還提供經過訓練的模型、原始統計日誌和TensorFlow event files,用於TensorBoard動態圖的繪製,TensorBoard是一個web應用視覺化套件。
“我們的希望是,我們的框架的靈活性和易用性將使研究人員能夠嘗試新的思想,無論是漸進的還是激進的。”作者Bellemare和Castro表示,“我們已經積極地將它用於我們的研究,而且發現它能夠使我們能夠靈活地快速迭代許多想法。我們很高興看到更多的社群可以應用這一框架。”
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31509949/viewspace-2213020/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 推薦閱讀《Tensorflow:實戰Google深度學習框架》Go深度學習框架
- 《Tensorflow:實戰Google深度學習框架》圖書推薦Go深度學習框架
- 劍橋大學等開源RLgraph框架,讓強化學習測試視覺化框架強化學習視覺化
- DeepMind開源強化學習庫TRFL強化學習
- 深度學習之Tensorflow框架深度學習框架
- 開源 POC 框架學習 (kunpeng)框架
- DeepMind開源強化學習遊戲框架,25款線上遊戲等你來挑戰強化學習遊戲框架
- 強化學習(十七) 基於模型的強化學習與Dyna演算法框架強化學習模型演算法框架
- TensorFlow學習資源彙總
- 如何在TensorFlow 2.0中構建強化學習智慧體強化學習智慧體
- TensorFlow 框架的開源工具箱 Ludwig框架開源工具
- TensorFlow釋出面向JavaScript開發者的機器學習框架TensorFlow.jsJavaScript機器學習框架JS
- 深度學習開發必備開源框架深度學習框架
- 強化學習的框架化,會引爆AI開發的新腦洞嗎?強化學習框架AI
- 《深度強化學習》手稿開放了!強化學習
- 聯邦學習開源框架FATE架構聯邦學習框架架構
- 強化學習強化學習
- 強化學習-學習筆記13 | 多智慧體強化學習強化學習筆記智慧體
- 【強化學習篇】--強化學習案例詳解一強化學習
- 【強化學習】強化學習術語表(A-Z)強化學習
- 深度強化學習day01初探強化學習強化學習
- 突破!自然語言強化學習(NLRL):一個可處理語言反饋的強化學習框架強化學習框架
- 【TensorFlow篇】--Tensorflow框架視覺化之Tensorboard框架視覺化ORB
- 曠視宣佈開源深度學習框架“天元”深度學習框架
- 強化學習10——迭代學習強化學習
- DeepMind 一次性開源 3 個新框架!深度強化學習應用落地即將迎來春天?框架強化學習
- 新鮮開源:基於TF2.0的深度強化學習平臺TF2強化學習
- matplotlib 強化學習強化學習
- Tensorflow 學習
- DeepMind用元強化學習框架探索多巴胺在學習過程中的作用強化學習框架
- 【強化學習篇】--強化學習從初識到應用強化學習
- TensorFlow Hub:探索機器學習元件化機器學習元件化
- 微軟開源機器學習框架——infer.NET微軟機器學習框架
- 微軟開源機器學習框架——infer.NET微軟機器學習框架
- .NET資料探勘與機器學習開源框架機器學習框架
- 領英開源TonY:構建在Hadoop YARN上的TensorFlow框架HadoopYarn框架
- 百度正式釋出PaddlePaddle深度強化學習框架PARL強化學習框架
- Dopamine - 靈活、可重複的強化學習研究新框架強化學習框架