新鮮開源:基於TF2.0的深度強化學習平臺

AI科技大本營發表於2019-02-23

640?wx_fmt=jpeg


整理 | Jane

出品 | AI科技大本營(公眾號id:rgznai100)


近日,Github 一位開發者 danaugrs 開源了一個新專案——Huskarl,一個專注研究和快速原型的深度強化學習框架。


此框架基於 TensorFlow 2.0 構建,使用了 tf.keras API,保證了其簡潔性和可讀性。Huskarl 可以使多環境的平行計算變得很容易,這將對加速策略學習演算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 還可以與 OpenAI Gym 環境無縫結合,並將計劃支援多代理環境和 Unity3D  環境。


OpenAI Gym:2016 年 OpenAI 釋出的一個可以開發、對比強化學習演算法的工具包,提供了各種環境、模擬任務等,任何人都可以在上面訓練自己的演算法。

Unity3D:一個全面整合的專業遊戲引擎,由 Unity Technologies 開發的一款可以讓玩家輕鬆建立三維視訊遊戲、實時三維動畫等型別互動內容的多平臺綜合型遊戲開發工具。


目前,Huskarl 已經支援了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等演算法,還有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等演算法在計劃中。

     

640?wx_fmt=png


最重要的是,TF 2.0 的 nightly 已經發布,這個開源工具也是基於 TF2.0 開發的,所以大家要先安裝一下 tf 2.0 nighty 版本。除此之外,還需要安裝以下工具和環境:

     

640?wx_fmt=png


這個工具還是新鮮出爐燙手的呢,大家趕緊來嚐鮮試一下~


地址:

https://github.com/danaugrs/huskarl




(本文為AI科技大本營原創文章,轉載請微信聯絡 1092722531)


群招募


掃碼新增小助手微信,回覆:公司+研究方向(學校+研究方向),邀你加入技術交流群。技術群稽核較嚴,敬請諒解。

640?wx_fmt=jpeg

推薦閱讀:

                         640?wx_fmt=png

點選“閱讀原文”,檢視歷史精彩文章。

相關文章