新鮮開源:基於TF2.0的深度強化學習平臺
整理 | Jane
出品 | AI科技大本營(公眾號id:rgznai100)
近日,Github 一位開發者 danaugrs 開源了一個新專案——Huskarl,一個專注研究和快速原型的深度強化學習框架。
此框架基於 TensorFlow 2.0 構建,使用了 tf.keras API,保證了其簡潔性和可讀性。Huskarl 可以使多環境的平行計算變得很容易,這將對加速策略學習演算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 還可以與 OpenAI Gym 環境無縫結合,並將計劃支援多代理環境和 Unity3D 環境。
OpenAI Gym:2016 年 OpenAI 釋出的一個可以開發、對比強化學習演算法的工具包,提供了各種環境、模擬任務等,任何人都可以在上面訓練自己的演算法。
Unity3D:一個全面整合的專業遊戲引擎,由 Unity Technologies 開發的一款可以讓玩家輕鬆建立三維視訊遊戲、實時三維動畫等型別互動內容的多平臺綜合型遊戲開發工具。
目前,Huskarl 已經支援了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等演算法,還有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等演算法在計劃中。
最重要的是,TF 2.0 的 nightly 已經發布,這個開源工具也是基於 TF2.0 開發的,所以大家要先安裝一下 tf 2.0 nighty 版本。除此之外,還需要安裝以下工具和環境:
這個工具還是新鮮出爐燙手的呢,大家趕緊來嚐鮮試一下~
地址:
https://github.com/danaugrs/huskarl
(本文為AI科技大本營原創文章,轉載請微信聯絡 1092722531)
群招募
掃碼新增小助手微信,回覆:公司+研究方向(學校+研究方向),邀你加入技術交流群。技術群稽核較嚴,敬請諒解。
推薦閱讀:
點選“閱讀原文”,檢視歷史精彩文章。
相關文章
- 完全基於 Java 的開源深度學習平臺,亞馬遜的大佬帶你上手Java深度學習亞馬遜
- 關於強化學習、深度學習deeplearning研修強化學習深度學習
- 《深度強化學習》手稿開放了!強化學習
- 《動手學深度學習》TF2.0 實現深度學習TF2
- 深度學習及深度強化學習研修深度學習強化學習
- 基於深度強化學習(DQN)的迷宮尋路演算法強化學習演算法
- 基於深度學習的單通道語音增強深度學習
- 英特爾貢獻基於 Kubernetes 分散式深度學習平臺:Nauta分散式深度學習
- 新的深度學習優化器Ranger:RAdam + LookAhead強強結合深度學習優化Ranger
- 深度學習及深度強化學習應用深度學習強化學習
- 深度學習+深度強化學習+遷移學習【研修】深度學習強化學習遷移學習
- 深度強化學習day01初探強化學習強化學習
- 強化學習(十七) 基於模型的強化學習與Dyna演算法框架強化學習模型演算法框架
- DeepMind開源強化學習庫TRFL強化學習
- Google開源TensorFlow強化學習框架!Go強化學習框架
- 基於策略搜尋的強化學習方法強化學習
- PaddlePaddle深度學習開源平臺 :等待眾人划槳的中國AI大船深度學習AI
- 人人都能用的深度學習:當前三大自動化深度學習平臺簡介深度學習
- IoTSharp:基於 .NET 8.0 的開源物聯網平臺
- 基於CPU的深度學習推理部署優化實踐深度學習優化
- 流式深度學習終於奏效了!強化學習之父Richard Sutton力薦深度學習強化學習
- 深度強化學習技術開發與應用強化學習
- 愛奇藝深度學習雲平臺的實踐及優化深度學習優化
- 基於pytorch的深度學習實戰PyTorch深度學習
- 基於TensorFlow的深度學習實戰深度學習
- 開源的 API 學習平臺「GitHub 熱點速覽」APIGithub
- 強化學習的基礎缺陷強化學習
- 東方金科基於開源的開發平臺建設之路
- 深度學習、強化學習核心技術實戰深度學習強化學習
- 【機器學習基礎】關於深度學習的Tips機器學習深度學習
- DeepMind 一次性開源 3 個新框架!深度強化學習應用落地即將迎來春天?框架強化學習
- 愛奇藝深度學習雲平臺的實踐及最佳化深度學習
- 基於 Github 平臺的 .NET 開源專案模板. 嘎嘎實用!Github
- Netflix開源Mantis:基於微服務的運維監控平臺微服務運維
- 基於動態規劃的強化學習演算法動態規劃強化學習演算法
- AAAI 2019 | 基於分層強化學習的關係抽取AI強化學習
- 【深度學習-基於Tensorflow的實戰】公開課實況深度學習
- BookStack:一個開源的維基平臺