DeepMind釋出神經網路、強化學習庫,網友:推動JAX發展
DeepMind今日釋出了 Haiku和 RLax兩個庫,都是基於JAX。
JAX由谷歌提出,是TensorFlow的簡化庫。結合了針對線性代數的編譯器XLA,和自動區分本地 Python 和 Numpy 程式碼的庫Autograd,在高效能的機器學習研究中使用。
而此次釋出的兩個庫,分別針對 神經網路和 強化學習,大幅簡化了JAX的使用。
Haiku是基於JAX的神經網路庫,允許使用者使用熟悉的物件導向程式設計模型,可完全訪問 JAX 的純函式變換。
RLax是JAX頂層的庫,它提供了用於實現增強學習代理的有用構件。
有意思的是,Reddit網友驚奇的發現Haiku這個庫的名字,竟然不以“ax”結尾。
當然,也有網友對這兩個庫表示了肯定:
毫無疑問,對JAX起到了推動作用。
那麼,我們就來看下Haiku和RLex的廬山真面目吧。
Haiku
Haiku是JAX的神經網路庫,它允許使用者使用熟悉的物件導向程式設計模型,同時允許完全訪問JAX的純函式轉換。
它提供了兩個核心工具:模組抽象hk.Module,和一個簡單的函式轉換hk.transform。
hk.Module是Python物件,包含對其自身引數、其他模組和對使用者輸入應用函式方法的引用。
hk.transform允許完全訪問JAX的純函式轉換。
其實,在JAX中有許多神經網路庫,那麼Haiku有什麼特別之處呢?有5點。
1、Haiku已經由DeepMind的研究人員進行了大規模測試
DeepMind相對容易地在Haiku和JAX中複製了許多實驗。其中包括影像和語言處理的大規模結果、生成模型和強化學習。
2、Haiku是一個庫,而不是一個框架
它的設計是為了簡化一些具體的事情,包括管理模型引數和其他模型狀態。可以與其他庫一起編寫,並與JAX的其他部分一起工作。
3、Haiku並不是另起爐灶
它建立在Sonnet的程式設計模型和API之上,Sonnet是DeepMind幾乎普遍採用的神經網路庫。它保留了Sonnet用於狀態管理的基於模組的程式設計模型,同時保留了對JAX函式轉換的訪問。
4、過渡到Haiku是比較容易的
通過精心的設計,從TensorFlow和Sonnet,過渡到JAX和Haiku是比較容易的。除了新的函式(如hk.transform),Haiku的目的是Sonnet 2的API。
5、Haiku簡化了JAX
它提供了一個處理隨機數的簡單模型。在轉換後的函式中,hk.next_rng_key()返回一個唯一的rng鍵。
那麼,該如何 安裝Haiku呢?
Haiku是用純Python編寫的,但是通過JAX依賴於c++程式碼。
首先,按照下方連結中的說明,安裝帶有相關加速器支援的JAX。https://github.com/google/jax#installation
然後,只需要一句簡單的pip命令就可以完成安裝。
$ pip install git+https://github.com/deepmind/haiku
接下來,是一個神經網路和損失函式的例子。
import haiku as hkimport jax.numpy as jnpdef softmax_cross_entropy(logits, labels): one_hot = hk.one_hot(labels, logits.shape[-1]) return -jnp.sum(jax.nn.log_softmax(logits) * one_hot, axis=-1)def loss_fn(images, labels): model = hk.Sequential([ hk.Linear(1000), jax.nn.relu, hk.Linear(100), jax.nn.relu, hk.Linear(10), ]) logits = model(images) return jnp.mean(softmax_cross_entropy(logits, labels))loss_obj = hk.transform(loss_fn)
RLax
RLax是JAX頂層的庫,它提供了用於實現增強學習代理的有用構件。
它所提供的操作和函式不是完整的演算法,而是強化學習特定數學操作的實現。
RLax的安裝也非常簡單,一個pip命令就可以搞定。
pip install git+git://github.com/deepmind/rlax.git
使用JAX的jax.jit函式,所有的RLax程式碼可以不同的硬體上編譯。
RLax需要注意的是它的命名規則。
許多函式在連續的時間步長中考慮策略、操作、獎勵和值,以便計算它們的輸出。在這種情況下,字尾_t和tm1通常是為了說明每個輸入是在哪個步驟上生成的,例如:
q_tm1:轉換的源狀態中的操作值。a_tm1:在源狀態下選擇的操作。r_t:在目標狀態下收集的結果獎勵。q_t:目標狀態下的操作值。
Haiku和RLax都已在GitHub上開源,有興趣的讀者可從“傳送門”的連結訪問。
傳送門
Haiku:https://github.com/deepmind/haiku
RLax:https://github.com/deepmind/rlax
— 完 —
https://www.toutiao.com/i6795755292026995208/
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2676820/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 《深入淺出神經網路與深度學習》動態示例神經網路深度學習
- DeepMind開源強化學習庫TRFL強化學習
- 《深入淺出神經網路與深度學習》譯者後記神經網路深度學習
- DeepMind圖網路庫開源了!
- 牛津教授吐槽DeepMind心智神經網路,還推薦了這些多智慧體學習論文神經網路智慧體
- 神經網路也能解數學題,DeepMind釋出千萬數學題海資料集神經網路
- DeepMind開發用於量子化學計算的神經網路變分蒙特卡羅神經網路
- 【工業網際網路】劉多:實施工業網際網路創新發展戰略推動實體經濟高質量發展;論工業網際網路的聯接性...
- 友盟+:2020年疫期移動網際網路行業發展動態分析報告行業
- 神經網路的發展史神經網路
- 華為雲CDN,如何推動網際網路行業健康發展?行業
- 強化學習、聯邦學習、圖神經網路,飛槳全新工具元件詳解強化學習聯邦學習神經網路元件
- DeepMind開源圖網路庫,一種結合圖和神經網路的新方法神經網路
- 深度學習與圖神經網路學習分享:CNN 經典網路之-ResNet深度學習神經網路CNN
- 【強化學習】不用地圖如何導航?DeepMind提出新型雙路徑強化學習「智慧體」架構強化學習地圖智慧體架構
- DAMA|以數字化轉型為主要抓手,推動工業網際網路創新發展
- Jax 生態再添新庫:DeepMind 開源 Haiku、RLaxAI
- 機器學習之神經網路機器學習神經網路
- 神經網路學習參考神經網路
- 神經網路碰上高斯過程,DeepMind論文開啟深度學習新方向神經網路深度學習
- 【深度學習篇】--神經網路中的卷積神經網路深度學習神經網路卷積
- TensorFlow筆記-07-神經網路優化-學習率,滑動平均筆記神經網路優化
- 神經網路進化能否改變機器學習?神經網路機器學習
- 360攜手湘潭大學,為推動網路安全發展夯實人才基礎
- 文字生成神經網路架構發展神經網路架構
- 中國工業網際網路研究院院長魯春叢:推動工業網際網路創新發展的四點經驗XGXN
- 再聊神經網路與深度學習神經網路深度學習
- AI之(神經網路+深度學習)AI神經網路深度學習
- 【深度學習】神經網路入門深度學習神經網路
- 深度學習與圖神經網路深度學習神經網路
- 機器學習整理(神經網路)機器學習神經網路
- 友盟+:2019上半年暨Q3移動網際網路發展報告(附下載)
- Anthropic挖走DeepMind強化學習大牛、AlphaGo核心作者Julian Schrittwieser強化學習Go
- 網際網路賦能工業品行業,推動產業快速發展與服務最佳化升級行業產業
- 卷積神經網路學習筆記——Siamese networks(孿生神經網路)卷積神經網路筆記
- 高層釋放“推動增加網路娛樂消費”訊號 或推動遊戲產業進一步發展遊戲產業
- DeepMind開源強化學習環境,場景靈活介面簡單,推特高贊強化學習
- 淺聊卷積神經網路的發展卷積神經網路