DeepMind認為他們的神經網路可以實現類似人類的想象力 - kdnuggets
為了在深度學習代理中實現“想象力”,DeepMind團隊依賴於稱為I2A的聰明的神經網路架構。I2A體系結構的關鍵元素是一個稱為Imagination Core的元件,該元件使用環境模型,在獲得有關當前環境的資訊的情況下,對其未來狀態進行預測。
對於指定過去的狀態和當前的動作,這個環境模型可以預測下一個狀態以及來自環境的任何數量的訊號。I2A體系結構透過使用當前的實時觀測值初始化想象的軌跡,然後將模擬的觀測值輸入到模型中,在未來的多個時間步驟中推出環境模型。每個部署中產生的操作有助於定義代理策略,然後由Imagination Core模組使用該策略。
為了檢查I2A模型的執行情況,DeepMind團隊建立了一個嘗試玩著名的推箱子游戲的實現。推箱子是一個經典的計劃問題,模型必須將多個箱子推入給定的目標位置。因為只能推箱子(而不是拉箱子),所以許多動作都是不可逆的,而且錯誤會使拼圖變得無法解決。因此,人類玩家被迫提前計劃動作。想象力增強的模型展示了從不完善的環境(如Sokoban)中學習的驚人能力,DeepMind團隊將I2A模型與更傳統的深度RL技術進行了基準比較,結果令人矚目。I2A達到了令人震驚的85%的效能,大大優於其他策略。
推箱子實驗最令人印象深刻的收穫之一是:增強想象力的機器學習模型能夠在可能不完美的環境模型中想象軌跡並忽略不準確資訊的能力。鑑於越來越多的場景需要AI使用不完善的資訊和有限的資料進行操作,因此這種能力特別重要。
想象力是人類思維中將我們與其他物種區分開的那些神奇特徵之一。從神經科學的角度來看,想象力是大腦在沒有任何直接感覺輸入的情況下形成影像或感覺的能力。想象力是我們學習過程的關鍵要素,因為它使我們能夠將知識應用於特定問題並更好地計劃未來的結果。當我們執行日常生活中的任務時,我們不斷地“想象”潛在的結果,以最佳化我們的行動。毫不奇怪,從認知的角度來看,想象力通常被認為是進行計劃的基礎。
想象力是可以為新一代AI開啟大門的關鍵功能之一。諸如I2A之類的技術仍處於起步階段,但可以成為強化學習體系結構的關鍵組成部分,在這種體系結構中,機器人不僅能夠學習現在,而且能夠“想象”未來。
相關文章
- 神經網路實現鳶尾花分類神經網路
- 圖卷積神經網路分類的pytorch實現卷積神經網路PyTorch
- DeepMind利用人工神經網路打造“類腦導航系統”神經網路
- PostgreSQL類似OracleMERGE功能的實現SQLOracle
- 神經網路:numpy實現神經網路框架神經網路框架
- 神經網路 | 基於MATLAB 深度學習工具實現簡單的數字分類問題(卷積神經網路)神經網路Matlab深度學習卷積
- TF2.keras 實現基於卷積神經網路的影象分類模型TF2Keras卷積神經網路模型
- TF2.keras 實現基於卷積神經網路的影像分類模型TF2Keras卷積神經網路模型
- YouGov:46%的美國人認為廣告可以幫助他們選擇商品Go
- 使用pytorch快速搭建神經網路實現二分類任務(包含示例)PyTorch神經網路
- 文字分類(下)-卷積神經網路(CNN)在文字分類上的應用文字分類卷積神經網路CNN
- YJango的迴圈神經網路——實現LSTMGo神經網路
- MySQL 06 mysql 如何實現類似 oracle 的 merge intoMySqlOracle
- 原生JS實現類似《掘金》網站的圖片檢視器JS網站
- 使用.net standard實現不同內網埠的互通(類似花生殼)內網
- 機器學習之多類別神經網路:Softmax機器學習神經網路
- 基於PyTorch框架的多層全連線神經網路實現MNIST手寫數字分類PyTorch框架神經網路
- YJango的迴圈神經網路——scan實現LSTMGo神經網路
- Tensorflow實現神經網路的前向傳播神經網路
- 卷積神經網路的原理及Python實現卷積神經網路Python
- 《卷積神經網路的Python實現》筆記卷積神經網路Python筆記
- 用 golang 去實現類似 swoole 的 websocket 服務 ?GolangWeb
- 如何實現類似 lodash 的 get 與 merge 函式函式
- 教你如何用SQLite 實現if not exist 類似功能的操作SQLite
- 設計一個基於 LSTM 神經網路的文字分類器神經網路文字分類
- 深度神經網路(DNN)是否模擬了人類大腦皮層結構?神經網路DNN
- python對BP神經網路實現Python神經網路
- [譯] RNN 迴圈神經網路系列 2:文字分類RNN神經網路文字分類
- 《自然》證實:計算機語言更類似人類語言計算機
- [Python人工智慧] 三.theano實現分類神經網路及機器學習基礎Python人工智慧神經網路機器學習
- 全連線神經網路的原理及Python實現神經網路Python
- DeepMind開源圖網路庫,一種結合圖和神經網路的新方法神經網路
- 並非無所不能——評DeepMind近期神經網路求解MIP的論文神經網路
- 類似dreamweaver在VSCode實現網頁製作的靜態CMS:Front MatterVSCode網頁
- 採用 SwiftNIO 實現一個類似 Express 的 Web 框架SwiftExpressWeb框架
- 在dotnet core實現類似crontab的定時任務
- Laravel 小技巧 - 讓路由實現類似 Model::query 的效果Laravel路由
- 深度解析:在 React 中實現類似 Vue 的 KeepAlive 元件ReactVue元件