OpenAI釋出可擴充套件的元學習演算法Reptile | 論文+程式碼+Demo
安妮 編譯自 OpenAI官方部落格
量子位 出品 | 公眾號 QbitAI
昨天,OpenAI釋出了一種新型的可擴充套件元學習演算法Reptile,還能線上試玩。
何為Reptile?難道是——
咳咳嚴肅一點。
據OpenAI官方部落格顯示,這是通過重複對一個任務進行取樣、隨機梯度下降並將初始引數更新為從任務中學習到的最終引數的演算法。
這種方法不禁讓人想到去年七月伯克利AI研究所關於未知模型元學習法(MAML)的研究。OpenAI表示,Reptile的效果和MAML相似,但實現起來更簡單,計算效率更高。
UC伯克利MAML相關論文:
http://bair.berkeley.edu/blog/2017/07/18/learning-to-learn/
試玩demo
元學習(Meta-learning)是一種學習如何學習的過程。向元學習演算法中輸入任務的分佈,相當於每個任務都是一個需要學習的任務,演算法會產生一個快速的learner,每個learner可以從少數樣例中進行歸納。
小樣本學習(Few-shot Learning)分類問題是元學習中研究得比較充分的課題,learner只能從每個類中看到1-5個輸入-輸出樣例,然後對新的輸入進行分類。
下面是一個one-shot互動式演示的demo,可以在OpenAI的部落格上試玩這個應用了Reptile小模型。
△ 前三張圖為標記樣例,每張代表一個類別;最右是輸入未知樣例,Reptile將它劃分到最像的類別中
你可以通過點選“Edit All”(編輯所有),隨心畫三個不同的形狀,然後在最右邊的輸入欄中再畫一個,看看Retile是如何對它進行分類的。
量子位也隨手畫了幾筆參與了一下這個專案:
△ 畫工有限,見諒
△ 嗯,已經寫不下一個“樂”了
Reptile認為,量子位手畫的小女孩應該屬於“熊貓”分類,手寫的“快”字和“節”更相像,應該分到這個分類中的可信度高達95.9%。
想試玩demo可以移步介紹頁面:
https://blog.openai.com/reptile/
目前,相關研究的論文也已經放出:
https://d4mucfpksywv.cloudfront.net/research-covers/reptile/reptile_update.pdf
So does 程式碼(TensorFlow實現):
https://github.com/openai/supervised-reptile
一個基於JavaScript的實現(文中我們玩的那個demo就是用它做的~):
https://github.com/openai/supervised-reptile/tree/master/web
祝你玩得開心~
— 完 —
加入社群
量子位AI社群15群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot6入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微訊號qbitbot6,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- 數論學習筆記 (4):擴充套件歐幾里得演算法筆記套件演算法
- Apollo 釋出 GraphQL 平臺和 VS 程式碼擴充套件套件
- Chrome 擴充套件程式的開發與釋出 — 手把手教你開發擴充套件程式Chrome套件
- 編寫可擴充套件程式套件
- Scikit-learn可擴充套件學習簡介套件
- C#可擴充套件程式設計之MEF學習筆記(一):MEF簡介及簡單的DemoC#套件程式設計筆記
- sql中的擴充套件學習SQL套件
- Jenkins2.65釋出,可擴充套件的持續整合引擎Jenkins套件
- 可擴充套件性套件
- 聊聊如何讓你的業務程式碼具有可擴充套件性套件
- Visual Studio 的碼雲擴充套件 V1.0.85 釋出套件
- Laravel深入學習7 – 框架的擴充套件Laravel框架套件
- 高擴充套件性的學習路線套件
- 可擴充套件的搜尋元件套件元件
- Chrome 擴充套件外掛開發DEMOChrome套件
- C#可擴充套件程式設計之MEF學習筆記(三):匯出類的方法和屬性C#套件程式設計筆記
- CheckBoxList擴充套件方法程式碼套件
- Laravel核心程式碼學習 -- 擴充套件使用者認證系統Laravel套件
- Chrome瀏覽器擴充套件程式可竊取明文密碼Chrome瀏覽器套件密碼
- 數論分塊擴充套件套件
- PHP的Mhash擴充套件函式的學習PHP套件函式
- 學習筆記----擴充套件歐幾里德筆記套件
- 可擴充套件物件導向的canvas畫圖程式套件物件Canvas
- 「擴充套件包」Laravel-filesystem-oss 2.0 釋出套件Laravel
- PHP 高效能 Excel 擴充套件 1.2.7 釋出PHPExcel套件
- VS Code 首個 Semantic Kernel 擴充套件釋出套件
- Google釋出Chrome加密擴充套件End-To-EndGoChrome加密套件
- C#可擴充套件程式設計之MEF學習筆記(二):MEF的匯出(Export)和匯入(Import)C#套件程式設計筆記ExportImport
- 演算法導論 3.1-8 記號擴充套件演算法套件
- 學習PHP中YAML操作擴充套件的使用PHPYAML套件
- es6陣列擴充套件的學習陣列套件
- 最新!Chrome釋出擴充套件程式五大新變化Chrome套件
- 輕鬆釋出一個自己的composer擴充套件套件
- Flask學習日誌(五) - Flask擴充套件Flask套件
- 可擴充套件性筆記一套件筆記
- Dubbo原始碼學習之-Adaptive自適應擴充套件原始碼APT套件
- 寫擴充套件性好的程式碼:函式套件函式
- 為效能而生,PHP Excel 擴充套件 xlswriter 1.3.3 釋出!PHPExcel套件