OpenAI釋出可擴充套件的元學習演算法Reptile | 論文+程式碼+Demo
安妮 編譯自 OpenAI官方部落格
量子位 出品 | 公眾號 QbitAI
昨天,OpenAI釋出了一種新型的可擴充套件元學習演算法Reptile,還能線上試玩。
何為Reptile?難道是——
咳咳嚴肅一點。
據OpenAI官方部落格顯示,這是通過重複對一個任務進行取樣、隨機梯度下降並將初始引數更新為從任務中學習到的最終引數的演算法。
這種方法不禁讓人想到去年七月伯克利AI研究所關於未知模型元學習法(MAML)的研究。OpenAI表示,Reptile的效果和MAML相似,但實現起來更簡單,計算效率更高。
UC伯克利MAML相關論文:
http://bair.berkeley.edu/blog/2017/07/18/learning-to-learn/
試玩demo
元學習(Meta-learning)是一種學習如何學習的過程。向元學習演算法中輸入任務的分佈,相當於每個任務都是一個需要學習的任務,演算法會產生一個快速的learner,每個learner可以從少數樣例中進行歸納。
小樣本學習(Few-shot Learning)分類問題是元學習中研究得比較充分的課題,learner只能從每個類中看到1-5個輸入-輸出樣例,然後對新的輸入進行分類。
下面是一個one-shot互動式演示的demo,可以在OpenAI的部落格上試玩這個應用了Reptile小模型。
△ 前三張圖為標記樣例,每張代表一個類別;最右是輸入未知樣例,Reptile將它劃分到最像的類別中
你可以通過點選“Edit All”(編輯所有),隨心畫三個不同的形狀,然後在最右邊的輸入欄中再畫一個,看看Retile是如何對它進行分類的。
量子位也隨手畫了幾筆參與了一下這個專案:
△ 畫工有限,見諒
△ 嗯,已經寫不下一個“樂”了
Reptile認為,量子位手畫的小女孩應該屬於“熊貓”分類,手寫的“快”字和“節”更相像,應該分到這個分類中的可信度高達95.9%。
想試玩demo可以移步介紹頁面:
https://blog.openai.com/reptile/
目前,相關研究的論文也已經放出:
https://d4mucfpksywv.cloudfront.net/research-covers/reptile/reptile_update.pdf
So does 程式碼(TensorFlow實現):
https://github.com/openai/supervised-reptile
一個基於JavaScript的實現(文中我們玩的那個demo就是用它做的~):
https://github.com/openai/supervised-reptile/tree/master/web
祝你玩得開心~
— 完 —
加入社群
量子位AI社群15群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot6入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微訊號qbitbot6,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- Apollo 釋出 GraphQL 平臺和 VS 程式碼擴充套件套件
- 編寫可擴充套件程式套件
- Scikit-learn可擴充套件學習簡介套件
- Visual Studio 的碼雲擴充套件 V1.0.85 釋出套件
- 數論學習筆記 (4):擴充套件歐幾里得演算法筆記套件演算法
- sql中的擴充套件學習SQL套件
- 可擴充套件性套件
- ZenML:可擴充套件的開源機器學習MLOps框架套件機器學習框架
- 聊聊如何讓你的業務程式碼具有可擴充套件性套件
- Chrome瀏覽器擴充套件程式可竊取明文密碼Chrome瀏覽器套件密碼
- Laravel深入學習7 – 框架的擴充套件Laravel框架套件
- Laravel核心程式碼學習 -- 擴充套件使用者認證系統Laravel套件
- 可擴充套件物件導向的canvas畫圖程式套件物件Canvas
- 數論分塊擴充套件套件
- PHP的Mhash擴充套件函式的學習PHP套件函式
- VS Code 首個 Semantic Kernel 擴充套件釋出套件
- PHP 高效能 Excel 擴充套件 1.2.7 釋出PHPExcel套件
- 「擴充套件包」Laravel-filesystem-oss 2.0 釋出套件Laravel
- 演算法導論 3.1-8 記號擴充套件演算法套件
- 最新!Chrome釋出擴充套件程式五大新變化Chrome套件
- Dubbo原始碼學習之-Adaptive自適應擴充套件原始碼APT套件
- 釋出一個自己的composer擴充套件[實戰系列]套件
- 正式釋出丨AKS上的Dapr、ML、Gitops擴充套件Git套件
- 學習PHP中YAML操作擴充套件的使用PHPYAML套件
- es6陣列擴充套件的學習陣列套件
- 為效能而生,PHP Excel 擴充套件 xlswriter 1.3.3 釋出!PHPExcel套件
- Google官方釋出Chrome擴充套件Password Checkup 檢查密碼是否安全GoChrome套件密碼
- 聊聊Dubbo – Dubbo可擴充套件機制原始碼解析套件原始碼
- 基於Apache Spark以BigDL搭建可擴充套件的分散式深度學習框架ApacheSpark套件分散式深度學習框架
- [譯] 論資料流的擴充套件性套件
- kotlin 擴充套件(擴充套件函式和擴充套件屬性)Kotlin套件函式
- Kotlin學習快速入門(7)——擴充套件的妙用Kotlin套件
- PHP中非常好玩的Calendar擴充套件學習PHP套件
- dubbo是如何實現可擴充套件的?套件
- 實用的可選項(Optional)擴充套件套件
- C#學習筆記(補充)——擴充套件方法、事件C#筆記套件事件
- halcon學習擴充系列—交集intersection的擴充運算元intersection_expand
- 在 Visual Studio 市場中釋出專案擴充套件套件