OpenAI釋出可擴充套件的元學習演算法Reptile | 論文+程式碼+Demo

量子位發表於2018-03-08

原文網址 : https://blog.csdn.net/yh0vlde8vg8ep9vge/article/details/79492360

OpenAI套件演算法

安妮編譯自 OpenAI官方部落格
量子位出品 | 公眾號 QbitAI

昨天，OpenAI釋出了一種新型的可擴充套件元學習演算法Reptile，還能線上試玩。

何為Reptile？難道是——

640?wx_fmt=png&wxfrom=5&wx_lazy=1

咳咳嚴肅一點。

據OpenAI官方部落格顯示，這是通過重複對一個任務進行取樣、隨機梯度下降並將初始引數更新為從任務中學習到的最終引數的演算法。

這種方法不禁讓人想到去年七月伯克利AI研究所關於未知模型元學習法（MAML）的研究。OpenAI表示，Reptile的效果和MAML相似，但實現起來更簡單，計算效率更高。

UC伯克利MAML相關論文：
http://bair.berkeley.edu/blog/2017/07/18/learning-to-learn/

640?wx_fmt=png&wxfrom=5&wx_lazy=1

試玩demo

元學習（Meta-learning）是一種學習如何學習的過程。向元學習演算法中輸入任務的分佈，相當於每個任務都是一個需要學習的任務，演算法會產生一個快速的learner，每個learner可以從少數樣例中進行歸納。

小樣本學習（Few-shot Learning）分類問題是元學習中研究得比較充分的課題，learner只能從每個類中看到1-5個輸入-輸出樣例，然後對新的輸入進行分類。

下面是一個one-shot互動式演示的demo，可以在OpenAI的部落格上試玩這個應用了Reptile小模型。

640?wx_fmt=png

△ 前三張圖為標記樣例，每張代表一個類別；最右是輸入未知樣例，Reptile將它劃分到最像的類別中

你可以通過點選“Edit All”（編輯所有），隨心畫三個不同的形狀，然後在最右邊的輸入欄中再畫一個，看看Retile是如何對它進行分類的。

量子位也隨手畫了幾筆參與了一下這個專案：

640?wx_fmt=png △ 畫工有限，見諒

640?wx_fmt=png △ 嗯，已經寫不下一個“樂”了

Reptile認為，量子位手畫的小女孩應該屬於“熊貓”分類，手寫的“快”字和“節”更相像，應該分到這個分類中的可信度高達95.9%。

想試玩demo可以移步介紹頁面：

https://blog.openai.com/reptile/

目前，相關研究的論文也已經放出：

https://d4mucfpksywv.cloudfront.net/research-covers/reptile/reptile_update.pdf

So does 程式碼（TensorFlow實現）：

https://github.com/openai/supervised-reptile

一個基於JavaScript的實現（文中我們玩的那個demo就是用它做的~）：

https://github.com/openai/supervised-reptile/tree/master/web

祝你玩得開心~

— 完 —

加入社群

量子位AI社群15群開始招募啦，歡迎對AI感興趣的同學，加小助手微信qbitbot6入群；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進群請加小助手微訊號qbitbot6，並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。（專業群稽核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話介面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

Apollo 釋出 GraphQL 平臺和 VS 程式碼擴充套件
2018-11-20
套件
編寫可擴充套件程式
2019-03-11
套件
Scikit-learn可擴充套件學習簡介
2024-04-04
套件
Visual Studio 的碼雲擴充套件 V1.0.85 釋出
2019-03-20
套件
數論學習筆記 (4)：擴充套件歐幾里得演算法
2024-05-02
筆記套件演算法
sql中的擴充套件學習
2018-05-06
SQL套件
可擴充套件性
2020-12-10
套件
ZenML：可擴充套件的開源機器學習MLOps框架
2020-12-23
套件機器學習框架
聊聊如何讓你的業務程式碼具有可擴充套件性
2022-04-02
套件
Chrome瀏覽器擴充套件程式可竊取明文密碼
2023-09-05
Chrome瀏覽器套件密碼
Laravel深入學習7 – 框架的擴充套件
2019-02-16
Laravel框架套件
Laravel核心程式碼學習 -- 擴充套件使用者認證系統
2018-07-09
Laravel套件
可擴充套件物件導向的canvas畫圖程式
2019-02-16
套件物件Canvas
數論分塊擴充套件
2024-08-30
套件
PHP的Mhash擴充套件函式的學習
2021-09-09
PHP套件函式
VS Code 首個 Semantic Kernel 擴充套件釋出
2023-04-27
套件
PHP 高效能 Excel 擴充套件 1.2.7 釋出
2019-09-09
PHPExcel套件
「擴充套件包」Laravel-filesystem-oss 2.0 釋出
2020-03-29
套件Laravel
最新！Chrome釋出擴充套件程式五大新變化
2018-10-03
Chrome套件
演算法導論 3.1-8 記號擴充套件
2020-11-04
演算法套件
Dubbo原始碼學習之-Adaptive自適應擴充套件
2019-07-28
原始碼APT套件
正式釋出丨AKS上的Dapr、ML、Gitops擴充套件
2022-07-15
Git套件
釋出一個自己的composer擴充套件[實戰系列]
2023-04-08
套件
es6陣列擴充套件的學習
2018-06-17
陣列套件
學習PHP中YAML操作擴充套件的使用
2021-11-23
PHPYAML套件
為效能而生，PHP Excel 擴充套件 xlswriter 1.3.3 釋出！
2019-12-24
PHPExcel套件
Google官方釋出Chrome擴充套件Password Checkup 檢查密碼是否安全
2019-02-07
GoChrome套件密碼
聊聊Dubbo – Dubbo可擴充套件機制原始碼解析
2019-01-19
套件原始碼
基於Apache Spark以BigDL搭建可擴充套件的分散式深度學習框架
2019-01-23
ApacheSpark套件分散式深度學習框架
[譯] 論資料流的擴充套件性
2019-03-09
套件
kotlin 擴充套件（擴充套件函式和擴充套件屬性）
2019-02-26
Kotlin套件函式
實用的可選項（Optional）擴充套件
2018-11-19
套件
dubbo是如何實現可擴充套件的？
2022-05-26
套件
PHP中非常好玩的Calendar擴充套件學習
2021-09-09
PHP套件
Kotlin學習快速入門（7）——擴充套件的妙用
2022-07-03
Kotlin套件
C#學習筆記（補充）——擴充套件方法、事件
2019-02-16
C#筆記套件事件
halcon學習擴充系列—交集intersection的擴充運算元intersection_expand
2020-12-14
在 Visual Studio 市場中釋出專案擴充套件
2020-07-03
套件

OpenAI釋出可擴充套件的元學習演算法Reptile | 論文+程式碼+Demo

安妮 編譯自 OpenAI官方部落格量子位 出品 | 公眾號 QbitAI

試玩demo

△ 前三張圖為標記樣例，每張代表一個類別；最右是輸入未知樣例，Reptile將它劃分到最像的類別中

相關文章

安妮編譯自 OpenAI官方部落格
量子位出品 | 公眾號 QbitAI