OpenAI是什麼
OpenAI是一家非營利性人工智慧研究公司,致力於研究人工智慧和其他機器學習技術。OpenAI 會和谷歌、蘋果、IBM 等知名公司創辦的其它一系列專案一道探索先進計算機技術,解決面部識別或語言翻譯等問題。
是由馬斯克、奧特曼等人 2015 年聯合創辦的 研究機構,後來馬斯克推出,微軟以投資 10 億美元。OpenAI 首先推出千億級引數的大模型 GP-3,被認為是谷歌旗下人工智慧公司 DeepMind 的競爭對手。OpenAI 會和谷歌、蘋果、IBM 等知名公司創辦的其它一系列專案一道探索先進計算機技術,解決面部識別或語言翻譯等問題。2015 年 12 月 12 日,非盈利性的人工智慧專案 OpenAI 宣佈正式啟動。 免費體驗OpenAI
OpenAI 是一個人工智慧研究實驗室,由營利組織 OpenAI LP 與母公司非營利組織 OpenAI Inc 所組成,目的是促進和發展友好的人工智慧,使人類整體受益。OpenAI 成立於 2015 年底,總部位於舊金山,組織目標是透過與其他機構和研究者的“自由合作”,向公眾開放專利和研究成果。
2019 年 3 月 1 日成立 OpenAI LP 子公司,目的為營利所用。2019 年 7 月 22 日微軟投資 OpenAI 10 億美元,雙方將攜手合作替 Azure 雲端平臺服務開發人工智慧技術。2020 年 6 月 11 日宣佈了 GPT-3 ,微軟於 2020 年 9 月 22 日取得獨家授權。
2020 年 5 月,Open AI 發表了一篇開創性的論文,題為 Language Models Are Few-Shot Learners。 他們展示了 GPT-3 語言模型,它使用了一個具有 1750 億個引數的神經網路。 GPT-3 使用來自 CommonCrawl、WebText、維基百科和書籍語料庫的資料進行訓練, 並在各種自然語言處理任務中表現出驚人的效能,包括翻譯、問答和完形填空任務。在效能上 GPT-3 也是非常優秀, 超過了很多現有的模型。2020 年 7 月,也就是論文發表兩個月後,OpenAI 開放了一個 beta API playground,大家可以透過 API 方式訪問 GPT-3 模型。
GPT-3 的幾個主要特點
1. 零/單/少樣本學習(Zero/one/few-shot learning): 通常,深度學習會針對一組特定的類別進行訓練和測試。 如果計算機視覺中對星球大戰中的 BB8 , R2D2 , C3PO 進行分類,在測試過程中就只能針對這三個類別進行。 但在零樣本學習設定中,系統在測試時,可以使用不在訓練內的類別(例如,用曼努達人做測試)。 單/少樣本學習(one-shot 和 few-shot) 也是一個道理,在測試時,系統會分別看到一個或幾個新的類別。
2. 零/單/少樣本任務遷移(Zero/one/few-shot task transfer): 這個整合了 零/單/少樣本學習和多工學習的概念。 新任務(或者顯示零個、一個或幾個新任務的示例)可以隨時執行,而不是在測試時才展示新類。 例如, 輸入 “I love you -> 我愛你。 I miss you -> ____。” GPT-3 就可以透過單樣本任務遷移 ,把之前沒有訓練過的英語轉中文的任務執行起來
3. Transformers: Transformers 是解決機器翻譯問題的框架, 有一個簡單的網路結構,基於自注意機制,不依賴於遞迴和卷積完全。透過平行計算使 Transformer 效率高,需要更少的訓練時間。
4. 生成模型(Generative models): 統計學中分類任務有兩種模型-判別模型,生成模型。 判別模型對給定的可觀察變數和目標變數對的條件機率進行編碼:p(y|x)。 生成模型對聯合機率進行編碼:p(x,y)。 生成模型可以“生成類似於現有資料的新資料”,GPT-3 模型就是應用生成模型來。
5. 多工學習(Multitask learning): 大多數深度學習系統都是單任務的, 只針對特定的場景。多工系統克服了這一限制。 他們受過訓練,能夠針對給定的輸入解決不同的任務。 例如我輸入一個蘋果,他可以幫我翻譯成英文的 Apple ,可以找到一張蘋果的圖片,也可以找到蘋果的一些特徵等。
6. 半監督學習(Semi-supervised learning): 是以無監督的方式訓練具有非常大資料集的模型,然後透過在較小的資料集中使用監督訓練來調整模型以適應不同的任務。
由於微軟現在還沒開放 OpenAI 的 GPT-3 功能 , 現階段我們只能透過 OpenAI (beta.openai.com) 提供的 API 使用 GPT-3 。(當然你需要有一個美國的電話號碼來啟用該功能) ,OpenAI 有非常豐富的文件, 以及示例 ,讓開發者可以非常快上手使用 API。
GPT-3 功能強大 ,讓 AI 應用場景更貼近實際的生活 。 我非常希望微軟的 OpenAI Service 能儘快開放 ,讓更多的開發者能使用。 還有現在 OpenAI GPT-3 在中文的支援還是非常有限的, 我也寄望微軟版本的服務能有更好的中文支援。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70026910/viewspace-2937001/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- OpenAI是什麼?OpenAI
- OpenAI是什麼 OpenAI有哪些優秀產品OpenAI
- 合理解釋:為什麼安全不再是OpenAI關注焦點?OpenAI
- 什麼是cookie,什麼是sessionCookieSession
- 什麼是DNS,什麼是HostsDNS
- 什麼是模式? 什麼是框架?模式框架
- 這是什麼這是什麼
- 什麼是WebAuthn、FIDO 是什麼?Web
- ITIL是什麼意思?ITIL是什麼?
- 什麼是跨域,什麼是同源跨域
- 什麼是.NET平臺、什麼是c#、什麼是ASP.NET。C#ASP.NET
- ftp是什麼,ftp是什麼東西?FTP
- Java是什麼_Java是做什麼的?Java
- 什麼是正向代理?什麼是反向代理?
- NLA是什麼?NLA的原理是什麼?
- ###什麼是Linux核心###什麼是MMULinux
- 為什麼要有 Servlet ,什麼是 Servlet 容器,什麼是 Web 容器?ServletWeb
- 什麼是塊元素?什麼是行內元素?
- 什麼是API介面,具體是什麼意思?API
- 什麼是框架?為什麼說 Angular 是框架?框架Angular
- 什麼是Unicode,什麼是UTF-8Unicode
- 什麼是藍海?什麼是紅海?什麼是網際網路思維?
- nginx 是什麼,能幹什麼?Nginx
- 什麼是Django?有什麼用途?Django
- AI三重問:什麼是AI?什麼是AI模型?什麼是AI大模型?AI大模型
- 什麼是重繪repaint?什麼是迴流reflow?AI
- DHCP是什麼?DHCP伺服器是什麼意思?伺服器
- 什麼是CDN?CDN的技術原理是什麼?
- 交換機是什麼,它的工作原理是什麼
- GNU是什麼?和Linux是什麼關係?Linux
- 域名是什麼?申請域名的流程是什麼?
- 什麼是雲端計算?什麼是公司網盤?
- 什麼是eval()?eval是用來幹什麼的?
- 什麼是 Nginx?Nginx
- 什麼是PHPPHP
- 什麼是PodcastAST
- 什麼是Flutter?Flutter
- 敏捷是什麼?敏捷