? 作者:韓信子@ShowMeAI
? 深度學習實戰系列:https://www.showmeai.tech/tutorials/42
? 本文地址:https://www.showmeai.tech/article-detail/414
? 宣告:版權所有,轉載請聯絡平臺與作者並註明出處
? 收藏ShowMeAI檢視更多精彩內容
? 簡介
AI 以迅速的發展,不僅僅在研究界帶來了革新,在生活的方方面面也提供智慧化,使我們更便利。在本篇內容中,ShowMeAI將介紹 OpenAI 的主要發展以及它們實際落地的 AI 產品應用。
? OpenAI vs DeepMind,兩大人工智慧巨頭應對不同挑戰
OpenAI 的使命側重於以安全的方式為全人類實現人工智慧的可用性。OpenAI 的模型為資料提取、文字生成、語音識別、影像生成或編輯等日常任務帶來了高效的解決方案。儘管它們的任務和目標不同,但它們在開發大型模型方面有著共同的努力,這些模型在當今的大多數應用中都發揮著關鍵的作用。
DeepMind 的使命是解決智慧問題,推動科學發展並造福人類。因此,它強調通用智慧,即 AI 在任何情況下都能夠自行學習。這也解釋了為什麼 DeepMind 所有的突破都依賴於深度強化學習,即 AI 只有一個目標和一組可能的行動,需要找出實現該目標的最佳方法。
? GPT3,超智慧化的內容生成助手
? GPT3介紹
?GPT-3 是一種深度學習模型,該模型經過訓練後可以預測序列中的下一個標記,並能生成流暢逼真的文字,覆蓋文字分析和摘要、文案撰寫、程式碼生成等應用場景。GPT-3 在釋出後不久就掀起了全球的熱潮,促進了大量應用程式和初創公司的誕生。下圖為使用者使用 “Grammar Correction” 開始程式設計的操作示例。
? 現實生活中的應用
OpenAI 官方表示,OpenAI API是公司第一個商業產品,自推出九個月以來,超過 300 個應用在使用 GPT-3,成千上萬的開發人員在使用平臺。目前平均每天生成 45 億個單詞,且生產流量繼續擴大中。
如果你需要線上的文字解決方案,那可以閱讀更多相關資訊並自己把模型玩起來:https://beta.openai.com/playground。OpenAI 為所有新帳戶提供 18 美元的信用額度。
? CLIP,文字和影像的天然融合藝術
? CLIP介紹
?CLIP 是 OpenAI 開發的一種大型預訓練語言模型,將輸入的文字對映到一個連續的向量空間,並透過計算兩個文字之間的距離來進行文字分類和相似度計算。與傳統的語言模型不同,CLIP可以透過學習資料庫中的大量文字資料來實現端到端的文字分類,而不需要任何人工標註。因此,它可以用於許多不同的文字分類任務,包括情感分析、知識圖譜構建和影像標註。下圖表明 CLIP 極大地改進了影像分類的結果!
? 現實生活中的應用
CLIP可以完成零樣本影像分類、影像描述、內容稽核、影像生成等。值得注意的是,CLIP 是 DALLE 的構建塊之一。
? DALL·E 2,優秀的藝術家
? DALL·E 2介紹
?DALL·E 2 是 OpenAI 公司研發的一款新的人工智慧系統,不僅可以根據文字描述生成對應的逼真影像,還可以根據文字提示修改影像內容,以及根據給定的影像擴充生成多種主題風格一致的“變體”。目前公開可用,可以直接訪問 OpenAI 網站,也可以呼叫 API(2022 年 11 月已經發布!)。
? 現實生活中的應用
DALL·E 2 的影響力可與 GPT3 媲美,應用場景也非常豐富,包括插圖、影像攝影、NFT 生成、影像編輯等。微軟已經宣佈 DALL·E 2 將為其 Designer App 提供支援;Shutterstock 還宣佈與 OpenAI 建立合作關係,允許使用者在平臺上使用 DALL·E 2 進行創作!
? Whisper,聽懂所有語言的智者
? Whisper介紹
?Whisper 是一個自動語音識別 (ASR) 系統。它使用從網路上收集的 680,000 小時多語言和多工監督資料進行訓練。使用如此龐大且多樣化的資料集可以提高對口音、背景噪音和技術語言的魯棒性。此外,它還支援多種語言的轉錄,以及將這些語言翻譯成英語。
? 現實生活中的應用
Whisper 是免費和可程式設計的,使用體驗令人興奮!這也使其成為現有商業語音識別服務的有力競爭者。它也可能直接挑戰了當前主流的“基於雲的 ASR 服務”。
由於 Whisper 模型較小,便於本地執行的移動 App 使用,從而可以避免轉錄前資料上傳雲端導致的隱私問題(已經有人行動起來了 ?例如下方推文)。
? Codex,完美程式碼生成助手
? Codex介紹
?OpenAI Codex 是一種基於 GPT-3 的自然語言到程式碼系統,有助於將 自然語言指令轉換為十幾種流行的編碼語言。Codex 於去年 8 月透過 OpenAI 的 API 釋出,是 GitHub Copilot 的主要構建塊。
其實,可以要求 GPT3 解釋一段簡單的文字程式碼,從程式碼到解釋性文字這個過程GPT3也可以做得很好,理解和生成程式碼的能力已經編碼在 GPT3 中。而 Codex 專注於生成可執行程式碼,使其成為開發人員的絕佳助手。由於它已經整合到 Visual Studio 中,根據經驗,將它無縫整合到開發週期中。
? 現實生活中的應用
許多應用已經出現,包括各種程式碼助手 copilot、pygma 和 replit 等。
- Copilot 編碼助手能夠根據指示生成程式碼、將註釋轉換為程式碼、生成測試並提出備選方案。
- Pygma 使用 Codex 將 Figma 設計轉換為高質量程式碼。
- Replit 使用 Codex 描述選定的一段程式碼的作用,以便每個人都能理解其功能。
下圖為 Replit 依靠 Codex 來解釋部分程式碼。
? ChatGPT,令人興奮的AI聊天機器人
? ChatGPT介紹
?ChatGPT 是 OpenAI 於 11 月 30 日推出的一款聊天機器人,能根據使用者的提示,在對話中生成類似人類的文字響應,完成回答問題、提供資訊或參與對話等各種任務。與許多使用預定義的響應或規則生成文字的聊天機器人不同,ChatGPT 經過了訓練,可以根據接收到的輸入生成響應,從而生成更自然、更多樣化的響應。
ChatGPT的亮點主要有哪些?
- 新增程式碼理解和生成能力,對輸入的理解能力和包容度高,能在絕大部分知識領域給出專業回答。
- 加入道德原則。即ChatGPT能夠識別惡意資訊,識別後拒絕給出有效回答。
- 支援連續對話。ChatGPT具有記憶能力,提高了模型的互動體驗。
? 現實生活中的應用
ChatGPT不僅會聊天,寫得了程式碼,修復得了bug,還能幫你寫工作週報、寫小說、進行考試答題,繪畫,看病,甚至你還可以誘騙它規劃如何毀滅人類,許多人認為,ChatGPT不僅僅是一個聊天機器人,而可能是現有搜尋引擎的顛覆者。
參考資料
- ? GPT-3:https://openai.com/blog/gpt-3-apps/
- ? CLIP:https://openai.com/blog/clip/
- ? DALL·E 2 :https://openai.com/dall-e-2/
- ? Whisper:https://openai.com/blog/whisper/
- ? OpenAI Codex:https://openai.com/blog/codex-apps/
- ? ChatGPT
推薦閱讀
- ? 資料分析實戰系列:https://www.showmeai.tech/tutorials/40
- ? 機器學習資料分析實戰系列:https://www.showmeai.tech/tutorials/41
- ? 深度學習資料分析實戰系列:https://www.showmeai.tech/tutorials/42
- ? TensorFlow資料分析實戰系列:https://www.showmeai.tech/tutorials/43
- ? PyTorch資料分析實戰系列:https://www.showmeai.tech/tutorials/44
- ? NLP實戰資料分析實戰系列:https://www.showmeai.tech/tutorials/45
- ? CV實戰資料分析實戰系列:https://www.showmeai.tech/tutorials/46
- ? AI 面試題庫系列:https://www.showmeai.tech/tutorials/48