真實世界的人工智慧應用落地——OpenAI篇 ⛵

ShowMeAI發表於2022-12-26
真實世界的人工智慧應用落地——OpenAI篇 ⛵

? 作者:韓信子@ShowMeAI
? 深度學習實戰系列https://www.showmeai.tech/tutorials/42
? 本文地址https://www.showmeai.tech/article-detail/414
? 宣告:版權所有,轉載請聯絡平臺與作者並註明出處
? 收藏ShowMeAI檢視更多精彩內容

? 簡介

AI 以迅速的發展,不僅僅在研究界帶來了革新,在生活的方方面面也提供智慧化,使我們更便利。在本篇內容中,ShowMeAI將介紹 OpenAI 的主要發展以及它們實際落地的 AI 產品應用。

? OpenAI vs DeepMind,兩大人工智慧巨頭應對不同挑戰

OpenAI 的使命側重於以安全的方式為全人類實現人工智慧的可用性。OpenAI 的模型為資料提取、文字生成、語音識別、影像生成或編輯等日常任務帶來了高效的解決方案。儘管它們的任務和目標不同,但它們在開發大型模型方面有著共同的努力,這些模型在當今的大多數應用中都發揮著關鍵的作用。

真實世界的人工智慧應用落地——OpenAI篇 ⛵

DeepMind 的使命是解決智慧問題,推動科學發展並造福人類。因此,它強調通用智慧,即 AI 在任何情況下都能夠自行學習。這也解釋了為什麼 DeepMind 所有的突破都依賴於深度強化學習,即 AI 只有一個目標和一組可能的行動,需要找出實現該目標的最佳方法。

真實世界的人工智慧應用落地——OpenAI篇 ⛵

? GPT3,超智慧化的內容生成助手

? GPT3介紹

?GPT-3 是一種深度學習模型,該模型經過訓練後可以預測序列中的下一個標記,並能生成流暢逼真的文字,覆蓋文字分析和摘要、文案撰寫、程式碼生成等應用場景。GPT-3 在釋出後不久就掀起了全球的熱潮,促進了大量應用程式和初創公司的誕生。下圖為使用者使用 “Grammar Correction” 開始程式設計的操作示例。

真實世界的人工智慧應用落地——OpenAI篇 ⛵

? 現實生活中的應用

OpenAI 官方表示,OpenAI API是公司第一個商業產品,自推出九個月以來,超過 300 個應用在使用 GPT-3,成千上萬的開發人員在使用平臺。目前平均每天生成 45 億個單詞,且生產流量繼續擴大中。

如果你需要線上的文字解決方案,那可以閱讀更多相關資訊並自己把模型玩起來:https://beta.openai.com/playground。OpenAI 為所有新帳戶提供 18 美元的信用額度。

? CLIP,文字和影像的天然融合藝術

? CLIP介紹

?CLIP 是 OpenAI 開發的一種大型預訓練語言模型,將輸入的文字對映到一個連續的向量空間,並透過計算兩個文字之間的距離來進行文字分類和相似度計算。與傳統的語言模型不同,CLIP可以透過學習資料庫中的大量文字資料來實現端到端的文字分類,而不需要任何人工標註。因此,它可以用於許多不同的文字分類任務,包括情感分析、知識圖譜構建和影像標註。下圖表明 CLIP 極大地改進了影像分類的結果!

真實世界的人工智慧應用落地——OpenAI篇 ⛵

? 現實生活中的應用

CLIP可以完成零樣本影像分類、影像描述、內容稽核、影像生成等。值得注意的是,CLIP 是 DALLE 的構建塊之一。

? DALL·E 2,優秀的藝術家

? DALL·E 2介紹

?DALL·E 2 是 OpenAI 公司研發的一款新的人工智慧系統,不僅可以根據文字描述生成對應的逼真影像,還可以根據文字提示修改影像內容,以及根據給定的影像擴充生成多種主題風格一致的“變體”。目前公開可用,可以直接訪問 OpenAI 網站,也可以呼叫 API(2022 年 11 月已經發布!)。

真實世界的人工智慧應用落地——OpenAI篇 ⛵

? 現實生活中的應用

DALL·E 2 的影響力可與 GPT3 媲美,應用場景也非常豐富,包括插圖、影像攝影、NFT 生成、影像編輯等。微軟已經宣佈 DALL·E 2 將為其 Designer App 提供支援;Shutterstock 還宣佈與 OpenAI 建立合作關係,允許使用者在平臺上使用 DALL·E 2 進行創作!

真實世界的人工智慧應用落地——OpenAI篇 ⛵

? Whisper,聽懂所有語言的智者

? Whisper介紹

?Whisper 是一個自動語音識別 (ASR) 系統。它使用從網路上收集的 680,000 小時多語言和多工監督資料進行訓練。使用如此龐大且多樣化的資料集可以提高對口音、背景噪音和技術語言的魯棒性。此外,它還支援多種語言的轉錄,以及將這些語言翻譯成英語。

? 現實生活中的應用

Whisper 是免費和可程式設計的,使用體驗令人興奮!這也使其成為現有商業語音識別服務的有力競爭者。它也可能直接挑戰了當前主流的“基於雲的 ASR 服務”。

由於 Whisper 模型較小,便於本地執行的移動 App 使用,從而可以避免轉錄前資料上傳雲端導致的隱私問題(已經有人行動起來了 ?例如下方推文)。

真實世界的人工智慧應用落地——OpenAI篇 ⛵

? Codex,完美程式碼生成助手

? Codex介紹

?OpenAI Codex 是一種基於 GPT-3 的自然語言到程式碼系統,有助於將 自然語言指令轉換為十幾種流行的編碼語言。Codex 於去年 8 月透過 OpenAI 的 API 釋出,是 GitHub Copilot 的主要構建塊。

其實,可以要求 GPT3 解釋一段簡單的文字程式碼,從程式碼到解釋性文字這個過程GPT3也可以做得很好,理解和生成程式碼的能力已經編碼在 GPT3 中。而 Codex 專注於生成可執行程式碼,使其成為開發人員的絕佳助手。由於它已經整合到 Visual Studio 中,根據經驗,將它無縫整合到開發週期中。

真實世界的人工智慧應用落地——OpenAI篇 ⛵

? 現實生活中的應用

許多應用已經出現,包括各種程式碼助手 copilot、pygma 和 replit 等。

  • Copilot 編碼助手能夠根據指示生成程式碼、將註釋轉換為程式碼、生成測試並提出備選方案。
  • Pygma 使用 Codex 將 Figma 設計轉換為高質量程式碼。
  • Replit 使用 Codex 描述選定的一段程式碼的作用,以便每個人都能理解其功能。

下圖為 Replit 依靠 Codex 來解釋部分程式碼。

真實世界的人工智慧應用落地——OpenAI篇 ⛵

? ChatGPT,令人興奮的AI聊天機器人

? ChatGPT介紹

?ChatGPT 是 OpenAI 於 11 月 30 日推出的一款聊天機器人,能根據使用者的提示,在對話中生成類似人類的文字響應,完成回答問題、提供資訊或參與對話等各種任務。與許多使用預定義的響應或規則生成文字的聊天機器人不同,ChatGPT 經過了訓練,可以根據接收到的輸入生成響應,從而生成更自然、更多樣化的響應。

ChatGPT的亮點主要有哪些?

  • 新增程式碼理解和生成能力,對輸入的理解能力和包容度高,能在絕大部分知識領域給出專業回答。
  • 加入道德原則。即ChatGPT能夠識別惡意資訊,識別後拒絕給出有效回答。
  • 支援連續對話。ChatGPT具有記憶能力,提高了模型的互動體驗。
真實世界的人工智慧應用落地——OpenAI篇 ⛵

? 現實生活中的應用

ChatGPT不僅會聊天,寫得了程式碼,修復得了bug,還能幫你寫工作週報、寫小說、進行考試答題,繪畫,看病,甚至你還可以誘騙它規劃如何毀滅人類,許多人認為,ChatGPT不僅僅是一個聊天機器人,而可能是現有搜尋引擎的顛覆者。

真實世界的人工智慧應用落地——OpenAI篇 ⛵

參考資料

推薦閱讀

真實世界的人工智慧應用落地——OpenAI篇 ⛵

相關文章