以最經濟方式執行GPT-3開源模擬:GPT-J
生成式預訓練轉化器(Generative Pre-trained Transformer簡稱GPT)是一種NLP語言生成模型,能根據一些初始文字(對話的一部分或某些任務)生成類人文字。
最“炒作”的型號之一是 GPT-3。當您看到 GPT-3 生成的內容時,您會感覺“未來就在這裡”。
GPT-3模型由 OpenAI 公司(Elon Mask 是聯合創始人)訓練,目前只能作為付費 REST API 使用( 2021 年 11 月 18 日 開放給任何人)。
另一個名為 EleutherAI 的團隊在 Pile Dataset(他們收集的 825 GiB 文字資料)上 釋出了一個具有 60 億個引數的開源 GPT-J 模型。
EleutherAI 成立於 2020 年 7 月,定位為一個分散的志願者研究人員、工程師和開發人員集體,專注於 AI 對齊、擴充套件和開源 AI 研究。
基本上,官方GitHub GPT-J 儲存庫 建議在稱為張量處理單元 (TPU) 的特殊硬體上執行他們的模型,該硬體可在谷歌雲平臺上使用。
最便宜的 TPU 是 v2-8(它有 版本 2 的 8 個核心),這樣的例項成本:
- 4.50 美元/小時(3,285 美元/月)- 普通按需例項
- 1.35 美元/小時(986 美元/月)- 更便宜的搶佔式例項(每 24 小時自動重啟,由於維護可能隨時停止,可能並不總是可用,不在 SLA 範圍內)
因此,對於許多處於啟動/實驗階段的專案來說,價格可能看起來不太舒服。
為了降低硬體的最終成本,我們可以 在具有 16 GB 視訊記憶體的 GPU 上執行模型。 為此,有來自 Devforth 的開源 GPT-J 容器 釋出到 Dockerhub GPT-J Image 。
順便說一句,用例名稱中有一些俚語:
- 推理使用Inference usage ——意味著我們獲取模型(它的權重)並將它們載入到 GPU RAM 中,然後僅用於生成輸出(生成文字或分類事物)
- 微調模型Fine-tuning the model ——一個完全不同的過程,我們將模型載入到記憶體中,然後輸入大量新輸入資料來調整和重新訓練模型。然後可以使用返回的模型進行推理。此用例需要更多資源
哪些硬體可以執行該模型:
- 要在每月 200 美元到 300 美元的最低範圍內獲得每小時價格,您可以使用:Vast.ai – 一個分散式計算市場,個人出租他們的 GPU 並設定自己的價格。通過幾次點選,我以 0.33 美元/小時的價格獲得了一個具有 24 GB VideoRAM 的例項。但是有一個限制:不是直接訪問伺服器,而是通過 SSH 進入將在伺服器上生成的 Docker 容器。幸運的是,您可以指定要執行的映像和代理 SSH 埠,因此實際上它允許您將多個此類例項順利整合到任何複雜的實時應用程式中。
- 您也可以找到一些便宜的每月選項,例如在 vps-mart.com / gpu-mart.com 上試用GPU-K80,如果您支付一個月的費用,每平方米的價格為 199.00 美元,甚至每年支付便宜 20 美元。24 GB VideoRAM,20 核 x64 CPU 128 GB RAM,具有 root 訪問許可權的 SSH。付款後花了 24 小時才拿到伺服器。缺點:沒有按小時租用的選項。
- 如果您想使用按小時付費的大型雲服務以及一些伺服器可用性和執行時 (SLA) 保證,您可以使用 Scaleway Render S - 非常容易獲得,例項穩定(單擊幾下,您就獲得了SSH 和 root),有 16 GB VideoRAM,10 個 x64 CPU,45 GB RAM,花費 1.13 美元/小時(約 810 美元/月)
- 甚至有人可能會說AWS EC2,例如p3.2xlarge。最低現貨獎成本為 1.14 美元/小時(840 美元/月),但是,它是不穩定的(可以終止)現貨例項,穩定的按需成本高出3倍。我們試圖從我們舊的受信任 AWS 賬戶中獲取此例項,但它需要增加 AWS G 例項限制(您必須指定 vCPU 核心的 UI 混亂)。花了一個星期,然後需要解釋為什麼我們需要這個例項等等(如果你還沒準備好浪費很多時間,不推薦)
最 有趣的選擇是 Vast.ai 平臺,它還允許您以最少的費用玩模型。因此,讓我們向您展示如何使用它。然後我們還將考慮使用普通 SSH 例項執行模型。
在 Vast.ai 上設定 GPT-J 點選標題
相關文章
- 在Linux上以容器方式執行安卓系統的開源專案:WaydroidLinux安卓
- 以沙箱的方式執行容器:安全容器gvisor
- 以 DEBUG 方式深入理解執行緒的底層執行原理執行緒
- Fuzz前置技能-unicorn模擬執行
- 最直白的方式直面Java多執行緒Java執行緒
- 以沙箱的方式執行容器:安全容器Kata ContainersAI
- Proteus模擬執行stm32程式
- 模擬主執行緒等待子執行緒的過程執行緒
- 官宣 | PowerData 2024 “數字經濟-城市開源行” 活動預告
- 經濟學的思維方式
- 以經濟學原理探討遊戲經濟市場的搭建遊戲
- 執行緒Thread練習題1買票,使用多執行緒的方式模擬四個視窗賣100張票執行緒thread
- 在專案裡快速執行史上最強開源大模型「Llama 3.1」大模型
- 本地快速安裝執行史上最強開源LLaMa3大模型大模型
- 盲盒經濟的營銷方式
- 模擬登陸——以github為例Github
- 《微軟模擬飛行》執行製作人Jorg Neumann專訪微軟
- Python源程式執行方式有哪些?Python學習教程Python
- 世界經濟論壇:這些行業最適合應用ChatGPT行業ChatGPT
- 中國水泥協會:2023年水泥行業經濟執行報告行業
- 2020年浙江省電子資訊行業經濟執行分析行業
- 模擬資料傳輸常用方式PK,最安全高效的還得是它!
- 世界經濟論壇報告:淡水資源與綠色經濟
- DOE - 最經濟的實驗設計
- 模擬經營手遊買量報告|“模擬”明代,國風“經營”
- 工信部:2021年建材行業經濟執行情況行業
- 爬蟲方式(模擬使用者)爬蟲
- 基於 HTML5 WebGL 智慧城市的模擬執行HTMLWeb
- ?好訊息!Android 模擬器可以執行 ARM 應用了Android
- JAVA學習之路(多執行緒)—模擬售票(細解)Java執行緒
- 執行緒、開啟執行緒的兩種方式、執行緒下的Join方法、守護執行緒執行緒
- 2024.9.28 程式碼源模擬賽
- win10執行mumu模擬器當機如何處理_win10開啟mumu模擬器卡頓解決方法Win10
- 使用執行緒模擬解決銀行排隊叫號問題執行緒
- 非洲開發銀行:2020非洲經濟展望報告
- idea執行springboot開源專案GunsIdeaSpring Boot
- 元宇宙火了,“虛擬人”經濟跟進元宇宙
- Meta開源其類似GPT-3的語言模型 - RedditGPT模型