以最經濟方式執行GPT-3開源模擬:GPT-J
生成式預訓練轉化器(Generative Pre-trained Transformer簡稱GPT)是一種NLP語言生成模型,能根據一些初始文字(對話的一部分或某些任務)生成類人文字。
最“炒作”的型號之一是 GPT-3。當您看到 GPT-3 生成的內容時,您會感覺“未來就在這裡”。
GPT-3模型由 OpenAI 公司(Elon Mask 是聯合創始人)訓練,目前只能作為付費 REST API 使用( 2021 年 11 月 18 日 開放給任何人)。
另一個名為 EleutherAI 的團隊在 Pile Dataset(他們收集的 825 GiB 文字資料)上 釋出了一個具有 60 億個引數的開源 GPT-J 模型。
EleutherAI 成立於 2020 年 7 月,定位為一個分散的志願者研究人員、工程師和開發人員集體,專注於 AI 對齊、擴充套件和開源 AI 研究。
基本上,官方GitHub GPT-J 儲存庫 建議在稱為張量處理單元 (TPU) 的特殊硬體上執行他們的模型,該硬體可在谷歌雲平臺上使用。
最便宜的 TPU 是 v2-8(它有 版本 2 的 8 個核心),這樣的例項成本:
- 4.50 美元/小時(3,285 美元/月)- 普通按需例項
- 1.35 美元/小時(986 美元/月)- 更便宜的搶佔式例項(每 24 小時自動重啟,由於維護可能隨時停止,可能並不總是可用,不在 SLA 範圍內)
因此,對於許多處於啟動/實驗階段的專案來說,價格可能看起來不太舒服。
為了降低硬體的最終成本,我們可以 在具有 16 GB 視訊記憶體的 GPU 上執行模型。 為此,有來自 Devforth 的開源 GPT-J 容器 釋出到 Dockerhub GPT-J Image 。
順便說一句,用例名稱中有一些俚語:
- 推理使用Inference usage ——意味著我們獲取模型(它的權重)並將它們載入到 GPU RAM 中,然後僅用於生成輸出(生成文字或分類事物)
- 微調模型Fine-tuning the model ——一個完全不同的過程,我們將模型載入到記憶體中,然後輸入大量新輸入資料來調整和重新訓練模型。然後可以使用返回的模型進行推理。此用例需要更多資源
哪些硬體可以執行該模型:
- 要在每月 200 美元到 300 美元的最低範圍內獲得每小時價格,您可以使用:Vast.ai – 一個分散式計算市場,個人出租他們的 GPU 並設定自己的價格。通過幾次點選,我以 0.33 美元/小時的價格獲得了一個具有 24 GB VideoRAM 的例項。但是有一個限制:不是直接訪問伺服器,而是通過 SSH 進入將在伺服器上生成的 Docker 容器。幸運的是,您可以指定要執行的映像和代理 SSH 埠,因此實際上它允許您將多個此類例項順利整合到任何複雜的實時應用程式中。
- 您也可以找到一些便宜的每月選項,例如在 vps-mart.com / gpu-mart.com 上試用GPU-K80,如果您支付一個月的費用,每平方米的價格為 199.00 美元,甚至每年支付便宜 20 美元。24 GB VideoRAM,20 核 x64 CPU 128 GB RAM,具有 root 訪問許可權的 SSH。付款後花了 24 小時才拿到伺服器。缺點:沒有按小時租用的選項。
- 如果您想使用按小時付費的大型雲服務以及一些伺服器可用性和執行時 (SLA) 保證,您可以使用 Scaleway Render S - 非常容易獲得,例項穩定(單擊幾下,您就獲得了SSH 和 root),有 16 GB VideoRAM,10 個 x64 CPU,45 GB RAM,花費 1.13 美元/小時(約 810 美元/月)
- 甚至有人可能會說AWS EC2,例如p3.2xlarge。最低現貨獎成本為 1.14 美元/小時(840 美元/月),但是,它是不穩定的(可以終止)現貨例項,穩定的按需成本高出3倍。我們試圖從我們舊的受信任 AWS 賬戶中獲取此例項,但它需要增加 AWS G 例項限制(您必須指定 vCPU 核心的 UI 混亂)。花了一個星期,然後需要解釋為什麼我們需要這個例項等等(如果你還沒準備好浪費很多時間,不推薦)
最 有趣的選擇是 Vast.ai 平臺,它還允許您以最少的費用玩模型。因此,讓我們向您展示如何使用它。然後我們還將考慮使用普通 SSH 例項執行模型。
在 Vast.ai 上設定 GPT-J 點選標題
相關文章
- 最棒的 7 款開源終端模擬器
- 在Linux上以容器方式執行安卓系統的開源專案:WaydroidLinux安卓
- shell模擬“多執行緒”執行緒
- 開源驅動全球經濟發展
- 策略書之V:開源經濟學
- Thinking in Java---多執行緒模擬:銀行出納員模擬+飯店模擬+汽車裝配工廠模擬ThinkingJava執行緒
- Fuzz前置技能-unicorn模擬執行
- 以經濟學原理探討遊戲經濟市場的搭建遊戲
- 知識經濟是人力資源的經濟
- Proteus模擬執行stm32程式
- [ATC]Facebook開源弱網模擬工具
- 模擬主執行緒等待子執行緒的過程執行緒
- 以沙箱的方式執行容器:安全容器gvisor
- 以 DEBUG 方式深入理解執行緒的底層執行原理執行緒
- 以正確的方式開源 Python 專案Python
- 最直白的方式直面Java多執行緒Java執行緒
- 開源專案也要講注意力經濟
- Strategy Letter V 開源軟體的經濟學
- 官宣 | PowerData 2024 “數字經濟-城市開源行” 活動預告
- 以沙箱的方式執行容器:安全容器Kata ContainersAI
- 模擬登陸——以github為例Github
- 資料模擬神器 easy-mock 正式開源Mock
- ZKUI中文編碼以及以docker方式執行的問題UIDocker
- 《經濟學人》:債務抵稅扭曲經濟執行何時休
- 世界經濟論壇:這些行業最適合應用ChatGPT行業ChatGPT
- 人力資源經濟分析(轉載)
- 《微軟模擬飛行》執行製作人Jorg Neumann專訪微軟
- 在專案裡快速執行史上最強開源大模型「Llama 3.1」大模型
- 本地快速安裝執行史上最強開源LLaMa3大模型大模型
- 模擬資料傳輸常用方式PK,最安全高效的還得是它!
- 程式模擬tomcat伺服器執行過程Tomcat伺服器
- 爬蟲方式(模擬使用者)爬蟲
- 工信部:2021年建材行業經濟執行情況行業
- win10執行mumu模擬器當機如何處理_win10開啟mumu模擬器卡頓解決方法Win10
- 執行緒Thread練習題1買票,使用多執行緒的方式模擬四個視窗賣100張票執行緒thread
- 用vc執行緒模擬實現並行演算法 (轉)執行緒並行演算法
- 最為常見的匿名函式自執行方式分享函式
- 以並行思維方式思考並行