百萬tokens低至1元!大模型越來越捲了

机器之心發表於2024-05-13
入門價格越來越便宜了。

在剛剛舉行的 ICLR 2024 大會上,智譜AI的大模型技術團隊公佈了面向激動人心的AGI通用人工智慧前景的三大技術趨勢,同時預告了GLM的後續升級版本。

今天,智譜大模型開放平臺(bigmodel.cn)上線了新的價格體系。入門級產品 GLM-3 Turbo 模型呼叫價格下調80%!從5元/百萬tokens降至1元/百萬tokens。1元可以購買100萬tokens。

調整後,使用GLM-3 Turbo創作一萬條小紅書文案(以350字計)將僅需約1元錢,足以讓更多企業和個人都能用上這款入門級產品。

圖片

來自智譜AI開放平臺官網

除了降價,官方還特別提供使用者 tokens 優惠計劃——從今天起,新註冊開放平臺使用者贈送額度提升500%。開放平臺新註冊使用者獲贈從500 萬tokens提升至2500萬tokens(包含2000萬入門級額度和500萬企業級額度)。

GLM-3 Turbo(最大支援 128k)是大模型開放平臺最受歡迎的模型產品,不僅速度快,而且適用於對知識量、推理能力、創造力要求較高的場景,此次調價後更具競爭力,國內其他128k級別大模型的呼叫價格大多從百萬tokens數元到幾十元不等。

企業級產品 GLM-4/GLM-4V 價格仍維持在 0.1元/千 tokens,百萬tokens的價格為100元,但作為一款能力逼近GPT-4的國內領先大模型,這一價格還是比較能打。從公開的API 呼叫收費來看,OpenAI 最新模型 GPT-4 Turbo 每100萬tokens輸入/輸出價格分別是10/30美元。Claude 3 Opus 更貴,每百萬tokens輸入/輸出價格15/75美元。如果摺合成人民幣,這些數字至少還要乘以7。

圖片

SuperBench榜單:GLM-4超過GPT-4系列模型位居第二

對於開發者和企業來說,模型的使用成本是一個重要考量,大模型降價有利於吸引更多的開發者和企業客戶,擴大其生態圈。華福證券最近釋出報告稱,大模型成本最佳化與算力需求並不是直接的此長彼消,而是互相搭臺、相互成就。定價的持續走低有望帶來更快的商業化落地,進而會衍生出更多的微調及推理等需求,將逐步盤活國內AI應用及國產算力發展。

這次 API定價更新也體現出智譜AI覆蓋開發者使用者的決心——單次呼叫適合對實時性要求高的中小使用者;批次呼叫定價更低,則是為資料量大、對成本敏感的企業及使用者量身定製。作為國內應用最為廣泛的開放平臺,智譜的開放平臺上已經聚集了超過數十萬的企業和開發者,並且在持續快速增長,過去的半年每日的token消耗增長超過一百倍。比如官方開發的三個呼叫工具,網頁檢索、函式呼叫以及知識庫自從1月上線以來呼叫次數已經超過 3 億次。

技術的進步也為降低開發、執行 LLMs 成本提供了現實可能。例如,從基礎設施來看,隨著一些老款AI晶片(比如 Nvidia A100 )降價,大模型培訓成本下降了約60%。英偉達也最佳化了軟體效能,幫助開發者更快訓練和執行大模型。研發人員也在模型架構、模型壓縮以及GPU呼叫等方面探索到一些降本增效的辦法。

智譜曾表示,透過模型推理運算元最佳化、模型壓縮及硬體高效適配、高效能系統實現以及精細化叢集排程等技術將 GLM-3 Turbo的推理成本壓縮到1/5。自大模型開放平臺上線以來,在模型效果和推理效能不斷提升的情況下,已累計降價超過百倍。

除了降價,智譜AI還宣佈包括GLM-3 Turbo 以及最先進基座大模型GLM-4在內的GLM系列模型也將迎來更新,目前正在灰度測試中,很快將和廣大開發者和應用者見面。

相關文章