入門價格越來越便宜了。
來自智譜AI開放平臺官網
除了降價,官方還特別提供使用者 tokens 優惠計劃——從今天起,新註冊開放平臺使用者贈送額度提升500%。開放平臺新註冊使用者獲贈從500 萬tokens提升至2500萬tokens(包含2000萬入門級額度和500萬企業級額度)。
GLM-3 Turbo(最大支援 128k)是大模型開放平臺最受歡迎的模型產品,不僅速度快,而且適用於對知識量、推理能力、創造力要求較高的場景,此次調價後更具競爭力,國內其他128k級別大模型的呼叫價格大多從百萬tokens數元到幾十元不等。
企業級產品 GLM-4/GLM-4V 價格仍維持在 0.1元/千 tokens,百萬tokens的價格為100元,但作為一款能力逼近GPT-4的國內領先大模型,這一價格還是比較能打。從公開的API 呼叫收費來看,OpenAI 最新模型 GPT-4 Turbo 每100萬tokens輸入/輸出價格分別是10/30美元。Claude 3 Opus 更貴,每百萬tokens輸入/輸出價格15/75美元。如果摺合成人民幣,這些數字至少還要乘以7。
SuperBench榜單:GLM-4超過GPT-4系列模型位居第二
對於開發者和企業來說,模型的使用成本是一個重要考量,大模型降價有利於吸引更多的開發者和企業客戶,擴大其生態圈。華福證券最近釋出報告稱,大模型成本最佳化與算力需求並不是直接的此長彼消,而是互相搭臺、相互成就。定價的持續走低有望帶來更快的商業化落地,進而會衍生出更多的微調及推理等需求,將逐步盤活國內AI應用及國產算力發展。
這次 API定價更新也體現出智譜AI覆蓋開發者使用者的決心——單次呼叫適合對實時性要求高的中小使用者;批次呼叫定價更低,則是為資料量大、對成本敏感的企業及使用者量身定製。作為國內應用最為廣泛的開放平臺,智譜的開放平臺上已經聚集了超過數十萬的企業和開發者,並且在持續快速增長,過去的半年每日的token消耗增長超過一百倍。比如官方開發的三個呼叫工具,網頁檢索、函式呼叫以及知識庫,自從1月上線以來呼叫次數已經超過 3 億次。
技術的進步也為降低開發、執行 LLMs 成本提供了現實可能。例如,從基礎設施來看,隨著一些老款AI晶片(比如 Nvidia A100 )降價,大模型培訓成本下降了約60%。英偉達也最佳化了軟體效能,幫助開發者更快訓練和執行大模型。研發人員也在模型架構、模型壓縮以及GPU呼叫等方面探索到一些降本增效的辦法。
智譜曾表示,透過模型推理運算元最佳化、模型壓縮及硬體高效適配、高效能系統實現以及精細化叢集排程等技術將 GLM-3 Turbo的推理成本壓縮到1/5。自大模型開放平臺上線以來,在模型效果和推理效能不斷提升的情況下,已累計降價超過百倍。
除了降價,智譜AI還宣佈包括GLM-3 Turbo 以及最先進基座大模型GLM-4在內的GLM系列模型也將迎來更新,目前正在灰度測試中,很快將和廣大開發者和應用者見面。