最新版本大模型,6 分錢 100 萬 Token。
今天上午,在 AI 開放日上,備受關注的大模型公司智譜 AI 公佈了一系列行業落地數字:
根據最新的統計資料,智譜 AI 大模型開放平臺目前已經獲得 30 萬註冊使用者,日均呼叫量達到 400 億 Tokens,其中,過去 6 個月 API 每日消費量增長達 50 倍以上,效能最強的 GLM-4 模型在過去 4 個月中有超過 90 倍的增長。
在近清言 App 中,已有超過 30 萬個智慧體活躍在智慧體中心,包括許多出色的生產力工具,如思維導圖、文件助手、日程安排等等。
而在新技術一側,GLM-4 的最新版本 GLM-4-9B 全方位超越 Llama 3 8B,多模態模型 GLM-4V-9B 也已上線,所有大模型全部保持開源。
一系列商業化成果、技術突破讓人眼前一亮。
MaaS 平臺升級 2.0 版
打下大模型應用門檻
最近,國產大模型正在掀起新一輪的競爭。
5 月初,智譜 AI 率先將大模型 GLM-3-Turbo 服務的價格降低到了原來的 1/5,也激起了眾多大模型領域玩家「參戰」。從爭相成立創業公司、「百模大戰」再到價格戰,大模型賽道的競爭螺旋攀升。
而降低大模型服務的成本,能夠讓更多的企業和開發者獲得新技術,進而催生足夠大的使用量,這不僅能加速技術的突破,也能讓大模型在各行各業快速滲透,鋪開商業化的佈局。
值得一提的是,到了目前的節點,大模型的價格已被壓的很低,但智譜表示自己不怕打價格戰。
「相信大家對於最近的大模型價格戰有所瞭解,也很關心智譜的商業化策略。我們可以很自豪地說,我們是透過模型核心技術迭代和效率提升,透過技術創新,實現應用成本的持續降低,同時保證了客戶價值的持續升級,」智譜 AI CEO 張鵬說道。
根據企業的不同應用規模,智譜宣佈了一系列最新的調整價格。API 最高折扣達到 6 折,使用 GLM-4-9B 版本可以只需要 6 分錢 / 100 萬 token。回想去年年初,GLM 系列大模型的價格已經降低了 1 萬倍。
作為率先投入生成式 AI 的創業公司,智譜 AI 的商業化速度快過一眾競爭對手。基於千億級多模態預訓練模型構建產品矩陣。其面向 C 端推出了 GLMs 個性化智慧體定製工具,讓使用者用簡單提示詞指令即能建立屬於自己的 GLM 智慧體,無需程式設計基礎。面向 B 端客戶,最新一代的 GLM-4 大模型已登陸了 MaaS(Model as a Service)平臺,提供 API 形式的訪問。
智譜 AI 開放平臺。
在今天的 Open Day 上,智譜推出了 MaaS 開放平臺 2.0,在新模型、成本、安全等方面都實現了提升。
在活動中,智譜 AI 介紹了其開放平臺的最新進展。升級的模型微調平臺可以幫助企業大幅簡化構建私有模型的過程。現在,全系列的 GLM-4 大模型都支援僅需三步即可部署。
對於技術落地來說,模型工具只是一小步。智譜 CEO 張鵬一直認為,大模型存在三個模型層,分別是 L0(基礎模型)、L1(行業模型)和 L2(面向細分場景的推理模型)。這是一個層層遞進的關係,智譜要做的就是盡全力做好 L0,再去幫助合作伙伴做好 L1 和 L2。
智譜 AI 以 MaaS 平臺為主的商業化落地路徑,針對不同客群型別和需求提供雲端 API、雲端私有化、本地私有化、軟硬體結合一體機等不同的解決方案,在滿足企業需求的同時也實現了「模型及服務」的規模化。
GLM-4 9B 全面超越 Llama3
多模態比肩 GPT-4V,開源免費
對於將構建 AGI 視為目標的智譜 AI 而言,不斷迭代大模型技術能力,同樣是重中之重。
自 2020 年 all In 大模型開始,智譜就一直走在人工智慧浪潮的前沿。其研究涉及大模型技術的方方面面,從原創的預訓練框架 GLM、國產算力適配、通用基座大模型,到語義推理、多模態生成,再到長上下文、視覺理解、Agent 智慧體能力等各個方面,智譜都投入了相當多的資源來推動技術的原始創新。
在過去一年裡,智譜相繼推出了四代通用大模型:2023 年 3 月釋出 ChatGLM,6 月推出 ChatGLM2,去年 10 月推出 ChatGLM3;今年 1 月,最新一代基座大模型 GLM-4 正式釋出。在 Open Day 上,智譜 AI 向外界介紹了基座大模型 GLM-4 的最新開源成果 ——GLM-4-9B。
它是最新一代預訓練模型 GLM-4 系列中的開源版本。GLM-4-9B 擁有更強的基礎能力,更長的上下文,實現了更加精準的函式呼叫和 All Tools 能力,並首次擁有多模態能力。
基於強大的預訓練基座,GLM-4-9B 的中英文綜合效能相比 ChatGLM3-6B 提升了 40%,在中文對齊能力 AlignBench、指令遵從 IFeval、工程程式碼 Natural Code Bench 等基準資料上都取得了非常顯著的提升。對比訓練量更大的 Llama 3 8B 也並不遜色,英文方面實現小幅領先,中文學科方面更是有著高達 50% 的提升。
新模型的上下文長度從 128K 擴充套件到了 1M,意味著模型能同時處理 200 萬字輸入,相當於兩本紅樓夢或者 125 篇論文。在長度為 128K 的 LongBench-Chat 上,GLM-4-9B-Chat 模型相比上一代提升了 20%。在長度為 1M 的大海撈針測試中,GLM-4-9B-Chat-1M 也獲得了全綠的好成績。
新一代的大模型還提升了對多語言的支援。模型詞表從 6 萬升級到了 15 萬,在中英文之外的語言編碼效率平均提升了 30%,意味著模型可以更快處理小語種的任務。評測顯示,ChatGLM-4-9B 模型的多語言能力全面超過了 Llama-3 8B。
在支援消費級顯示卡本地執行的情況下,GLM-4-9B 不僅展示出了強大的對話能力,支援 100 萬長文字,覆蓋多語言,更重要的是:智譜釋出的大模型完全免費且開源。現在,每個開發者都能在本地跑通這個版本的 GLM-4 模型。
GitHub 連結:https://github.com/THUDM/GLM-4
模型:huggingface:https://huggingface.co/collections/THUDM/glm-4-665fcf188c414b03c2f7e3b7
魔搭社群:https://modelscope.cn/organization/ZhipuAI
在強大的文字模型之外,智譜 AI 同時開源了基於 GLM-4-9B 的多模態模型 GLM-4V-9B。透過加入 Vision Transformer,該模型僅以 13B 的引數量實現了比肩 GPT-4V 的能力。
在技術演進的同時,大模型的價格也在不斷降低。智譜推出了 GLM-4-AIR 模型,它在基本保留 1 月 GLM-4 大模型效能的基礎上價格大幅下調,達到 1 元 / 百萬 tokens。
GLM-4-Air 的效能可以媲美 GLM-4-0116 大模型,價格僅為後者的 1/100。值得一提的是,GLM-4-Air 的 API 大幅提升了推理速度,相比 GLM-4-0116,GLM-4-Air 的推理速度提升了 200%,每秒可以輸出 71 個 token,遠遠超過人眼的閱讀速度。
智譜表示,大模型價格調整是基於技術突破、算力效率提升和成本控制的綜合結果,未來每隔一段時間就會對價格做出調整,以更好的滿足開發者、客戶的需求,極具競爭力的價格不僅是合理的,而且也符合自身的商業策略。
生態建設步入下一個 Level
作為國內最早入局大模型賽道的創業公司之一,智譜 AI 現在已成為國內 AI 技術公司的代表。
它不僅是國產大模型技術的領軍者,也是大模型學術界、開源生態中不可忽視的中國力量。智譜在 AI 領域已擁有廣泛影響力,開源模型累計下載量高達 1600 萬次,支援開源社群是智譜堅定不移的承諾。
更進一步,智譜 AI 也在共同制定大模型的 AI 安全標準。5 月 22 日,OpenAI、谷歌、微軟和智譜 AI 等來自不同國家和地區的公司共同簽署了前沿人工智慧安全承諾(Frontier AI Safety Commitments)。其中指出,要確保前沿人工智慧安全的負責任治理結構和透明度,負責任地說明如何衡量前沿人工智慧模型的風險,並建立前沿人工智慧安全模型風險緩解機制的明確流程。
而在 AI 領域之外,對於眾多從大模型突破中受益的行業來說,智譜 AI 正在改透過 MaaS 的方式驅動企業生產力變革,其大模型的生態圈已經初具規模。
「我們為什麼判斷 2024 年是 AGI 的元年?如果說用一句話來解答這個問題:Scaling Law 並未失效,AI 技術增長進入了一個全新的階段。大模型技術創新依舊是突飛猛進的進行時,甚至還有速度越來越快的跡象,」張鵬說道。「坦白地講,歷史上我們從未見過一種技術以如此陡峭的創新曲線迭代升級,持續時間還如此之長。」
智譜 AI 技術創新和商用落地的速度正在踐行著這條陡峭的曲線。
在技術大發展的過程中,智譜 AI 已經走上了快車道。