零一萬物Yi-1.5來了，國產開源大模型排行榜再次重新整理

机器之心發表於2024-05-14

在 OpenAI 釋出會的前一天，來自中國的大模型公司零一萬物，讓開源大模型社群活躍了起來：Yi 大模型家族新成員「Yi-1.5」模型正式開源。

在專案主頁可以看到，Yi-1.5 包括一系列預訓練和微調模型，分為 6B、9B、34B 三個版本，採用 Apache 2.0 許可證。

GitHub 地址：https://github.com/01-ai/Yi-1.5
Hugging Face 模型下載地址：https://huggingface.co/01-ai

據瞭解，Yi-1.5 是 Yi-1.0 的持續預訓練版本，使用 500B 個 token 來提高編碼、推理和指令執行能力，並在 300 萬個指令調優樣本上進行了精細調整。

剛一發布，就已經有開發者躍躍欲試：

並收穫了好評：

與前序模型相比，Yi-1.5 系列模型進一步提升了編碼、數學、推理和指令遵循能力。從下方多個基準測試結果可以看出，Yi-1.5 34B 型號的一些指標超過了 Qwen 的 72B，幾乎與 Meta Llama 3 的 70B 相當。6B 和 9B 型號也成功超越了 Mistral 的 7B v0.2 版和 Gemma 的 7B 型號。

重磅訊息當然不止這一個。

在成立一週年之際，零一萬物宣佈面向國內市場一次性發布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 介面，保證客戶能夠在不同場景下都能找到最佳效能、最具價效比的方案，Yi API Platform 英文站同步對全球開發者開放試用申請。

^{Yi 大模型 API 開放平臺（https://platform.lingyiwanwu.com/）}

其中，千億引數規模的 Yi-Large API 具備超強文字生成及推理效能，適用於複雜推理、預測，深度內容創作等場景，每百萬 token 的價格是 20 元，是 GPT-4-turbo 的三分之一。

Yi-Large-Turbo API 則根據效能和推理速度、成本，進行了平衡性高精度調優，適用於全場景、高品質的推理及文字生成等場景。Yi-Medium API 優勢在於指令遵循能力，適用於常規場景下的聊天、對話、翻譯等場景；如果需要超長內容文件相關應用，也可以選用 Yi-Medium-200K API，一次性解讀 20 萬字不在話下；Yi-Vision API 具備高效能圖片理解、分析能力，可服務基於圖片的聊天、分析等場景；Yi-Spark API 則聚焦輕量化極速響應，適用於輕量化數學分析、程式碼生成、文字聊天等場景。

其中特別要提到的是釋出會現場正式亮相的千億引數 Yi-Large 閉源大模型。Yi-Large 面世的同時即正式進軍全球 SOTA 頂級大模型之首。可以看到，與 GPT-4、Claude3 Sonnet、Gemini 1.5 Pro 以及 Llama 3-70B-Instruct 等當前頂級模型的較量中，Yi-Large 在絕大多數情況下取得了優勢。

同時，在史丹佛大模型排行榜 AlpacaEval 的英語評測中，Yi-Large 達到全球大模型 Win Rate 第一。在中文通用大模型綜合性基準 SuperCLUE 的中文語言理解排名中，Yi-Large 一躍成為國產大模型 No. 1。

中文能力方面，SuperCLUE 更新的四月基準表現中，Yi-Large 也位列國產大模型之首，Yi-Large 的綜合中英雙語能力皆展現了卓越的效能。

在釋出會上，李開復還宣佈，零一萬物已啟動下一代 Yi-XLarge MoE 模型訓練，將衝擊 GPT-5 的效能與創新性。從 MMLU、GPQA、HumanEval、MATH 等權威評測集中，仍在初期訓練中的 Yi-XLarge MoE 已經與 Claude-3-Opus、GPT4-0409 等國際廠商的最新旗艦模型互有勝負。

^{Yi-XLarge 初期訓練中評測（2024 年 5 月 12 日）。}

至此，零一萬物已經建立了「雙軌模型策略」。

近期上線的一站式 AI 工作站「萬知」（wanzhi.com/ 微信小程式「萬知 AI」）則是零一萬物基於世界領先的閉源模型 Yi-Large 所做出的「模應一體」生產力應用。

而對於大眾和行業最關心的「大模型落地如何產生價值」的命題，李開復指出，國內大模型賽道的競跑從狂奔到長跑，終局發展將取決於各個選手如何有效達到「TC-PMF」（Product-Market-Technology-Cost Fit，技術成本 X 產品市場契合度）。大模型從訓練到服務都很昂貴，算力緊缺是賽道的集體挑戰，行業應當共同避免陷入不理性的 ofo 式流血燒錢打法，讓大模型能夠用健康良性的 ROI 蓄能長跑。

在李開復博士看來，自研 AI Infra 是零一萬物必然要走的路，零一萬物也自成立起便將 AI Infra 設立為重要方向，著力於實現計算效率的最佳化。AI Infra（AI Infrastructure 人工智慧基礎架構技術）主要涵蓋大模型訓練和部署提供各種底層技術設施。這也基於一個既定事實，很多大模型公司沒有美國大廠的 GPU 數量，因此要採取更務實的戰術和戰略。

零一萬物著力於實現計算效率的最佳化，經過多方面最佳化後，零一萬物千億引數模型的訓練成本同比降幅達一倍之多。

開源醫療大模型排行榜: 健康領域大模型基準測試
2024-04-30
大模型
Meta無限長文字大模型來了：引數僅7B，已開源
2024-04-17
大模型
會顛勺的國產機器人來了：大模型加持，家務能力滿分
2024-04-26
機器人大模型
QQ 測試 AI 聊天搭子，再戰 AI 社交；零一萬物宣佈開源 Yi-9B 模型丨 RTE 開發者日報 Vol.159
2024-03-07
AI模型開發者日報
Meta AI 開源萬物可分割 AI 模型(SAM)
2023-04-11
AI模型
國產開源大模型盤點：ChatGLM-6B 和 MOSS 的應用與創新
2023-04-22
大模型
2天訓練出15億引數大模型，國產開源專案力克英偉達Megatron-LM，來自LAMB作者團隊
2022-01-21
大模型
元象首個多模態大模型XVERSE-V開源，重新整理權威大模型榜單，支援任意寬高比輸入
2024-04-28
大模型
Facebook 開源了物體檢測研究平臺 Detectron
2018-01-23
iOS開發之TabBar再次點選實現重新整理
2018-03-27
iOStabBar
Facebook模型FixResNeXt升級，再次重新整理ImageNet影象分類記錄
2019-07-31
模型
AGI來了？特拉斯用大模型幫助自動駕駛
2024-04-16
大模型自動駕駛
百萬tokens低至1元！大模型越來越捲了
2024-05-13
大模型
AI來了，國產EDA工具的春天到了？
2019-10-11
AI
沒等來OpenAI，等來了Open-Sora全面開源
2024-03-18
OpenAISora
開源大語言模型作為 LangChain 智慧體
2024-02-22
模型LangChain智慧體
10個最新開源大模型Llama 3應用
2024-04-22
大模型
國產軟體的“拿來主義”：開源軟體、主導權
2010-03-02
Facebook開源模型可解釋庫Captum，這次改模型有依據了
2019-10-15
模型APT
大模型綜述來了！一文帶你理清全球AI巨頭的大模型進化史
2023-05-17
大模型AI
開源 Serverless 里程碑：Knative 1.0 來了
2021-12-27
Server
OpenClusterManagement 開源之夏 2022 來了
2022-05-26
Nacos 開源之夏 2022 來了
2022-05-22
通用文件理解新SOTA，多模態大模型TextMonkey來了
2024-03-25
大模型
曾開源OpenStack，如今Rackspace再次啟動IPO
2020-04-30
首個基於Mamba的MLLM來了！模型權重、訓練程式碼等已全部開源
2024-04-22
模型
開源了！唱吧 UI 元件庫開源了！
2021-12-31
UI元件
本週DBRX等八款大模型開源專案
2024-04-05
大模型
一大波開源小抄來襲
2022-07-06
大模型的未來在哪？
2021-10-26
大模型
最懂工業的大模型來了！思謀釋出全球首個工業多模態大模型
2023-11-07
大模型
浪潮資訊釋出源2.0基礎大模型，千億引數全面開源
2023-11-27
大模型
跨平臺開發時代的 (再次) 到來？
2015-03-29
那些年的開源專案，你跑起來了嗎？
2021-12-08
首個國產音樂SOTA模型來了！專為中文最佳化，免費用，不限曲風
2024-04-17
模型
再次重新整理融資紀錄，開源圖資料庫Neo4j獲得3.25億美元F輪融資
2021-06-18
資料庫
TiFlash 開源了
2022-04-01
多模態大模型有了統一分割框架，華科PSALM多工登頂，模型程式碼全開源
2024-04-08
大模型框架

零一萬物Yi-1.5來了，國產開源大模型排行榜再次重新整理

相關文章