蘋果OpenELM：開源小語言模型

banq發表於2024-04-25

原文網址 : https://www.jdon.com/73441.html

蘋果模型

OpenELM：具有開源訓練和推理框架的高效語言模型系列

OpenELM 使用分層縮放策略來有效地分配變壓器模型每一層內的引數，從而提高準確性。我們使用CoreNet庫預訓練 OpenELM 模型。我們釋出了具有 270M、450M、1.1B 和 3B 引數的預訓練和指令調整模型。

我們的預訓練資料集包含RefinedWeb、去重PILE、RedPajama 的子集和Dolma v1.6 的子集，總計約1.8 萬億個token。使用這些資料集之前，請檢查許可協議和條款。

各型號的詳細資訊請參見下表：

OpenELM-270M
OpenELM-450M
OpenELM-1_1B
OpenELM-3B
OpenELM-270M-指令
OpenELM-450M-指令
OpenELM-1_1B-指令
OpenELM-3B-指令

優秀微型模型的競賽已經開始！
比較：

蘋果 OpenELM 3B：24.80 MMLU
微軟 Phi-3-mini 3.8b：68.8 MMLU

比較:

OpenELM-3b-instruct: 76.87 HellaSwag, 67.96 WinoGrande,
Phi-3-mini-instruct: 76.7 HellaSwag, 70.8 WinoGrande

蘋果開源高效語言模型 OpenELM；全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192
2024-04-25
蘋果模型AI開發者日報
蘋果捲開源大模型，公開程式碼、權重、資料集、訓練全過程，OpenELM亮相
2024-04-25
蘋果大模型
小語言模型指南
2024-04-29
模型
新型大語言模型的預訓練與後訓練正規化，蘋果的AFM基礎語言模型
2024-11-28
模型蘋果
蘋果iPhone XS/XR怎麼設定Siri語言？蘋果手機Siri語言設定教程
2018-12-03
蘋果iPhone
微軟小語言模型Phi-3-Mini-4K-Instructk開源釋出
2024-04-24
微軟模型Struct
開源大語言模型作為 LangChain 智慧體
2024-02-22
模型LangChain智慧體
權重、程式碼、資料集全開源，效能超越Mistral-7B，蘋果小模型來了
2024-07-22
蘋果模型
人工智慧大模型之開源大語言模型彙總（國內外開源專案模型彙總）
2024-06-21
人工智慧大模型
python 是開源語言嗎：Python 是一種開源語言嗎？
2023-12-20
Python
開源模型進展盤點：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？
2024-06-03
模型
蘋果AppleMacOs系統Sonoma本地部署無內容審查(NSFW)大語言量化模型Causallm
2024-03-09
蘋果APPMac模型
2024智源大會議程公開丨大語言模型
2024-06-04
模型
Meta開源其類似GPT-3的語言模型 - Reddit
2022-05-05
GPT模型
蘋果將使用本地大模型？
2024-04-23
蘋果大模型
歡迎 Llama 3：Meta 的新一代開源大語言模型
2024-04-23
模型
大語言模型
2024-08-08
模型
語言大模型
2024-08-07
大模型
蘋果mac電腦如何開啟“語音控制”？
2021-01-21
蘋果Mac
讓大模型理解手機螢幕，蘋果多模態Ferret-UI用自然語言操控手機
2024-05-20
大模型蘋果UI
小蘋果改編問題
2024-10-05
蘋果
nlp中的傳統語言模型與神經語言模型
2018-11-03
模型
N元語言模型
2019-01-25
模型
在NextChat中接入SiliconCloud API 體驗不同的開源先進大語言模型
2024-08-26
CloudAPI模型
FAIR & NYU開發XNLI語料庫：15種語言（含低資源語言）
2018-11-12
AI
Facebook 開源 Skip 物件導向+函數語言程式設計語言
2018-09-30
物件函數程式設計
激發創新，助力研究：CogVLM，強大且開源的視覺語言模型亮相
2023-11-21
視覺模型
搞人工智慧開源大語言模型GPT2、Llama的正確姿勢
2024-11-02
人工智慧模型GPT
2018年最強自然語言模型 Google BERT 資源彙總
2019-03-03
模型Go
如何開始定製你自己的大型語言模型
2024-03-28
模型
8 語言模型簡介
2020-01-08
模型
微調大語言模型
2024-08-28
模型
2021年Go語言開發者調查結果
2022-04-21
Go
微軟小語言模型Phi-3-mini測試體驗
2024-04-25
微軟模型
谷歌開源最強端側小模型：2B引數越級跑贏GPT-3.5-Turbo，蘋果15Pro執行飛快
2024-08-01
谷歌模型GPT蘋果
AI知道蘋果是什麼嗎？DeepMind語言模型科學家正把這些概念變得可量化、可測試
2024-04-30
AI蘋果模型
Deepseek V3 成為迄今為止中國最強大的開源語言模型
2024-12-27
模型
蘋果手機文字轉語音方法
2019-01-04
蘋果

蘋果OpenELM：開源小語言模型

相關文章