Meta開源Llama 3釋出

banq發表於2024-04-19

Meta釋出迄今為止最有能力的開源大模型：Llama 3

要點：

此次釋出 Llama（Meta Llama 3）的前兩個型號，可供廣泛使用。此版本具有經過預訓練和指令微調的語言模型，具有 8B 和 70B 引數，可以支援廣泛的用例。
Llama-3 8b 在基準測試中擊敗 Llama-2 70b ！
Llama-3 70B擊敗Claude Sonnet！
Llama-3 400B 將可能輕鬆擊敗 GPT-4 和 Opus。目前 400b 的基準測試顯示分數低於 Opus，但它仍在訓練中！
推理、程式碼生成和指令跟蹤等功能的極大改進，使 Llama 3 更加易於操控。
截至目前，卻只有 8K 上下文長度：稍後將釋出具有更長上下文視窗的版本

與ChatGPT比較：
與付費 ChatGPT Plus 中的 GPT-4 相比：

           Llama 3 8B Llama 3 70B GPT-4
 MMLU      68.4       82.0        86.5
 GPQA      34.2       39.5        49.1
 MATH      30.0       50.4        72.2
 HumanEval 62.2       81.7        87.6
 DROP      58.4       79.7        85.4

該模型很可能在某些領域比 GPT-4 更先進，除非 GPT-5快點推出。
大多數人使用的免費版 ChatGPT 是基於 GPT-3.5 的，這比 GPT-4 差很多。
Llama 3 70B 輕鬆擊敗GPT-3.5，甚至 8B 也很接近。
擁有如此優秀的模型，您可以在本地執行並進行修改，

其他點：

8b 引數版本和 70b 引數版本。
僅解碼器結構。
僅在模型上實現文字輸入到文字輸出（目前）。
計劃稍後釋出多模態版本的 llama 3
計劃稍後推出更大的上下文視窗。
總體上聽起來，他們是在進行迭代釋出。
對 15 萬億個token進行預訓練。
在 2 個 24k GPU 叢集上訓練。
新增更高效的標記符號生成器和 128k 標記符號詞彙表。
內部仍在訓練超過 400b 引數的版本。
建立了一個內部評估，但從未交給建模團隊，以避免過度擬合。

總之
我們現在有一個大致相當於GPT4的開源模型，Llama 3 400B。

讓我們期待 Open Ai 釋出 GPT5 以及 Google 釋出 Gemini 2 或 Gemini 1.5 Ultra 需要多長時間。
這些模型會變得超級強大

Llama 3：Meta新AI模型
2024-06-10
AI模型
歡迎 Llama 3：Meta 的新一代開源大語言模型
2024-04-23
模型
權威AI開源標準1.0版釋出：Llama也不算開源
2024-10-29
AI
Meta3D 1.0正式版釋出-----開源的Web3D低程式碼平臺
2023-12-29
Web3D
Meta釋出了一個開源的NotebookLM
2024-10-28
（內含福利）Meta 釋出新開源模型 Llama 3；華為 Pura 70 系列一分鐘售罄丨 RTE 開發者日報 Vol.188
2024-04-19
模型開發者日報
Llama 3 開源了「GitHub 熱點速覽」
2024-04-23
Github
10個最新開源大模型Llama 3應用
2024-04-22
大模型
微軟釋出Phi-3，效能超Llama-3，可手機端執行
2024-04-24
微軟
開源| 呼叫ARUICalling開源元元件釋出
2022-03-17
UI元件
開源demo| ARCall 小程式開源示例釋出
2022-07-20
SAM 2.1上新、Lingua程式碼庫釋出，一大波Meta開源工具來襲
2024-10-19
開源工具
renren開源專案釋出
2024-08-07
阿里Qwen2正式開源，效能全方位包圍Llama-3
2024-06-07
阿里
Meta開源其類似GPT-3的語言模型 - Reddit
2022-05-05
GPT模型
Llama3後，Meta又開放自家頭顯作業系統，打造元宇宙時代新安卓
2024-04-24
作業系統元宇宙安卓
本地快速安裝執行史上最強開源LLaMa3大模型
2024-08-21
大模型
開源模型進展盤點：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？
2024-06-03
模型
使用jitPack釋出android開源庫
2018-03-14
Android
【開源】合摩 WeexBox 正式釋出
2018-12-20
使用Jitpack釋出開源Java庫
2022-02-23
Java
專為訓練Llama 3，Meta 4.9萬張H100叢集細節公佈
2024-03-13
僅需Llama3 1/17的訓練成本，Snowflake開源128x3B MoE模型
2024-04-25
模型
微軟小語言模型Phi-3-Mini-4K-Instructk開源釋出
2024-04-24
微軟模型Struct
重磅！滴滴開源首次釋出年度報告
2019-05-06
LOVEPHP-WEB全棧開源框架釋出
2022-08-06
PHPWeb全棧框架
2021木蘭開源社群年報釋出
2022-02-01
開源電子書工具Calibre 6.3 釋出
2023-02-28
開源React Native元件庫beeshell 2.0釋出
2022-12-05
React Native元件
Llama 3超大杯有何驚喜？Meta會一直開源嗎？當初為何篤信元宇宙？祖克伯新訪談回應一切
2024-04-22
元宇宙
幾乎覆蓋元素週期表！Meta 釋出開源 OMat24 資料集，含 1.1 億 DFT 計算結果
2024-11-05
釋出一個 Github Trending 的API，並開源
2019-02-25
GithubAPI
開源 CMS Ghost 3.0 釋出，帶來新功能
2019-11-03
釋出 UIAutomatorViewer 獨立包開源工程專案
2020-10-10
UIView
【開源】Qone 正式釋出，使 javascript 支援 .NET LINQ
2018-04-24
JavaScript
釋出你的開源軟體到 Ubuntu PPA
2021-12-21
Ubuntu
位元組跳動又一開源力作釋出
2021-07-21
[開源]愛釋出類似fir.im和蒲公英的App釋出平臺
2018-06-22
APP

Meta開源Llama 3釋出

相關文章