開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

机器之心發表於2024-08-30

今天一大早,Meta 便秀了一把「Llama 系列模型在開源領域取得的成績」,包括如下:

  • HuggingFace 下載量接近 3.5 億次,較 2023 年同期增長了 10 倍;

  • 過去一個月下載量達到了 2000 萬次,使得 Llama 成為領先的開源模型系列;

  • 雲服務供應商對 Llama 需求巨大,自 5 月以來,Meta 最大雲供應商的 token 使用量增加了一倍多;

  • Llama 模型正被整個行業採用,包括 Accenture、ATT、DoorDash、GoldmanSachs 等。

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

距離 Llama 3.1 的釋出(7 月 24 日)僅僅過去了一個多月,Meta 已經將上下文擴充套件到了 128k,增加了對 8 種語言的支援,並且 405B 引數量的 Llama 3.1 成為全球最強的開源大模型。

可以說,Llama 的成果要歸功於開源的力量。目前圍繞 Llama 已經形成了一個充滿活力和多樣性的 AI 生態系統,開發者擁有了比以往更多的選擇和能力,初創公司和各種規模的企業都在使用 Llama 來構建 On-premises(指公司的本地資料中心內執行的軟體、服務或系統。)。

可以說,開源已經成為 Meta 的 DNA。此前,Meta 創始人扎克伯克公開寫信宣告開源的好處:這將促進更有活力的 AI 開發生態,對普通使用者、Meta 以及其他公司都有利。

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

7 月 24 日,在 Llama 3.1 釋出的同時,祖克伯也發了一封標題為「擁抱開源 AI:通往未來的必由之路」的公開信。

歷時 18 個月,Llama 成長為開源模型標杆

自 2023 年 2 月首次亮相以來,Llama 只用了 18 個月便從單一的先進基礎模型發展成為面向開發者的強大系統。到如今,藉助 Llama 3.1,Meta 為開發者提供了一個完整的參照系統,使他們可以輕鬆建立自己的智慧體,並透過安全工具幫助他們負責任地建立。

除了下載量的持續增長,Meta 還與 AWS、微軟 Azure、Databricks、戴爾、谷歌雲、Groq、NVIDIA、IBM watsonx、Scale AI、Snowflake 等公司合作,幫助開發者發揮模型潛力。

釋出 Llama 3.1 後,Meta 的主要雲服務供應商的 Llama 使用量顯著增長。具體來說,從 2024 年 5 月到 7 月,按 token 計算的使用量翻了一番多。

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

從今年 1 月到 7 月,Meta 的主要雲服務供應商每月對 Llama 使用量增長了 10 倍。引數量最大的 Llama 3.1 405B 也很受歡迎,據某雲服務供應商 8 月的資料顯示,使用者數最高的是 Llama 3.1 405B。

Llama 3.1 釋出後,擁有訪問 Llama 許可權的合作伙伴增長了 5 倍,Wipro、Cerebras 和 Lambda 等知名企業也將成為其中的一員。

開發者社群對 Llama 的偏好也日益增長。據專注於 AI 基準測試的獨立網站 Artificial Analysis 的調查,Llama 是開發者們的首選排行榜上的第二名。

在 Hugging Face 平臺上,Llama 已有超過 60,000 個模型變體,活躍的開發者社群正在根據自己的需求,對 Llama 進行細緻的定製和最佳化,包括 AT&T、DoorDash、高盛、Niantic、野村證券、Shopify、Spotify、Zoom 等在內的行業巨頭,以及 Infosys 和 KPMG 等專業服務領域的領軍企業,都已經將 Llama 整合到內部系統中。

在企業服務中,Llama 系列已經有一些成功的用例。基於 Llama 3.1 知名諮詢公司埃森哲構建了一個用於 ESG(環境、社會和治理)報告的定製大模型。他們期望,用上了 AI 之後,寫報告的生產力能提高 70%,質量提高 20% 至 30%。

透過微調 Llama 模型,美國電信巨頭 AT&T 在客戶服務搜尋響應上取得了接近 33% 的大幅提升。這一改進不僅降低了成本,還提升了業務效率。

隨著 Llama 生態系統的不斷壯大,Meta AI 的功能和接入點也在同步擴充套件。現在,使用者可以透過 Instagram、WhatsApp、Messenger 和 Facebook 等應用直接體驗 Meta 的智慧助手。

Meta 也沒忘記心心念唸的「元宇宙」,Meta 還在開發頭顯 Quest 系列和智慧眼鏡 Ray-Ban Meta,正在朝著一個目標邁進:屆時,一個全天候待命、知冷知熱、提供情緒價值的 AI 助手將以可穿戴的形式主動融入你的日常生活,為你提供幫助。

與此同時,OpenAI 也亮出了自己的資料,每週有超過 2 億人在使用 ChatGPT,相比去年 11 月的報告,ChatGPT 每週的活躍使用者數約為 1 億,僅過半年,這個數字就漲了一倍。

在 ToB 賽道上,OpenAI 也不遑多讓,92% 的財富 500 強公司都在使用 OpenAI 的產品,更便宜、更智慧的 GPT-4o Mini 推出後,API 的使用量翻了一番。

評論兩極分化:真·假開源

看到 Meta 的喜報,Grok 的 CEO Jonathan Ross 發來了賀電:一個大模型的下載量達到 3.5 億次,太瘋狂了!Linux 達到這個數字用了多久?

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

他還表示:開源贏了!到目前為止,Groq 已經向超過 40 萬開發者每天提供 50 億 Llama 系列模型的免費 token。但這仍然供不應求,Ross 稱,即使 Groq 將部署的容量增加 10 倍,這些資源也會在 36 小時內用完。

Llama 系列以如此快的速度,達成了 3.5 億次下載的成就,老黃也趕緊點了贊:「在過去的一個月裡,我們見證了 Llama 3.1 以如此之快速度被應用部署,真是令人難以置信。」

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

但是在網友和合作夥伴的一片叫好聲中,也有對 Meta 只開放程式碼,未開放模型權重的質疑聲。

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

雖然 Meta 給自己全身貼滿了「開源」的標籤,但是最近開放原始碼促進會(OSI)卻明確表示:Llama 系列並不算真開源。

在 OSI 給出的定義下,判斷一個 AI 模型真正開源,需要符合「四項基本自由」:不限制使用目的,允許深入研究其工作原理,支援隨意修改,無論是否進行過修改都允許使用者自由分享模型。

雖然 Llama 3 模型可以自由部署,但 Meta 限定了 Llama 3 可以生成的內容型別。因此, Llama 3 也不算真正的開源了。

然而 ,Meta 對 OSI 非黑即白的「二元論」提出了反對,他們認為開發大模型的成本很高,過程也很複雜。因此,對於開源的標準,應該有一個從完全開放到部分開放的範圍,而不是隻有完全開源或完全閉源兩種極端狀態,並且被 OSI 列入第一批「白名單」的開源模型中,都沒有達到 Sota 的水準。

Meta 這麼剛,知名雜誌《經濟學人》對此點評道:Meta 被指控正在「霸凌」開源社群。

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

在今年的 SIGGRAPH 大會上,祖克伯曾在和黃仁勳的對談中提及,Meta 做開源並非純純做慈善,而是一種明智的經營策略。在開源計算系統後,Meta 成為了行業標準,供應鏈主動對齊 Meta 的設計,這種為行業打造整套生態的經驗,實際為 Meta 節省了數十億美元。

開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

同時,Meta 開源的決策也要拜蘋果所賜,在以手機為代表的智慧移動裝置崛起後,蘋果的閉源生態太過壟斷,以至於祖克伯放棄了很多想要開發的功能。為此,祖克伯甚至當場爆粗。開源啟動!18個月Llama系列下載量近3.5億,黃仁勳:快到難以置信

但在 OSI 看來,Meta 現在的做法似乎讓他們變成了「另一個蘋果」。發出「Meta 正在霸凌開源社群」指控的正是 OSI 的執行董事 Stefano Maffulli:「祖克伯真的在強迫整個行業跟隨他的步伐」。

OSI 計劃在今年 10 月正式揭曉對「開源 AI」定義的最終修訂版。他們期望透過一個清晰而嚴格的標準,賦予開發者們信心:他們可以自由地使用、複製和修改像 Llama 這樣的開源模型,而不必「受祖克伯善意的擺佈」。

相關文章