Llama成大模型頂流,祖克伯掀論戰:玩開源,時代變了

机器之心發表於2024-07-24

開源與閉源的紛爭已久,現在或許已經達到了一個新的高潮。

說到開源大模型,Llama 系列自誕生以來就是典型代表,其優秀的效能與開源特點讓人工智慧技術的應用性和可訪問性大大提升。任何研究人員和開發者都能夠從中獲益,讓研究和應用變得更加廣泛。

現在,Meta Llama 3.1 405B 正式釋出。在官方部落格中,Meta 表示:「直到今天,開源大語言模型在功能和效能方面大多落後於封閉模型。現在,我們正在迎來一個開源引領的新時代。」

圖片

與此同時,Meta 創始人、CEO 祖克伯親自撰寫長文闡述開源對所有開發者、對 Meta、對世界的意義。他表示,開源是 AI 積極發展的必要條件。以 Unix 和 Linux 的發展為例,開源 AI 將更有利於創新、資料保護和成本效益。

他還認為,開源 Llama 模型能夠建立一個完整的生態系統,確保技術進步,並且不會因為競爭而失去優勢。Meta 有著成功的開源歷史,透過開源 AI 模型,祖克伯希望促進全球技術的平等和安全應用。

圖片

原文連結:https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

以下是原文內容:

扎克伯克為 Meta 注入開源基因

在高效能運算的早期,各大主流科技公司都投入大量資金開發各自的閉源 Unix 版本。當時很難想象會有其他方法能開發出如此先進的軟體。

然而,開源的 Linux 逐漸流行起來:最初是因為它允許開發人員自由修改程式碼且價格更實惠,而後來它變得更先進、更安全,並且擁有比任何閉源 Unix 更廣泛的生態系統,支援更多的功能。今天,Linux 已成為雲端計算和執行大多數移動裝置的作業系統的行業標準基礎, 大家都因其卓越的產品受益。

我相信人工智慧的發展也與其發展軌跡類似。今天,一些科技公司正在開發領先的閉源模型,但開源正在迅速縮小差距。

去年,Llama 2 僅能與一代舊型號相媲美。而在今年,Llama 3 在某些領域已經可以與行業中領先的模型競爭甚至領先。明年開始,我們預計未來的 Llama 模型將成為行業中最先進的大模型。在此之前,Llama 也已經在開放性、可修改性和成本效益方面領先。

今天,我們正邁出下一步 —— 使開源 AI 成為行業標準。我們釋出了首個前沿級開源 AI 模型 Llama 3.1 405B,以及改進版的 Llama 3.1 70B 和 8B 模型。較於閉源模型,這些開源模型在成本效益上顯著提升,特別是 405B 模型的開源特性,使其成為微調和蒸餾小型模型的最佳選擇。

除了釋出這些模型,我們還與多家公司合作,擴充更廣泛的生態系統。亞馬遜、Databricks 和英偉達正在推出全套服務,支援開發者微調和蒸餾他們自己的模型。像 Groq 這樣的創新者已經為所有新模型構建了低延遲、低成本的推理服務。

這些模型將在包括 AWS、Azure、Google、Oracle 等所有主要雲平臺上可用。Scale.AI、戴爾、德勤等公司已經準備好幫助企業採用 Llama 並使用他們自己的資料訓練定製模型。隨著社群的成長和更多公司開發新服務,我們可以共同使 Llama 成為行業標準,並將 AI 的益處帶給每個人。

Meta 致力於開源 AI,以下是我認為開源是最佳開發平臺的原因,為什麼開源 Llama 對 Meta 有利,以及為什麼開源 AI 對世界有益,並由此將長期存在。

開源 AI 之於開發者

當我與全球的開發者、CEO 和政府官員交談時,通常聽到幾個主題:

  • 我們需要訓練、微調和蒸餾自己的模型。每個組織都有不同的需求,這些需求最好透過使用不同規模並使用特定資料訓練或微調的模型來滿足。裝置上的任務和分類任務需要小型模型,而更復雜的任務則需要大型模型。現在,你可以使用最先進的 Llama 模型,繼續用自己的資料訓練它們,然後將它們蒸餾成最適合你需求的模型規模 —— 無需我們或任何其他人看到你的資料。

  • 我們需要掌控自己的命運,而不是被閉源供應商「鎖死」。許多組織不希望依賴他們無法自己執行和控制的模型。他們不希望閉源模型供應商能夠更改模型、改變使用條款,甚至完全停止服務。他們也不希望被鎖定在擁有模型專有權的單一雲平臺上。開源使得相容工具鏈的廣泛生態系統成為可能,你可以輕鬆地在這些工具之間切換。

  • 我們需要保護我們的資料。許多組織處理需要保護的敏感資料,無法透過雲 API 傳送到閉源模型。一些組織則根本不信任閉源模型供應商對其資料的處理。開源解決了這些問題,因為它使你可以在任何你想要的地方執行模型。眾所周知,開源軟體會因為開發過程更加透明,而更安全。

  • 我們需要一個高效且經濟的模型。開發者可以在自己的基礎設施上執行 Llama 3.1 405B,進行推理,成本大約是使用閉源模型(如 GPT-4)的 50%,適用於使用者端和離線推理任務。

  • 我們希望投資於將成為長期標準的生態系統。許多人看到開源的發展速度快於封閉模型,他們希望在能夠長期提供最大優勢的架構上構建自己的系統。

開源 AI 之於 Meta

Meta 的商業模式是為人們構建最佳體驗和服務。為了實現這一目標,我們必須確保始終能夠獲取最佳技術,而不是被鎖定在競爭對手的封閉生態系統中,這樣他們就不能限制我們所開發的內容。

我想分享一個重要經歷:雖然蘋果公司允許我們在其平臺上構建內容,但是當我們構建服務時仍受到了限制。無論是他們對開發者的稅收、他們施加的任意規則,還是他們阻止的所有產品創新,顯而易見,如果我們能夠構建產品的最佳版本,並且競爭對手無法限制我們構建的內容,Meta 和許多其他公司將能夠為人們提供更好的服務。從哲學層面上講,這也是我如此堅信在 AI 和 AR/VR 領域為下一代計算機建立開放生態系統的一個重要原因。

人們常常問我是否擔心因為開源 Llama 而失去技術優勢,但我認為這忽略了大局,原因有以下幾點:

首先,為了確保我們能夠長期保持技術領先,並且不被鎖定在閉源生態系統中,Llama 需要發展成一個完整的生態系統,包括工具、效率改進、硬體最佳化和其他整合。如果只有我們公司使用 Llama,這個生態系統將不會發展,我們的境況也不會比 Unix 的閉源變種好多少。

其次,我預計 AI 開發將繼續保持高度競爭,這意味著在任何給定時刻,開源某個模型不會使我們在與下一個最佳模型的競爭中失去巨大優勢。Llama 成為行業標準的途徑是透過一代又一代地保持競爭力、高效性和開放性。

第三,Meta 與閉源模型提供商的一個關鍵區別在於,銷售 AI 模型的訪問許可權並不是我們的商業模式。這意味著公開發布 Llama 不會削弱我們的收入、可持續性或投資研究的能力,而閉源提供商則會受到影響。(這也是為什麼一些閉源提供商一直在遊說公共管理者反對開源的原因之一。)

最後,Meta 在開源專案上有著豐富的成功經驗。透過與開放計算專案分享我們的伺服器、網路和資料中心設計,並使供應鏈標準化,我們節省了數十億美元。透過開源 PyTorch、React 等領先工具,我們從生態系統的創新中受益匪淺。這種方法長期以來一直極具效果。

開源 AI 之於世界

我相信開源對於 AI 的未來是有必要的。AI 比任何其他現代技術都更有潛力提高人類的生產力、創造力和生活質量,並且能夠在加速經濟增長的同時推動醫學和科學研究的進步。開源將確保全球更多的人能夠從 AI 的發展中獲得利益和機會,權力不會集中在少數幾家公司手中,並且技術能夠更均勻和安全地在社會中部署。

關於開源 AI 模型的安全性,存在著持續的爭論。我的觀點是,開源 AI 將比替代方案更安全。我認為各國政府最終會得出支援開源的結論,因為這將使世界更加繁榮和安全。

在我理解的安全性框架中,我們需要防範兩類危害:無意和故意。

  • 無意的危害是指 AI 系統可能在執行時非故意地造成傷害。例如,現代 AI 模型可能在無意中給出錯誤的健康建議。或者,在未來場景中,有人擔心模型可能會無意中自我複製或過度最佳化目標,從而對人類造成損害。

  • 故意的危害是指不良行為者使用 AI 模型以造成傷害為目的。

值得注意的是,無意的危害涵蓋了人們對 AI 的多數擔憂 —— 從 AI 系統對數十億使用者的影響到大多數真正災難性的科幻場景。在這方面,開源所帶來的安全性更加顯著,因為系統更透明,可以被廣泛審查。

歷史上,開源軟體由於這一原因一直更安全。同樣,使用 Llama 及其安全系統如 Llama Guard,可能會比閉源模型更安全和更可靠。因此,大多數關於開源 AI 安全性的討論集中在故意的危害上。

我們的安全流程包括嚴格的測試和紅隊評估,以檢驗我們的模型是否有可能造成實質性傷害,此目標是在釋出前減輕風險。由於這些模型是開源的,任何人都可以自行進行測試。我們必須牢記,這些模型是透過網際網路上已有的資訊訓練的,所以在考慮危害時,起點應該是模型是否能比從 Google 或其他搜尋結果快速獲取的資訊造成更多的危害。

透過區分個體或小規模行為者與擁有大量資源的大規模行為者(如國家)所能做的事情,將會有益於推理故意傷害。

在未來的某個時候,個別惡意行為者可能會利用 AI 模型的智慧,從網際網路上現有的資訊中製造出新型危害。在這一點上,力量的均衡對 AI 安全至關重要。

我認為生活在一個 AI 廣泛部署的世界中會更好,因為這樣可以使大型行為者制衡小型惡意行為者。這也是我們在社交網路上管理安全的方式,憑藉更強大的 AI 系統識別並阻止那些經常使用小規模 AI 系統的不太複雜的行為者。

更廣泛地說,大型機構在大規模部署 AI 時將促進社會的安全和穩定。只要每個人都能訪問類似代際的模型,那麼擁有更多算力資源的政府和機構將能夠制衡擁有較少計算資源的惡意行為者。

在考慮未來的機遇時,請記住,今天的大多數領先科技公司和科學研究都是建立在開源軟體之上的。如果我們共同投資於開源 AI,下一代公司和研究就會獲得使用的機會。這包括剛剛起步的初創企業,以及那些可能沒有資源從頭開發 SOTA AI 的大學和國家的人們。

總而言之,開源 AI 代表了在全球範圍內我們可以利用這項技術為所有人創造最大的經濟機會和安全保障。

合作行穩,開源致遠

在過去的 Llama 模型中,Meta 為自身開發釋出了這些模型,但並未重點關注建立更廣泛的生態系統。這次釋出,我們採取了不同的方式。我們正在內部組建團隊,使盡可能多的開發者和合作夥伴能夠使用 Llama,並且積極建立合作伙伴關係,以便生態系統中的更多公司能夠為他們的客戶提供獨特的功能。

我相信 Llama 3.1 的釋出將成為行業的一個轉折點,大多數開發者將開始使用開源技術,我預計這種方式將會以我們的開源為起點。

我希望我們可以共同努力將 AI 的益處帶給全世界。

你現在可以在 llama.meta.com 上訪問這些模型。

💪,

馬克·祖克伯

相關文章