開啟文心大模型,一看全是生產力

机器之心發表於2024-07-01
百度文心按下了 Turbo 鍵。

最近一段時間,人們在熱衷於給大模型「考試」。

不論是適用於機器的 Benchmark 跑分,還是人類的高考題,在一次次橫向測評中,技術的發展進度被不斷量化。對比中取得了好成績的 AI,一時會受到人們的熱捧。

然而在現實世界這個「考場」上,很多時候不存在所謂的標準答案,AI 會遭遇各種訓練中未曾遇見的情況。更進一步,大模型的應用也要面臨是否有用的靈魂拷問。對於技術快速發展的大模型來說,實際落地的效果,才是評判能力最重要的一環。

在雲南瀾滄縣,人們正在使用基於文心智慧體平臺建立的「農民院士智慧體」,根據朱有勇院士的指導,開展旱地農業。

圖片

全新的智慧程式碼助手文心快碼,百度 80% 工程師都在深度使用,其中程式碼採納率已達到 46%。

圖片

就連古老的甲骨文也已經被 AI 煥活,變得能與我們對話。點選甲骨文,還可以看到大模型生成的釋義。

圖片

這一切,都是昨天百度 WAVE SUMMIT 深度學習開發者大會上的最新技術展示。百度,正在「實用性」這條道路上日夜狂奔。

文心大模型,進入 Turbo 時代

兩個月前,文心大模型 4.0 工具版剛剛釋出,今天又釋出了文心大模型 4.0 Turbo。

昨天,文心大模型上線了最新的 4.0 Turbo。基於今年 4 月上線的文心大模型 4.0,再次實現了提升。新版本的速度更快、效果更好,目前文心一言的網頁版、APP 陸續上線,供開發者使用的 API 也已上線。

圖片

感受一下 4.0 Turbo 的速度,直接和文心大模型 4.0 進行對比 :

圖片

輸出的內容有所不同,質量都不錯,不過速度上的差異非常明顯,Turbo 太快了。

我們第一時間測試了網頁上的 Turbo 版。看起來大模型能夠感知到近期發生的新聞,生成答案的速度比我們看文字的速度要快很多,而且整理出來的答案邏輯清晰,最後也附帶了引用連結。

圖片

有新一代深度學習平臺飛槳給 4.0 Turbo 作技術底座,百度提升了大模型訓練資料的體量,最佳化了資料的分佈和質量,進而不斷迭代訓練演算法。在此基礎上,有監督精調、人類反饋的強化學習、提示詞工程等調優技術持續進步;文心大模型獨有的知識增強、檢索增強和對話增強技術也有了改進。

智慧體能力在文心 4.0 Turbo 上也有了增強。在強大的基礎模型之上,進一步進行思考增強訓練,提升了智慧體理解、規劃、反思和進化等能力。現在大模型的 Agent 能夠做到可靠執行、自我進化,並一定程度上可以將思考過程白盒化。透過智慧體,AI 能夠像人一樣思考和行動,呼叫工具自主完成複雜任務,還能在環境中持續學習,自主進化。

目前,文心大模型系列已經擁有文心輕量級、文心 3.5、文心 4.0、文心 4.0 Turbo 等多種不同效能體量的模型,以及大模型智慧體技術,面向開發者,覆蓋了大多數場景。

其中,文心輕量級模型適合解決確定場景的問題,具備出色的效能和成本表現;文心 3.5 具有良好的通用性,適用於日常資訊處理和文字生成任務;文心 4.0 模型規模更大、能力更強,具備更強的理解能力、邏輯推理能力與更豐富的知識,提供專業且深入的幫助;文心 4.0 工具版則基於智慧體技術,善於綜合運用多種工具和資料,按要求完成非常複雜的任務。

而新發布的文心大模型 4.0 Turbo 既可以實現很好的效果,速度也更快。

大模型能力,不再浮於程式碼之上

應用落地是大模型的發展趨勢,透過不斷實踐,大模型可以找到技術精進的新方向。

在 WAVE SUMMIT 上,我們看到大模型能力不再浮於程式碼之上,而是能以「農民院士智慧體」、「體育大模型」這樣接地氣的方式,成為了很多行業上有意義的工具,在實際應用中創造出了前所未有的價值。

在雲南省瀾滄拉祜族自治縣,由於土地貧瘠、自然災害頻發,水稻種植曾經是一件非常困難的事情。2015 年,中國工程院朱有勇院士及團隊走進大山開展科技扶貧。朱院士團隊在當地教學旱地優質稻等作物的特有種植知識。在朱院士的努力下,當地農民學到了相關種植技術,作物種植水平有了質的提升。

然而,作物種植過程可能會遇到各種各樣具體的農業生產問題,如果能夠隨時隨地詢問朱院士種植問題,當地農民在旱地優質稻等作物的種植上會做得更好。

在人工智慧時代,這個問題就由 AI 解決了。

在 WAVE SUMMIT 上,百度展示了中國工程院朱有勇院士及團隊與百度共同打造的首個農業智慧體 ——「農民院士智慧體」。它基於文心智慧體平臺建立,學習了朱有勇院士的研究成果以及相關的農業知識。農民能夠隨時隨地向智慧體提問農業生產問題,獲得專業、詳盡的解答。

圖片

這個智慧體在網頁端、App,以及小度智慧裝置上都可以使用。我們發現,在文心一言 APP 中,開啟「農民院士智慧體」功能,就可以詢問關於作物種植的具體問題,並得到專業回答:

圖片

「朱院士就在我的手機裡,同他本人一模一樣」,「我們問什麼,他就答什麼,就像他坐在我旁邊一樣」,瀾滄拉祜族自治縣竹塘鄉雲山村村民這樣評價「農民院士智慧體」。

圖片

「農民院士智慧體」已然成為當地村民有力的知識助手。這讓我們看到了大模型在專業領域的實際應用價值,賦能各行各業的願景在此刻得到了具象化。可以預見的是,掌握專業知識的智慧體將成為合格的知識助手。

AI 也可以幫運動員獲得更好的成績。百度與上海體育大學探索體育科技,基於先進 AI 大模型,融合大量體育專業知識,構建了「上體體育大模型」,實現了很多運動專案上輔助訓練、技戰術分析、實時反饋分析,資料採集、姿態分析,再到媒體傳播等一系列能力。

這樣的 AI 應用目前已經覆蓋了游泳、田徑、體操、蹦床、攀巖等多支國家隊,支援了重大賽事準備時的訓練。參加巴黎奧運會的部分運動員就獲得了 AI 的幫助。此外,體育大模型也已經在全民健身領域發揮了作用。

在很多公司還在卷基準測試、跑分排名的時候,百度給出的是更具說服力的數字:文心一言累計使用者規模已達 3 億,日呼叫次數也達到了 5 億,使用者日均提問量在過去半年時間裡增長了 78%,提問平均長度提升了 89%。

在文心一言上,人們使用大模型產品的興趣正在增加:在一些場景上的需求得到滿足之後,人們很快尋找到了更多場景;從剛開始簡單的一問一答查詢問題,已變成了設定複雜的規則,提供示例,再要求大模型完成更復雜的任務。

圖片

在開發者一側,文心大模型的星河共創計劃,已經構建了 55 萬個 AI 原生應用,超過 1000 個大模型工具,集合了超過 1000B 高質量的稀疏資料。

當然,它釋放的價值,還可以直接幫助構建工程師,體現在程式碼程式設計上。

開發,正加快提速

百度的智慧程式碼助手 Comate 現在有了一箇中文名「文心快碼」。作為一個智慧 IDE 外掛,它支援 19 款主流 IDE,100 多種程式語言。

圖片

百度副總裁陳洋表示,在大模型的支援下,文心快碼可以續寫已有程式碼,利用自然語言指令生成程式碼,也可以根據註釋寫程式碼,在程式碼的基礎上生成註釋,或利用私域知識進行模型增強和精調。

昨天釋出的文心快碼 2.5 版本實現了對開發過程的全流程覆蓋,實現了知識增強,在企業級安全方面也有了巨大提升。

圖片

名字叫快碼,「快」主要體現在三個方面:開發速度快、業務迭代快、企業落地快。

為什麼開發速度快了這麼多?這背後是 AI 對研發知識的深刻理解和應用。數百位技術專家的經驗,融合了十億級的研發知識,最終形成了一個開發超級助手,其生成程式碼的生成準確率高達 80%。

據介紹,百度內部使用文心快碼之後,工程師在單位時間內提交程式碼的數量提升了 35%。

更進一步,整個開發流程也被加速了。它可以在提需求的時候幫你想,研發的時候幫你寫,測試和釋出時幫你改,甚至根據企業內部的規範提醒產品經理,並不斷檢測程式碼中的安全漏洞。在百度內部,文心快碼落地後,業務迭代的速度端到端整體提升了 14%。

最後,這一套工具可以不斷推廣到更多企業中去。文心程式碼可以提供整套最佳業務實踐和流程。百度的上萬工程師,80% 都在深度使用文心快碼,是國內使用智慧程式碼助手規模最大的團隊。而在外部,喜馬拉雅經過一個季度就實現了全面落地,程式碼的採納率達到了 44%。

這樣的程式碼採用率,可能比一些人類程式設計師還高。據介紹,文心快碼落地的客戶還有很多,包括三菱電梯、軟通動力、吉利汽車等等,超過上萬家企業,覆蓋千行百業。

逐浪的飛槳

我們知道,文心大模型能夠持續快速進化,一直得益於百度從晶片到框架,支撐模型和應用的全棧佈局。其中,飛槳深度學習平臺的聯合最佳化起到了大作用。

在 WAVE SUMMIT 上,百度釋出了新一代 AI 框架 —— 飛槳框架 3.0,目前已經面向開發者開放。

在新版設計上,百度充分考慮了目前大模型發展的趨勢,以及異構多晶片的硬體體系。新版本的框架使用時對於大模型訓練推理擁有一體化能力,強調大模型訓練開發中的自動並行能力,實現了編譯器的自動最佳化,簡化了開發調優的過程,並完成了大模型的多硬體適配。

圖片

為了實現上述技術優勢,首先從訓推一體的需求出發,在底層設計了高擴充套件中間表示 PIR,構建了高效靈活的 Pass 機制,使開發成本降低了 58%,並讓飛槳模型庫 84% 的模型推理加速超 10%。

眾所周知,大模型混合並行的開發是非常複雜,涉及混合並行、通訊、排程策略。為簡化這項工作,百度研發了自動並行能力,為程式碼的開發做更好的封裝,做到全域性的靜態最佳化,並使效能上限得到進一步的提升。藉助飛槳的動靜統一自動並行能力,不同引數模型的訓練效能均可得到提升,提升幅度可達 20%。

對於 AI 框架來說,效能最佳化是重要屬性。結合編譯器的設計,飛槳可以大幅簡化最佳化過程。在前端做好相應的編譯器表示,在後端把前端的表示轉化為底層的表示,以對接硬體,實現自動最佳化程式碼。透過編譯器來做運算元的自動融合,執行速度會比運算元呼叫提升 4 倍,比手動融合提升 14%。透過這一系列編譯效能的最佳化,在生成式模型的推理上,無論是語言模型還是擴散模型,推理效能都有非常顯著的提升,提升幅度可達 30%。

在大模型的設計過程中,訓推一體非常重要。像飛槳可以自動把動態圖轉化為靜態圖,訓練的壓縮推理得到了無縫銜接。透過呼叫高效能運算元,RLHF 的訓練加速可以達到 2.1 倍。此外,量化過程可以複用分散式策略,使量化效率提升 3.8 倍。

透過 30 多個介面,飛槳可以全面支援大模型的訓練和推理。硬體廠商只需要對基礎運算元進行適配即可接入,大幅減少了工作量。此外,它還在軟硬體協同最佳化方面下功夫,更好地實現了協同的效能最佳化。

圖片

飛槳平臺對於大模型具有重要意義,很多文心大模型的能力是與飛槳聯合最佳化才能實現的。這就好像船和槳的關係。

在基礎的計算最佳化方面,飛槳在模型的訓練上實現了塊狀稀疏掩碼注意力計算、存算最優平衡的精細化重計算,在分散式擴充套件中實現了靈活批次虛擬流水並行、多模型結構混合並行。此外,還進行了跟硬體的通訊聯合最佳化。

在推理方面,透過高效能分段矩陣與多流加速計算讓 LoRA 獲得了集約化的部署,以得到更極致的推理效率。同精度下,LoRA 的推理效能可以提升 33.3%。量化後效能可以提升 113.3%,且支援的 LoRA 個數達到 6 倍。

飛槳還實現了異構多芯的混合部署,可以進行動態排程,把不同請求分配到不同效能的晶片上,以最大化資源利用的效率。

一組數字:1465 萬開發者、37 萬家企事業單位、 95 萬個模型,這就是飛槳文心構建的生態一瞥。

圖片

從算力、框架、模型到實踐,這套國內首個大模型全鏈路生態支援體系,在這場全球大模型競賽中不斷髮揮著作用。別人努力的終點,只是百度的起點。

通用人工智慧,曙光已現

2024 年即將過半,「百模大戰」也已進行了一年多,行業發展到哪了?接下來又會往哪卷?

在昨天的大會上,百度技術長、深度學習技術及應用國家工程研究中心主任王海峰從兩個視角解讀 AGI 發展:技術通用性、能力全面性。

圖片

首先是技術的通用性。人工智慧技術經歷幾十年發展,到了大模型時代,一套架構和技術已經可以解決各種問題。除了演算法,模型也變得更加通用和統一。不同任務、語言、場景還是各種模態,都可以用同樣的基礎模型搞定。

以自然語言處理為例,以前有分詞、句法分析、語義匹配、機器翻譯、問答、對話等等很多子方向,現在一個大語言模型就可以解決絕大多數任務;語言方面,大模型既可以解決單語言的問題,也可以跨語言,不僅學習了人類的自然語言,也學習了人工定義的形式語言,架起了從思考到執行的橋樑;同時,大模型也可以實現多模態的統一建模,廣泛賦能各行各業應用等。總體上,人工智慧技術的通用性越來越強。

然後是能力的全面性。理解、生成、邏輯、記憶是人工智慧的四項基礎能力,創作、解題、程式碼、規劃、決策等人工智慧的典型能力,基本上都是這四項基礎能力的綜合運用。這四項能力越強,越接近通用人工智慧。

不過,想要用這通用的技術,去實現全面的能力,並不是所有人都能玩得轉的。

由於大模型對於人才、算力、資料的高要求,在高烈度的競爭下,技術競賽的格局正在變得逐漸清晰。從創業公司到各家大廠,領跑梯隊已經領先出一個身位。

更進一步,真正構建出完善 AI 技術體系的玩家需要直面應用場景,打造出能夠推動生產力的實際應用。而相比發展技術,技術落地所面臨的挑戰或許更多更大。

兩週前,微軟 Copilot GPTs 即將停服的訊息引發了業內關注:僅僅開放 3 個月,這一擁有眾多使用者的技術應用就因為「公司戰略調整」而宣佈退休。究其原因,針對場景不明確,缺乏商業回報都是可能的因素。

最近又有媒體報導稱,OpenAI 透過出售 GPT-4 等大模型能力獲得的收入,已經超過了它背靠的微軟在同類業務中的收入。

不論大模型技術如何先進,每 token 的成本如何降低,即使出自頂尖的科技巨頭,無法擁抱場景生態的 AI 應用仍將被快速淘汰。即使是微軟這樣的公司,也面臨著挑戰。

而擁抱場景,或許正是國內科技公司所擅長的事。

看到如今文心一言的發展和落地,我們已經可以說,2019 年第一屆 Wave Summit 上喊出的「AI 進入工業化大生產階段」,已經一步步走向了現實。隨著大模型進入產業爆發期,通用人工智慧正在加速到來。

相關文章