在過去的幾年,深度學習領域掀起了一場轟轟烈烈的「練大模型」運動,千億、萬億引數模型層出不窮。但與之形成反差的是,這些大模型的落地過程卻非常緩慢。前段時間從谷歌離職創業的兩位 Transformer 作者也感嘆,雖然他們訓練的模型越來越大,但這些模型卻很難用來做實際的事情。
這個問題在國內同樣引發了關注。在前段時間的百度認知 AI 創意賽決賽期間,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜就提到,引數並不是衡量大模型優劣的唯一標準,模型質量、算力大小等軟硬體協同能力以及大模型的工程落地能力,也是重要的評價維度。所以,在去年釋出了 2600 億引數的鵬城 - 百度 · 文心之後,百度並沒有著急繼續推高引數,而是著眼於更加實際的問題:前沿的大模型技術如何與真實場景的方方面面要求相匹配。
在今天開幕的 WAVE SUMMIT 2022 深度學習開發者峰會上,百度分享了他們關於這個問題的思考並提出了大模型產業落地的三個關鍵路徑。
具體來說,他們從三個方面開展工作:第一是建設更適配應用場景的模型體系,包含學習了足夠多資料與知識的基礎大模型、面向常見 AI 任務專門學習的任務大模型、以及引入行業特色資料和知識的行業大模型;第二是要有更有效的工具和方法來讓大模型發揮作用,充分考慮落地應用的全流程問題;第三是要有開放的生態,以生態促創新。這些內容都包含在最新的文心全景圖中。
作為支撐文心大模型走向規模化生產和產業級應用的重要平臺,飛槳也在同一天迎來了重要升級。最新版的飛槳全景圖包含技術、場景、生態三大領域的六大全新發布,旨在夯實工業大生產強大底座,加速 AI 規模化落地。
這次 WAVE SUMMIT 的所有釋出,都折射出百度對人工智慧新發展趨勢的思考。百度技術長、深度學習技術及應用國家工程研究中心主任王海峰在演講中表示,人工智慧越來越普惠,賦能千行百業,惠及千家萬戶。2019 年,在第一屆 Wave Summit 深度學習開發者峰會上,王海峰提出,深度學習具有很強的通用性,並具備標準化、自動化和模組化的工業大生產特徵,推動人工智慧進入工業大生產階段。三年來,深度學習技術、平臺和產業應用的發展正是這一觀點的最好驗證。王海峰指出,在 AI 工業大生產階段,深度學習技術的通用性越來越強,深度學習平臺的標準化、自動化和模組化特徵越來越顯著,深度學習應用越來越廣泛且深入,已經遍地開花。
AI 大模型是深度學習技術的新突破,進一步增強了 AI 技術的通用性,也讓廣大深度學習開發者可以更低成本、低門檻,助力普惠 AI。吳甜表示,今年是大模型產業落地的關鍵年。
以下是百度為這個「關鍵年」所貢獻的解法。
3+1+1:百度文心貢獻大模型落地新解法
AI 大模型作為深度學習技術的新突破,是普惠 AI 的重要助推力。此次飛槳大模型的架構升級可以概括為「3+1+1」,即三類大模型 + 一套工具平臺 + 一個生態系統,併發布了10 個新的大模型,其關鍵詞是「產業級」和「知識增強」。
三類大模型
此次新增的 10 個大模型可以分成三個不同的層次,包括基礎通用大模型、任務大模型、行業大模型三大類。
為什麼要把模型分成這些層次?吳甜解釋說,基礎大模型和應用場景之間其實存在鴻溝,因為它只是掌握了通識知識,缺乏對特定任務和行業知識、行業 know-how 的深入瞭解,因此在應用到特定場景、特定行業時可能無法達到效能最優。
為了彌合這一鴻溝,文心大模型此次最重要的升級是業界首次釋出行業大模型,旨在為行業頭部企業搭建 AI 基礎設施,共同推進大模型在行業的深度應用。
行業大模型的打造過程如下:先基於通用的文心大模型挖掘相關行業的知識,再結合實際行業特色的資料和知識進行大規模無監督的聯合訓練。為了更好地學習行業中的特色知識,文心技術團隊設計了行業領域的特別演算法,使得最終訓出的行業大模型能真正解決真實場景的問題。行業大模型會在行業場景當中有更加優秀的表現,適配性會更強。
此次釋出的兩個行業大模型包括知識增強的能源行業NLP大模型國網-百度·文心和知識增強的金融行業NLP大模型浦發-百度·文心。
- 國網 - 百度 · 文心由百度和國家電網聯合研發。在能源電力行業,百度與國家電網合作,共同探索了行業大模型機制。基於通用文心大模型,百度與國網的專家們一起,引入電力業務積累的樣本資料和特有知識,並且在訓練中,結合雙方在預訓練演算法和電力領域業務與演算法的經驗,設計電力領域實體判別、電力領域文件判別等演算法作為預訓練任務,讓文心模型深入學習到了電力專業知識,在國網場景任務應用效果提升。
- 浦發 - 百度 · 文心由百度和浦發銀行聯合研發。相似的思路,百度與浦發銀行也聯合研製了金融行業大模型。文心大模型結合浦發場景積累的行業資料與知識,雙方技術和業務專家一起設計了針對性的財報領域判別、金融客服問答匹配等預訓練任務,讓文心大模型學習到金融行業的知識,在浦發典型任務應用效果顯著提升。
除此之外,文心此次還發布了文心基礎大模型和任務大模型共八個,包括:融合任務相關知識的千億大模型ERNIE 3.0 Zeus、多工視覺表徵學習VIMER-UFO 2.0、商品圖文搜尋表徵學習VIMER-UMS、文件影像表徵學習VIMER-StrucTexT 2.0、語音-語言跨模態大模型ERNIE-SAT、地理-語言跨模態大模型ERNIE-GeoL,以及面向生物計算領域的化合物表徵學習HELIX-GEM和蛋白質結構分析HELIX-Fold。
以基礎NLP大模型為例,ERNIE家族增添新成員,融合任務相關知識的千億大模型ERNIE3.0 Zeus全新發布,在學習海量資料和知識的基礎上,進一步學習百餘種不同形式的任務知識,增強了模型的效果;透過融合層次化提示的預訓練,更好地建模不同任務的共性與特性;再透過將不同的任務組織成統一的自然語言形式,統一建模增強模型的泛化能力。相對其他模型,ERNIE 3.0 Zeus在各類NLP任務上表現出了更強的零樣本和小樣本學習能力。
這三類模型組合在一起,文心大模型就具備了能夠結合場景落地的全面模型能力。
一套工具平臺
在提及上述三類模型時,吳甜把它們比作齊頭並進、奔向產業應用的三駕馬車。但好馬還要配好鞍,要想讓不同演算法能力的開發者都能方便、快速地使用文心大模型,全面釋放大模型的使用效能,配套一些開發套件、平臺並開放一些 API 是非常必要的。
此次新發布的文心大模型套件包括四方面的能力:
- 為了降低開發者標註成本,提升資料的處理效率,該套件整合了資料增強、資料清洗等豐富的資料標註與處理工具。
- 基於大模型精調是大模型應用在各類 AI 任務中的主要方式,為解決開發者不同場景的應用需求,該套件提供了對抗學習、提示學習等靈活、高效的精調工具。
- 大模型部署成本高是企業應用的重要難題,為降低開發者應用大模型成本,套件提供了模型蒸餾、模型裁剪等多種大模型輕量化方案。
- 為了降低使用者程式碼開發量,套件也提供了 NLP 和 CV 領域共 60 多個預置基礎任務,大多數場景可開箱即用。
在平臺層面,使用者可以透過飛槳的EasyDL和BML開發平臺直接呼叫文心大模型的能力,因為這一能力已經內建在兩個開發平臺中。在這兩個平臺上,超過 1 萬名使用者使用了文心預訓練大模型進行開發,累計建立了 3 萬多個任務。平臺資料顯示,在使用了大模型技術之後,資料標註量平均降低了 70%,模型效果平均提升了 10.7%。
在 API 層面,文心大模型此次開放了 4 個大模型的 API 服務供使用者直接呼叫,包括:
- ERNIE3.0 Zeus 的文字生成能力;
- ERNIE3.0 Zeus Prompt,預置 16+Prompt 技能,也支援開發者自定義 prompt 技能;
- PLATO 對話大模型 API,可以在智慧對話定製與服務平臺 UNIT 接入體驗;
- ERNIE-ViLG 跨模態文生圖 API。
這些 API 可以讓開發者低門檻享受大模型帶來的收益。
一個生態系統
在掃除了種種障礙之後,百度的文心大模型已經在保險、銀行、農業、工業、生物醫藥、搜尋引擎等多個領域得到了應用。但我們也知道,在世界範圍內,大模型的應用其實都還處在探索階段,還有很大的創意和探索空間。
為了促進文心大模型惠及最廣泛的行業與人群,把最新大模型 API 試用提供給更多人,文心大模型宣佈將共享飛槳生態,同時新發布了基於文心大模型的創意社群——暘谷大模型創意與探索社群。「暘谷」在傳說中是「日出的地方」,百度希望藉助這個社群進一步把智慧化能力帶到千行百業,帶到所有人面前。
六大全新發布,飛槳要做最懂中國 AI 場景的深度學習平臺
我們經常開玩笑說,大模型都是用「鈔能力」堆出來的。但我們也知道,要想訓練出千億引數大模型,光有鈔能力是不夠的,還需要一個成熟的開發、訓練、推理平臺做支撐。對於文心來說,這個支撐就是飛槳。它是產生和應用大模型的關鍵。
在這次的 Wave Summit 大會上,飛槳迎來了六項重要釋出,技術、場景、生態三大領域都有了進一步深化。
在技術領域,飛槳框架推出了最新的 2.3 版本,開發、訓練、推理部署全面升級,提升了深度定製開發和自動化能力。
為了滿足真實產業場景的很多剛性需求,進一步推動 AI 規模化落地,飛槳釋出了訓推一體導航圖、產業模型選型工具、PaddleScience 賽槳、飛槳移動工作站和深度學習實踐教輔書。
此外,為了共建中國最強大的 AI 開發者生態,飛槳的「大航海」2.0 共創計劃新增了產業實踐範例庫、AI for Science、硬體生態三個領域共創計劃。
飛槳框架 v2.3:定製化、自動化、上雲需求統統滿足
深度學習框架在程式設計介面上一般有兩種程式設計模式:指令式程式設計和宣告式程式設計,即動態圖和靜態圖。二者在開發靈活性和訓練部署效率方面各有千秋。為了兼顧二者的優勢,飛槳在 2019 年的 Wave Summit 上就確定了動靜統一的框架設計理念,目前已經臻於成熟。所以此次的釋出旨在進一步提供框架內部的深度定製開發能力,並透過自動化等方式全面提升框架使用體驗。
具體來說,飛槳框架 v2.3 涉及四個方向的核心升級。
一是靈活的深度定製開發。一個深度學習框架有大量的開發介面可以直接呼叫,但如果想要實現一些比較定製化的功能,你需要對框架底層的很多功能進行改造。為了滿足高階開發者的這種深度定製開發需求,飛槳框架 v2.3 推出了高複用性運算元庫,極大地降低了開發成本,典型運算元核心(如 einsum)程式碼量可以降低至業內領先水平。
此外,飛槳框架的通用異構引數伺服器架構也實現了升級,這項技術解除了傳統引數伺服器模式必須嚴格使用同一種硬體型號 Trainer 節點的枷鎖。升級後的通用異構引數伺服器適配新硬體程式碼量從萬行減少至千行,僅需新增圖取樣策略即可實現 GPU 三級儲存圖檢索引擎。
二是自動調優的高效能訓練。對於開發者來說,把一個深度學習框架效能調到最優是非常具有挑戰性的,需要大量背景知識。針對這一困難,飛槳框架 v2.3 推出了業內首個全流程效能自動調優方案,充分發揮軟硬一體融合優勢,關鍵環節感知硬體特性自動調優。有了這個方案,開發者無需瞭解硬體特性,即可獲得與專家級手工最佳化水平相當的效能。
三是自動化壓縮與高效能推理部署。模型壓縮牽扯到整個訓練推理的全部流程以及硬體特性,想要做好是非常具有挑戰性的。為此,飛槳框架 v2.3 推出了業內首個自動化壓縮功能,透過蒸餾微調解除對模型訓練程式碼的依賴,感知硬體延時,自動選擇最優壓縮方案,壓縮精度與手工方法相當,程式碼量減少 50% 以上。此外,它的高效能推理引擎還能實現端到端深度最佳化,端、邊、雲多平臺推理效能全面提升。
四是雲上飛槳。當前,深度學習的規模正變得越來越大,很多的訓練、推理任務需要多個算力中心協同,還要兼顧算力中心的資料隱私需求。為此,飛槳框架 v2.3 推出了業內首個異構多雲自適應分散式訓練架構,支援多個算力中心聯合訓練。此外,它還推出了飛槳專屬雲上部署編排工具,僅需兩行配置,即可定製雲上開發部署環境,使用者基於多套件多模型配置模板,可快速完成多模型自由組合,實現 AI 應用高效落地。
訓推一體導航圖:為開發、訓練、部署全流程趟出過千條完整路徑
在 AI 實際應用的過程中,模型的部署一直是一個讓人頭疼的問題。在某些深度學習平臺上,如果你想把訓練出的模型部署到不同的晶片、不同的硬體裝置上(比如伺服器、手機),你就需要針對每種情況進行額外開發,這種訓練和推理解耦的情況對於開發者來說是非常痛苦的。
飛槳的訓推一體旨在解決這個問題,它能讓模型在訓練完成後立即在不同的晶片、不同的硬體裝置上進行部署,在各個場景中做推理。在去年釋出的「推理部署導航圖」中,飛槳展示了 300 多條部署通路,深刻詮釋了飛槳在打通 AI 應用最後一公里所做出的不懈努力。
飛槳去年釋出的推理部署導航圖
在今年的 Wave Summit 上,這個導航圖升級為訓推一體導航圖,打通了模型的開發、訓練、推理部署整個流程,為 AI 產業應用的落地提供了全流程智慧導航。
飛槳今年釋出的訓推一體導航圖
產業模型選型工具:專治「選擇困難症」
在 2018 年剛推出的時候,飛槳上只有十幾個模型,如今幾年過去,這一數字變成了幾百個。在本次 Wave Summit 上,百度 AI 技術生態總經理馬豔軍宣佈,飛槳產業級開源模型新增 100 多個,總數達到 500+;結合產業實際場景、精心打造的精度與效能平衡 PP 系列特色模型由 13 個新增至 23 個;產業實踐範例由原來的 22 個增加到 47 個。這無疑給了使用者更多選擇,但也帶來了困惑:模型、範例那麼多,哪個適合我?「產業模型選型工具」就是用來解決這個問題的。
這個工具根據使用者輸入的「場景任務」、「需求指標」、「標註檔案」等展開需求分析,然後給出自己的推薦結果,告訴你選擇哪個模型、硬體和產業實踐範例更好。產業實踐範例是飛槳團隊與各個行業的企業共同建設的,裡面包含任務實現的整個流程,可以降低 AI 應用落地門檻。
PaddleScience 賽槳:比量槳、螺旋槳更通用的科學計算工具集
近年來,AI for Science 正受到越來越多的關注。AlphaFold 等模型的成功讓人們看到,AI 正在為科學研究提供一種新的正規化。
2020 年,飛槳團隊釋出了量子機器學習開發工具集量槳(Paddle Quantum)和生物計算平臺螺旋槳(PaddleHelix)。在此基礎上,飛槳今年又釋出了一個更加基礎、通用的工具集——賽槳(PaddleScience)v1.0 Beta,具備支援多領域多場景算例、豐富的演算法和開發介面、端到端核心框架功能支援、廣泛適配異構硬體四大優勢,支援的科學領域要更加廣泛。
這幾個工具和與之配套的算力、框架、算例、場景一起,組成了最新的飛槳 AI for Science 全景圖。
飛槳移動工作站:把 EasyDL 拎進車間
針對那些資料保密度極高的行業,飛槳推出了一款行動式可移動的 AI 工作站,解決資料「不能出工廠」甚至「不能出車間」的問題。
飛槳企業版重磅釋出的飛槳移動工作站,是以行動式可移動工業加固計算機為硬體底座,整合螢幕/鍵盤等輸入輸出裝置,專為人工智慧任務設計,最多可支援2張350W功耗的AI加速卡。具備寬溫、穩定性強、抗干擾能力強等特點。特別適合工業級環境使用。
飛槳移動工作站搭配EasyDL桌面版和智慧邊緣控制檯,實現了訓推一體和邊端協同的全流程AI開發和應用。適應諸多移動作業場景,如教育教學、公安/交通移動執法、臨時指揮布控、防疫檢測作業、產線臨時取樣檢測等。一體化解決模型開發、部署、迭代問題。
深度學習實踐教輔書,培養更懂應用的AI人才為幫助開發者更好地理解深度學習框架執行機理、掌握深度學習實踐知識,飛槳在本次峰會上聯合浙江大學上海高等研究院常務副院長、浙江大學人工智慧研究所所長吳飛教授,以及復旦大學計算機學院邱錫鵬教授分別釋出了深度學習實踐教輔書《人工智慧導論:案例與實踐》和《神經網路與深度學習:案例與實踐》。藉此,飛槳希望將產業實踐與理論教學深度結合的教輔書能夠進一步完善人工智慧領域教學資源,向產業輸送更懂應用的AI人才。
三大共創計劃,共建飛槳生態
在生態領域,飛槳已經有了非常成功的實踐,尤其是在硬體領域。截至目前,飛槳已經適配了 30 多款國內外最主流的晶片,不少晶片廠商也推出了針對自家晶片最佳化的飛槳版本,比如英偉達。這是過去兩年開展的共聚、共研計劃結出的果實。
在此基礎上,飛槳更進一步,提出了「共創計劃」,而且這次不僅涉及硬體,還新增了產業實踐範例庫和 AI for Science 兩個領域。這兩個領域知識跨度都非常大,開源共建、產學研結合將是非常理想的發展方式。
穩居中國深度學習平臺市場綜合份額第一,飛槳是怎麼做到的?
過去的幾年,飛槳一直在高速發展。截至 2022 年 5 月,飛槳平臺開發者規模達到 477 萬,平臺上的企業和開發者共同創造了 56 萬個 AI 模型,服務企事業單位 18 萬,廣泛應用於工業、農業、金融、醫療、能源、物流等各行業。IDC 的報告顯示,飛槳在中國深度學習市場中的綜合份額已超越其他國際巨頭,成為中國第一,穩居中國深度學習平臺市場綜合份額第一。
這個「第一」的取得包含很多因素。第一個因素是前面提到的動靜統一、訓推一體、大規模分散式訓練、各種自動化技術等核心產業級技術能力。
從事智慧程式設計機器人產品研發的某一線演算法工程師告訴機器之心,從大規模分散式訓練的角度,他感覺飛槳的分散式訓練 API FleetX 用起來非常方便,基本上只需要配置到底使用什麼樣的分散式策略,就能將單機模型改為可以進行大規模分散式訓練的模型。而且本來 PaddleNLP 模型庫就有很多大規模分散式訓練的例子,改起來非常方便。此外,在分散式訓練的過程中,框架的執行也很穩定,沒有出現過 NaN 問題,學習率、梯度、損失都非常正常,分散式訓練的中斷、載入權重以繼續訓練都沒有問題。值得注意的是,飛槳的儲存與載入用起來也很方便,不需要手動做多餘操作。
第二個因素是飛槳一直跟開發者走得非常近,比如建立了專門的學習社群、答疑群,開源了很多神器(如 PP 系列模型)、產業實踐範例庫幫助企業開發者節省時間,將國內開發者的痛點需求提到了很高的開發優先順序等。
第三個因素是生態。透過多年的生態建設以及上面提到的「共聚」、「共研」、「共創」計劃,飛槳已經和硬體企業、開發者等相關群體建立了一種共生的關係。
上述演算法工程師提到,他認為 PaddleNLP 在推理方面做得比較好的一點是能對接 NVIDIA 之前開發的 FasterTransformer,其用 CUDA 底層重新寫了一遍 Transformer 模型,並向上提供一些高效的 API,這樣一般類似 Transformer 的模型就能編譯為可高效執行的運算元,並透過 C++ 高效地呼叫、嵌入到應用中。所以總體來看,他覺得,「從分散式資料迭代器、分散式訓練到推理,飛槳把整個模型的訓練與應用都打通了,演算法工程師也不需要多少額外的開發工作就能完整地跑通,所以還是很好用的。」
結語
縱觀歷史,每一次科技革命都是由一項通用性技術的突破來驅動的,第一次是機械技術,第二次是電氣技術,第三次是資訊科技。這些技術往往從少量場景開始,然後逐漸走向標準化、自動化和模組化,並最終實現人類社會生產力的提升,我們管這種現象叫做工業大生產。
在我們所身處的第四次科技革命中,深度學習技術在人工智慧的各個方向上已經表現出良好的通用性。而預訓練大模型的興起,使得人工智慧的通用性進一步增強。吳甜表示,目前飛槳已構建了業內佈局最全、最適宜產業應用的模型庫體系。大模型作為人工智慧應用的「基礎設施」,不僅拓寬了場景覆蓋的廣度,更加深了產業應用的深度。文心大模型將持續降低應用門檻,推動產業智慧化升級,讓人工智慧技術惠及每一個人。
與此同時,深度學習平臺的工業大生產特徵也越來越顯著。王海峰表示,「基於飛槳平臺,人人都可以成為 AI 應用的開發者。」