深度學習框架與 AI 硬體廠商,相輔相成、共同發展。百度飛槳與 NVIDIA 等 40 多家硬體夥伴正在踐行這一理念。
備受關注的 NVIDIA GTC 2023 大會已經結束,NVIDIA CEO 黃仁勳依然給所有人帶來了震撼,搬出了為 ChatGPT 準備的晶片,向世人展示了 GPU 持續在算力上賦能大模型乃至整個深度學習領域的巨大潛力。大會期間,黃仁勳還與 OpenAI 聯合創始人、首席科學家 Ilya Sutskever 進行了一場深度對話,他們一致認為深度學習的強大能力已經改變了世界,真正推動了技術的進步。的確,近年來,深度學習技術正在推動整個 AI 行業進入到一個全新的階段。AI 領域的技術創新和產業發展離不開深度學習框架和平臺,它聯動了 AI 產業鏈上下游眾多企業和使用者,透過持續降低應用門檻將 AI 技術傳遞給千行百業,推動 AI 應用大規模落地。作為國內 AI 領頭雁的百度,其飛槳產業級深度學習開源開放平臺集核心框架、產業級模型庫、開發套件與工具元件於一體,其中百度生成式 AI 產品文心一言正是孕育自產業級知識增強大模型文心。截止 2022 年 11 月,飛槳已經凝聚了 535 萬開發者,服務了 20 萬家企事業單位,建立了 67 萬個 AI 模型。百度依託飛槳平臺,圍繞著技術、生態和產業構建了全方位、多層次的深度學習發展格局。生態建設則是聯動各方實現技術融合和落地的關鍵步驟,而作為生態建設重要的一環,硬體生態正是聯合硬體廠商搞好 AI 晶片的適配與最佳化,最終達成合作共贏。作為全球 GPU 巨頭的 NVIDIA,成為了百度飛槳天然的合作伙伴。NVIDIA 自身也非常重視中國市場尤其中國的生態夥伴,飛槳成為其在世界上支援的三大深度學習框架之一,更有專門的工程團隊來賦能飛槳生態。過去數年,飛槳與 NVIDIA 在硬體生態建設上一直保持著全面深度的合作,做了大量的開發與最佳化工作,並透過技術共研開拓了眾多軟硬體協同產品與功能。尤其在 2022 年,雙方的合作邁入了新的階段。我們知道,隨著深度學習的快速發展尤其是大規模機器學習模型的湧現,AI 算力需求的增長達到了新的高度。這無疑給硬體廠商帶來巨大挑戰,要求他們生產出非常強大的 AI 晶片。同時,AI 晶片與深度學習框架的融合最佳化,才能帶來前所未有的加速,將效能發揮到極致。不過,就拿 PyTorch 等常用開源深度學習框架來說,開發團隊不接受硬體廠商的程式碼進入主幹。這就導致硬體廠商支援新版本框架的成本高昂,只能有選擇地支援重點版本。這樣一來,硬體廠商的 AI 晶片與深度學習框架之間存在適配問題,AI 基礎軟硬體產業鏈上下游也就無法實現高效的協同發展。飛槳則不然,從 2020 年開始致力於 AI 晶片的適配,與國內外硬體廠商展開深度合作,共同開發更加便捷的核心框架,構建統一的硬體接入方案。透過與廣大硬體廠商構建合作生態,真正發揮出 AI 晶片的算力。以 NVIDIA 為例,它早在 2020 年 5 月就加入了「飛槳硬體生態圈」計劃,後續更與飛槳展開了一系列深度合作。具體到硬體適配上,飛槳與 NVIDIA 主要在四個方面進行合作。在資料處理上幫助飛槳整合 DALI,在大規模訓練上支援各類資料格式以及 ASP、CUDA 等運算元函式 API,在最佳化推理上開發 Paddle-TRT、Deep Learning Examples,在規模部署上整合了 NCCL、開發了 Triton PaddlePaddle Backend。多樣化適配使得飛槳開發者的高效能推理訓練成為可能,也為其與飛槳的進一步合作打下了基礎。2022 年,飛槳開啟與硬體生態夥伴全面共創的一年。在 5 月 20 日的 Wave Summit 2022 深度學習開發者峰會上,飛槳攜手 NVIDIA 在內等十餘家國內外硬體廠商釋出了「飛槳硬體生態共創計劃」,透過共享共創打造繁榮的 AI 生態。在此次峰會上,飛槳釋出了其與 NVIDIA 的共研共創合作方案。具體地,針對硬體適配依然存在的高門檻以及使用者的多層次需求,雙方在已有合作的基礎上開發了三大主要產品,包括了 NVIDIA NGC PaddlePaddle Container —— NGC 飛槳容器、NVIDIA Deep Learning Examples—— 飛槳深度學習模型示例、以及 NVIDIA DLI (Deep Learning Institute)—— 飛槳共建課程。對於使用 NVIDIA GPU 平臺的飛槳使用者,這些舉措可以使他們獲得絕佳使用者體驗與極致效能。首先針對開發者使用者的一些痛點需求,比如使用 NVIDIA 最新軟體棧開發、訓練、部署時需要大量手動配置工作,工程挑戰巨大。因此飛槳聯合 NVIDIA 開發了 NGC 飛槳容器,針對 NVIDIA GPU 加速進行最佳化,最大程度釋放飛槳框架在 NVIDIA 最新硬體上的算力。NGC 飛槳容器還包含了用於加速 ETL (DALI、RAPIDS)、訓練(cuDNN、NCCL)以及推理(TensorRT)工作負載的軟體,實現了飛槳與 NVIDIA 軟體棧的無縫整合與效能最佳化。有了 NGC 飛槳容器,使用者在快速開啟 AI 應用的同時,還能在 AI 訓練和推理任務上享受飛槳 +NVIDIA 帶來的飛速體驗。此外透過 NVIDIA NGC 完善的開發體系、質量管理、測試流程、文件規範、安全掃描等,雙方開發了基於 NVIDIA GPU 平臺最好的飛槳開發環境。作為 NVIDIA 最佳化的工業級模型庫,NVIDIA Deep Learning Examples 涵蓋了機器人、數字孿生、金融等不同行業的模型,目標是讓使用 NVIDIA GPU 平臺的開發者復現 NLP 和 CV 等領域擁有極致效能的經典模型。2022 年 10 月,NVIDIA Deep Learning Examples 倉庫上線了基於飛槳實現的 ResNet50 模型,相關示例全面適配各類 NVIDIA GPU 以及單機單卡、單機多卡等各種硬體拓撲,實現了效能極致最佳化。值得一提的是,飛槳 ResNet50 模型的訓練速度超過了 PyTorch 版 ResNet50。之後還支援了 BERT 模型,後續將陸續支援 PP-YOLOE 等模型。為了更好地提高推訓效能並簡化程式碼,NVIDIA 深度學習培訓中心(DLI)不僅準備了系列免費課程,還聯名飛槳推出 DLI 課程證書,為開發者的能力和職業發展提供了權威證明。例如飛槳與 NVIDIA 聯合打造了《使用 PaddlePaddle 與 TensorRT 完成深度學習最佳化與部署》課程,讓開發者感受基於 PaddlePaddle 與 TensorRT 的最佳化部署最佳體驗。2022 年 11 月 30 日,在 WAVE SUMMIT+2022 深度學習開發者峰會上,飛槳又攜手 NVIDIA 等 12 家硬體夥伴釋出了飛槳生態發行版。對於使用者而言,當在 NVIDIA GPU 平臺上跑飛槳時,會提供專門的軟體版本,使開發者享受更好的軟硬一體化體驗。至此飛槳與 NVIDIA 的硬體生態合作又進了一步。在飛槳著力打造繁榮共贏生態、促進軟硬體協同發展的過程中,NVIDIA 是重要的參與者和見證者,併成為飛槳合作生態中最為深入和標杆性的案例。隨著雙方合作內容的不斷豐富,滿足了 AI 開發者的多層次需求。同時,飛槳與 NVIDIA 的深度合作也為國內其他硬體廠商提供了一種可參照的合作模式。從飛槳與 NVIDIA 的合作中可以看到,硬體生態建設這一環做得好不好,會深刻地影響到深度學習框架自身的通用性、硬體廠商 AI 晶片的效率以及在 AI 領域的廣泛應用。正是這種雙方的痛點需求為飛槳與硬體廠商的生態合作做好了鋪墊。作為國內市場綜合份額第一的深度學習平臺,飛槳一直以來非常注重與國內外硬體廠商的合作,透過與他們的緊密聯絡持續擴充硬體生態。截至目前,與飛槳深度融合最佳化的國內外硬體廠商數量已經超過了 40 家。對於飛槳來說,其與硬體生態夥伴的合作是在摸索中前進,不斷地創新合作模式,經歷了 2020 年的「共聚」、2021 年的「共研」、2022 年的「共創」三個階段。每個階段的側重點不同,合作伙伴數量逐年增多,合作內容也更加廣泛和深入。首先回到 2020 年,飛槳率先對接了國內外領先的 CPU、GPU、ASIC、伺服器等硬體廠商,並於 5 月聯合 Intel、NVIDIA、寒武紀、浪潮等 13 家國內外頂級硬體廠商釋出了「飛槳硬體生態圈」計劃,為後來的廣泛硬體生態合作打好了基礎。當時,飛槳除了持續增強硬體廠商對飛槳平臺投入的信心,還透過金融、能源等行業的終端使用者來驅動硬體廠商與飛槳適配,建立起與他們的規範流程、專門團隊等。這些舉措釋放出了飛槳攜手硬體廠商共建硬體生態的決心,並啟動了與重點廠商的硬體適配和技術最佳化工作。在接下來的 2021 年,飛槳開始與硬體夥伴的軟硬一體聯合最佳化,進入到了「共研」階段。不過,在執行硬體適配與技術最佳化過程中,雙方也遇到了挑戰。一是硬體廠商軟體棧接入方式多樣(運算元庫、圖接入、編譯器等),適配技術方案複雜。國內廠商的 AI 軟體棧建設起步晚,給實際適配帶來新的挑戰;二是如何使得硬體廠商以較低的成本接入飛槳。針對這些挑戰,飛槳結合對硬體廠商軟體棧的理解設計了飛槳硬體對接方案,包括自定義運算元庫接入、自定義通訊庫等多項基礎軟體改造,極大降低了硬體廠商適配成本。在該階段,飛槳支援的國產硬體數量實現了第一。進入到 2022 年,飛槳在 2021 年技術適配成果的基礎上進一步擴充與硬體夥伴的合作。飛槳希望更多的硬體開發者使用飛槳進行 AI 應用創新,硬體廠商也希望引入定製版的飛槳框架、模型庫來豐富自身 AI 軟體棧,因此雙方的合作進入到全面的「共創」階段。首先是上文提到的「飛槳硬體生態共創計劃」,旨在與飛槳硬體生態夥伴在聯合研發、資源共享、聯合授權、培訓賦能等四個維度全面合作,更好地服務開發者,加速 AI 產業落地,實現生態繁榮共贏。在聯合研發環節,飛槳與硬體夥伴成立技術研發虛擬聯合團隊,共同打磨基礎軟體棧,推進硬體與飛槳的適配與效能最佳化工作。尤其針對國產 AI 硬體與深度學習框架持續適配與升級成本較高的問題,飛槳推出運算元接入、子圖接入、編譯器接入等多種方案,與廠商共建持續整合基礎設施,接收廠商適配的程式碼。在全球前三大框架中,飛槳是唯一對所有硬體廠商開放合作、接受所有硬體廠商提交程式碼的框架。此外,飛槳還聯合硬體夥伴共同推出飛槳生態發行版(針對特定AI硬體,定製最佳化的飛槳框架和飛槳模型庫),大大提升飛槳模型在各類 AI 硬體上的訓練推理效能,為開發者提供更多更好選擇。在資源共享環節,飛槳與硬體生態共創計劃夥伴共享推廣宣傳資源,包括共同撰寫技術稿件,透過部落格、論壇等社交媒體資源聯動推廣。飛槳還對生態夥伴聯合授權,將與硬體夥伴聯合最佳化好的方案優先推薦給生態夥伴,並基於硬體平臺聯合開發飛槳一體機,提供功能全面、便捷高效、穩定可靠的一站式 AI 服務。在培訓賦能環節,飛槳聯合生態夥伴開發飛槳 + 硬體使用開發教程,與硬體廠商在雙方的學習與實訓社群提供系列課程及聯名認證證書,如上文與 NVIDIA 聯合開發的飛槳共建課程。飛槳還與硬體夥伴在 AI Studio 中開設廠商專區,為國內深度學習開發者提供體驗更多 AI 硬體的機會。目前飛槳 AI Studio 是國內最大的人工智慧學習與實訓社群,註冊使用者超過了 300 萬。從共聚、共研到共創,一路走來,飛槳在硬體生態建設上持續深化與硬體夥伴的合作方式與內容,結合他們的實際需求,透過技術創新持續降低適配飛槳的成本,並利用產品共建、生態運營等途徑保持適配後的商業價值。對於國內硬體廠商而言,已經具備相當規模的飛槳生態是其快速擴充硬體市場的契機,因此應勇於擁抱並創新自身與飛槳的生態合作,實現雙贏。作為整個 AI 產業鏈的重要一環,飛槳一直以來的開放合作態度是其硬體生態持續取得成果的重要前提,接入 AI 晶片時聯合硬體夥伴最佳化 AI 軟體工具鏈設計,充分滿足開發者在應用時對算力、模型和算力等各個層面的需求,降低開發、訓練和部署的負擔,帶來低門檻、簡易的使用體驗。飛槳深度學習框架和硬體廠商這兩個主體的高效協作還增強了整個 AI 行業的活力,產生真正的商業價值,在不斷健全、良性的硬體生態環境中推動 AI 應用規模化落地。未來飛槳將持續開源開放,找準與硬體廠商利益契合點,在更廣泛和深入的軟硬協同探索中更好地服務開發者。© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報導:content@jiqizhixin.com
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024922/viewspace-2941864/,如需轉載,請註明出處,否則將追究法律責任。