百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

機器之心發表於2020-05-20
2020 年,人工智慧商業化落地全面加速。作為國內 AI 領先者的百度,其長期高強度技術投入正在逐漸取得成果。

剛剛,在「WAVE SUMMIT 2020」深度學習開發者峰會上,百度飛槳又一次宣佈了多項全新發布和重要升級。

「從去年秋季深度學習開發者峰會至今的半年時間裡,飛槳有了迅速發展:累積開發者數量已超過 190 萬,服務企業數量達到 84000 家;釋出模型數量已超過 23 萬個,」百度 CTO 王海峰大會開場時表示。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世


這些成績之上,是飛槳對於國內產業智慧化升級做出的貢獻。在新冠疫情期間,百度也進入了抗疫一線,提供了口罩檢測和人臉識別、社群疫情防控系統、疫情問答機器人、基於 CT 影像的肺炎篩查等等 AI 能力。

它們也是飛槳與開發者們共同努力的結果。

在峰會上,王海峰放出了最新的飛槳版圖。飛槳開源深度學習平臺,包含核心框架、基礎模型庫、端到端開發套件與工具元件。隨著企業應用的需求越來越豐富和強烈,飛槳升級了產品架構,推出飛槳企業版,助力各個企業進行 AI 創新。

百度飛槳平臺的最新全景圖:

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世


現在,百度飛槳深度學習平臺由飛槳開源深度學習平臺和飛槳企業版兩大版塊構成,百度集團副總裁吳甜表示,飛槳開源深度學習平臺將持續保持開源,致力於為產業、學術、科研創新提供基礎支撐。

飛槳總架構師於佃海向我們介紹了飛槳框架的設計理念,以及推動飛槳迭代發展的兩個驅動輪:產業實踐的需求和使用者體驗的提升。產業實踐的需求和打磨是最原生的驅動輪,這體現的是飛槳對效能、大規模訓練和部署能力的極大關注。


使用者體驗提升是另一個重要驅動輪,飛槳關注使用者程式設計介面的最佳化和基礎功能建設的完善。這種理念,為飛槳提供了持久廣泛的發展動力。飛槳也因此將高效兼顧靈活易用作為框架設計和發展的重要原則。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世


作為國內最早開源的深度學習框架,飛槳的流行程度一直在提升,而百度也在不斷髮展飛槳,在其中加入人工智慧領域最先進的技術。

7 項全新發布,百度飛槳重磅更新

時隔半年,百度飛槳開源深度學習平臺帶來 7 項開源全流程工具新產品釋出,百度深度學習技術平臺部負責人馬豔軍在峰會中進行了詳細介紹。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世


這 7 項新產品包括端到端影像分類開發套件 PaddleClas、端到端語音合成開發套件 Parakeet、前端推理引擎 Paddle.js、開發訓練部署全流程開發工具 PaddleX 等。此次,飛槳平臺官方模型庫新增了 39 個演算法、3 個任務、3 種端到端開發套件,方便開發者進行低程式碼二次開發。
百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世
端到端影像分類開發套件 PaddleClas

影像分類是計算機視覺中的一類常見應用,從手機的智慧相簿,到工業領域的自動分揀都離不開這項技術。

這一次,百度釋出了全新的端到端影像分類開發套件 PaddleClas,可以提供工業級的分類模式,包括 23 種分類網路及訓練配置、117 個預訓練模型和效能評估,以及 10 萬類影像分類預訓練模型。

在深度演算法最佳化方面,PaddleClas 可以實現 3% 的 SSLD 知識蒸餾效果提升以及 82.4% 的識別準確率(ResNet50_vd)。

此外,它還可以提供工業級的部署工具,包括伺服器高速推理整合、移動端推理部署 、模型服務化部署等。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世


可以看出,不管是在伺服器端還是在移動端,PaddleClas 在分類精度和效能層面均實現了大幅度的提升。

端到端語音合成開發套件 Parakeet

Parakeet 是本次飛槳平臺全新發布的第二款開發套件。值得注意的是,在模型層,Parakeet 使用了一款百度自研聲碼器 WaveFlow。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

馬豔軍介紹,WaveFlow 的特點就是「快、輕、簡」。WaveFlow 可以 40 倍實時的速度合成 22.05 kHz 的高保真音訊,同時引數量更少,僅 5.9M 個引數,比 WaveGlow 小 15 倍,它還可利用最大似然直接訓練,方便二次開發。

前端推理引擎 Paddle.js

說到深度學習,我們腦海中首先浮現的語言大多是 Python,這也是多數深度學習框架支援的語言。但隨著深度學習應用範圍的擴大,使用其他程式語言工作的開發者也需要用到飛槳等深度學習框架,這就對飛槳提出了新的要求。

為此,百度飛槳團隊開源了國內首個 JavaScript 深度學習庫——Paddle.js。它支援低延遲、資料安全的本地計算。在 JavaScript 環境中,使用者可免安裝、跨平臺使用,可應用於商品識別、AR 遊戲以及虛擬穿衣試戴等場景。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

開發、訓練、部署全流程開發工具 PaddleX

PaddleX 是一款開發、訓練、部署全流程開發工具,具有打通全流程、可快速整合、融合產業實踐、支援多端部署等優點。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

PaddleX 可以支撐各類 AI 應⽤的快速開發,大幅提升巡檢效率、開發效率,減少人類資源的浪費。

除以上釋出外,飛槳開源深度學習平臺還在核心框架層、基礎模型庫、端到端開發套件、工具元件四個層面進行了全面的升級更新。

核心框架層

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世


推理部署層面,PaddleSlim、Paddle Inference、Paddle Serving、Paddle Lite 均進行了升級,其中 Paddle Inference 新增了多語言 API 介面,便於開發者進行整合開發。

基礎模型庫

對應自然語言處理、計算機視覺、推薦、語音四大領域,此次飛槳平臺的 4 個基礎模型庫也新增了多項演算法和任務支援型別。

其中 PaddleNLP 最佳化了多種演算法和任務型別,提供更完善的 NLP 方案;PaddleCV 新增 3D 視覺及相關演算法;PaddleRec 新增了支援融合、內容理解 2 大任務,覆蓋主流推薦場景所需功能;PaddleSpeech 新增了 5 種高精度語音合成演算法。

端到端開發套件

ERNIE:持續學習領域知識,領域理解能力全面提升

在開發套件方面,作為基於飛槳開源的持續學習的語義理解框架,ERNIE 此次進行了多處升級。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世


在領域模型方面,飛槳預釋出了 ERNIE Law 法律模型和 ERNIE Health 醫療模型兩款模型;在任務模型層面,釋出了 ERNIE Gen 生成模型。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

相比於 ERNIE 2.0 中文,ERNIE Gen 中文在知識庫問題生成、閱讀理解問題生成、文件摘要生成、新聞標題生成的 4 箇中文權威任務集合上,效果平均提升 2.47%。此外,在較小訓練資料規模(16G)下,ERNIE Gen 英文在摘要生成、問題生成、對話生成、生成式問答等英文權威任務集合中實現 SOTA 水平。

目標檢測開發套件 PaddleDetection 全新升級

目標檢測是機器視覺領域的核心問題之一。去年,百度開源了 PaddleDetection 目標檢測統一框架,使用者可以方便、快速地搭建出各種檢測框架,構建強大的應用。今天,PaddleDetection 迎來了全新升級:

  • 在演算法豐富度層面,PaddleDetection 新增了 101 個預訓練模型和 10 餘套演算法,含 YOLOv3、SSD、RCNN 等,此外還結合了移動端場景深度最佳化;

  • 在模型精度層面,升級後,基於 COCO 資料集的高精度預訓練模型精度 mAP 可達到 53.3%,實時預訓練模型精度 mAP 可達到 43.6%;

  • 在模型速度層面,PaddleDetection 速度超越同類產品 2.6 倍(YOLOv3 訓練),可實現 3.5 倍移動端模型加速(YOLOv3 預測)、2 倍人臉檢測預測加速。

  • 在產業實踐層面,PaddleDetection 在智慧交通領域的 mAP 要比同類產品高出 4%,在工業質檢方面高出 3%。


一直以來,PaddleDetection 在產業實踐方面有著廣泛的應用。在使用 PaddleDetection 替代人工進行森林巡檢後,效率提高了 200%;疫情期間,PaddleSeg 應用於肺炎 CT 影像分析 AI 模型,病灶識別的精準度可達到 92%,召回率達 97%,研發工期縮短 30%。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

工具元件

工具元件層面也是本次飛槳平臺升級內容數量最多的部分。

預訓練模型應用工具 PaddleHub 新增了超大規模影像分類、目標檢測模型,支援飛槳 Master 模式升級;全面整合 Paddle Inference 原生推理庫,預測效能提升 50% 以上;同時開放了 PaddleHub 預訓練模組製作流程,支援開發者貢獻模組至 PaddleHub 平臺;新增 NLP 文字稽核模型,支援高效能文字向量表示服務。

深度學習視覺化平臺 VisualDL 釋出了 2.0 版本,API 全面升級,效能大幅提升,並對介面及功能進行了整體最佳化;

自動化深度學習工具 AutoDL 新增了 AutoDL Transfer DELTA 演算法,透過精準知識蒸餾演算法,有效提升深度遷移學習的效果

AIStudio 學習與實訓平臺升級了 Notebook 環境,新增了覆蓋人工智慧各領域的 140 多個精品專案以及多個優質公開課,保障開發者快速掌握人工智慧核心開發技術。

此外,飛槳還在強化學習、聯邦學習、圖神經網路等方面進行了升級。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

量子機器學習開發工具量槳

近年來,國內外各大科技公司都在量子計算領域發力。在《Analytics Insight》雜誌公佈的 2020 全球十大量子計算公司名單中,國內只有兩家公司入選,其中一家便是百度

早在 2018 年 3 月,百度就成立了量子計算研究所,開展量子計算軟體和資訊科技應用業務研究,並邀請了悉尼科技大學量子軟體和資訊中心創辦主任段潤堯教授出任所長。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

百度量子計算的 QAAA 規劃:聚焦於量子演算法、量子人工智慧以及量子架構。其中量子演算法是發揮量子計算優勢的理論基礎,量子人工智慧則代表了量子計算實際落地最重要的一些軟體技術工具,而量子架構則實現量子軟硬體互連,最終這三者將融合在百度量子計算平臺提供給合作伙伴和使用者。

在本次峰會上,段潤堯也帶來了他們的最新研究成果——量槳(Paddle Quantum)。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世


量槳是基於百度飛槳研發的量子機器學習工具集,飛槳也成為國內首個支援量子機器學習深度學習平臺。量槳建立起了人工智慧與量子計算之間的橋樑,可以快速實現量子神經網路的搭建與訓練,同時還提供多項前沿量子應用。

有了量槳,量子計算領域的研究人員就可以用它進行量子人工智慧的研發,深度學習愛好者也有了一條學習量子計算的捷徑。百度飛槳也因此成為國內首個也是目前唯一一個支援量子機器學習深度學習平臺。

量槳擁有以下特點:

  • 易用性:透過量槳,開發者可以輕鬆搭建簡潔的量子神經網路,也可以根據豐富的量子機器學習案例一步步組建出自己喜歡的模型;

  • 通用性與擴充性:開發團隊在飛槳中系統地擴充套件了包括複數變數、複數矩陣乘法在內的多項底層功能,這使得量槳可以完美地支援量子電路模型,從而也支援通用量子計算相關的研究;

  • 特色工具集:針對組合最佳化問題的求解、量子化學系統模擬等關鍵方向提供了專門的強大工具集,還推出了一些原創性的量子機器學習模型。


量槳的量子機器學習開發工具包括:量子開發工具集,量子化學庫,以及一系列最佳化工具。與此同時,量槳還提供了量子機器學習、量子化學模擬以及量子組合最佳化這三大核心量子應用。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

比起業內的其他實現方法,量槳提供的方法具有部署靈活的特點,同時可以將量子計算網路的層數減少 50%,更具有可行性。


在釋出會上,百度飛槳還發布了 PPDE(飛槳開發者技術專家)計劃,號召全球 AI 開發者與百度飛槳一起共建開放的深度學習開源社群。

PPDE 是飛槳開發者技術專家的榮譽認證體系,由飛槳開發者技術專家、飛槳高階開發者技術專家和飛槳資深開發者技術專家組成。無論是熱愛程式設計開發的資深程式設計師、技術社群的引領者,還是頂級開源軟體的 committer、新興科技公司創始人或 CTO,這些開發者技術專家都可以透過線上線下形式在此機制下展開交流。

百度飛槳開發者已超190萬,國內首個量子機器學習開發工具「量槳」面世

百度飛槳與 Linux Foundation 開源大學合作推出了國內首個深度學習工程師聯合認證,這一認證將於 6 月份開放考試。


昨天,百度還剛釋出了 2020 年第一季度的財報。雖然因為新冠疫情的影響,今年百度的第一季度收入同比下降 7%,營收 225 億元,但淨利潤 (Non-GAAP) 升至 31 億元,同比增長 219%。從不同業務上看,百度的移動生態持續鞏固,小度助手、Apollo 和智慧雲均實現了健康增長。

人工智慧業務的增長已在為百度的發展貢獻越來越多的力量,而技術領先的飛槳,更將推動各行業人工智慧基礎設施建設的程式。

相關文章