深度學習框架如同智慧時代的“發電機”,讓人工智慧技術更快速地普及到各行各業,推動融合創新,成為智慧時代最重要的基礎設施。PaddlePaddle作為目前國內唯一功能完備的深度學習框架,經過2018年的快速成長,初具模型領先、效能優越、易學易用的技術特色,以及工業場景下的領先優勢。下面我們來盤點一下PaddlePaddle 2018年的成長之路。
一、核心釋出
1、 Paddle Fluid 1.0釋出 —— 核心框架走向成熟
7月4日 Paddle Fluid V0.14.0 釋出——提供從資料預處理到模型部署在內的深度學習全流程的底層能力支援。官方首次開源CV/NLP/語音/強化學習等10個業界領先的模型。
10月12日 Paddle Fluid V1.0穩定版本釋出——提供更穩定、向後相容的API。易用性大幅提升。提供 Mac OS 下的多種安裝方式,新增對Python3.5的支援。並開源8個CV、NLP 方向主流模型。
11月1日Paddle Fluid V1.1釋出——支援千億規模稀疏引數大規模多機非同步訓練。移動端預測新增Mali GPU、Adreno GPU、FPGA等硬體支援。開源5個推薦領域模型,大幅最佳化CV、NLP模型的訓練速度和視訊記憶體佔用。
12月8日 Paddle Fluid V1.2釋出——CPU多機非同步訓練升級包括worker非同步併發和IO、通訊最佳化在內多項功能,整體吞吐大幅提升。支援python3.6及以上全版本。模型庫新增影像分類任任務的預訓練模型、語言模型任務新增基於cudnn的LSTM實現、分散式word2vec模型。
2、 PaddlePaddle Suite - 技術全面領先的深度學習全功能套件
PaddlePaddle3.0升級為全面的深度學習開發套件,在核心框架基礎上,開放VisualDL、PARL、AutoDL、EasyDL、AI Studio等一整套的深度學習工具元件和服務平臺,滿足不同層次的深度學習開發者的開發需求。具備強大支援工業級應用的能力,已經被中國企業廣泛使用,並擁有活躍的開發者社群生態。
二、三大技術特色
1、深耕工業場景,打造官方支援模型最多的深度學習框架
基於百度多年的工業應用經驗,以及百度生態夥伴的人工智慧解決方案實踐,PaddlePaddle為企業提供44個經過工業場景驗證的官方模型,涵蓋視覺、NLP、語音和推薦等AI核心技術領域,成為官方支援模型最多的深度學習框架。
基於PaddlePaddle開源多個百度國際競賽獲獎模型:
PyramidBox模型 2018年3月在世界最權威的人臉檢測公開評測集 WIDER FACE的三項評測子集Easy、Medium和Hard中均獲得世界第一。
基於Faster R-CNN的多模型,在Google AI Open Images-Object Detection Track 比賽中,從全球450多支參賽隊伍中脫穎而出,獲得世界第一。
PaddlePaddle強化學習框架PARL獲得NeurIPS 2018的強化學習賽事AI for Prosthetics Challenge競賽冠軍。
2、 源於業務實踐,輸出業界最強的超大規模並行深度學習能力
基於百度海量規模的業務場景實踐,PaddlePaddle同時支援稠密引數和稀疏引數場景的超大規模深度學習並行訓練,支援千億規模引數、數百個幾點的高效並行訓練,提供最為領先的深度學習並行技術。
3、追求極致效能,推出移動端高速推理引擎
Paddle Mobile提供深度學習落地嵌入式移動端平臺的能力。針對ARM CPU、IOS GPU、Mali GPU、Adreno GPU、FPGA、樹莓派、RK339等多個硬體平臺最佳化,效能高、體積小的優勢。服務於包括手機百度、簡單搜尋在內的多款APP。在手機端實現單幀多目標檢測耗時60ms以內,主要物體檢測準確率和召回率均在95%以上。
三、 完善的服務平臺和配套元件
1、基於PaddlePaddle的深度強化學習框架PARL釋出,奪冠NeurIPS 2018
PARL深度強化學習框架,具有高可擴展性、可復現性和可複用性,強大的大規模並行化和稀疏特徵的支援能力。覆蓋DQN、DDQN、Dueling DQN、DDPG、PPO等主流強化學習演算法。支援百億級別資料或特徵的訓練,基於PARL可同時通過8塊GPU拉動近20000個CPU節點運算。在NeurIPS 2018賽事中將需要近5個小時迭代一輪的PPO演算法加速到不到1分鍾,相對單機運算加速比高達幾百倍。
2、讓深度學習來設計深度學習,AutoDL2.0設計的網路超過人類專家
AutoDL 2018年正式釋出V1.0、V2.0,包含網路結構自動化設計、遷移小資料建模、適配邊緣計算三個部分,能夠自動進行深度學習網路的設計、遷移、以及適配,批次化生產模型。在CIFAR 10資料集,Auto DL 2.0設計的影像分類網路正確率達到 98%,效果全面超過人類專家。
3、EasyDL零基礎深度學習定製化訓練和服務平臺
EasyDL為零演算法基礎的開發者提供高精度AI模型定製服務。只需少量資料即可得到優質業務模型,快速驗證應用場景。2018年,EasyDL從V3.0迭代升級至V5.0,逐步開放並完善定製影像識別、聲音分類識別、文字分類識別等能力,累計超過2萬個模型在零售、工業、醫療、安防等多個行業中落地應用。
4、AI Studio:一站式深度學習開發實訓平臺
作為集合了AI教程、程式碼環境、演算法算力和資料集的一站式實訓平臺,匯聚頂尖深度學習開發者,快速幫助使用者掌握深度學習開發技能。底層預裝PaddlePaddle框架及VisualDL等深度學習元件,大大提高開發者學習與開發的便捷性,混合排程CPU和GPU的資源,提升訓練速度。AI Studio共正式釋出V1.0、V1.1、V1.2三個版本,主要有專案、資料集、比賽、GPU叢集訓練和模型線上預測功能。
四、黃埔學院 –革新者來
百度聯合國家深度學習技術及應用國家工程實驗室共同打造“黃埔學院”,我們秉承”服務於行業,服務於人才”的標準,專案組透過幾個月的招募與篩選,日日夜夜的評估與努力,最終選出業內35位深度學習專家,共同見證黃埔學院第一期開學典禮——首席AI架構師的課堂。『經世致用,融會貫通,黃埔學院,革新者來』,這十六個字正代表了黃埔學院的治學理念以及願景。我們希望技術不停留在實驗室,不停留在研究院,而是能真正的走出去,為這個世界、這個時代創造實實在在的價值。
五、2019,未來可期
2019年,PaddlePaddle將繼續以最佳化開發者體驗、節約開發者時間為己任,鞏固技術領先優勢,深入企業場景,在應用落地的各個環節提供更便捷、更安全、更高效的深度學習技術服務。
繼續降低深度學習技術的應用門檻,將超大規模並行深度學習、強化學習等業界領先的技術打造為人人可用的通用深度學習。
大力發展企業生態,透過應用場景深度對接,為企業提供快速諮詢通道、企業內部培訓、專項技術最佳化、聯合開發支援的全方位服務。
持續擴大教育生態,透過百度產學合作協同育人專案、TechDay公開課、深度學習實戰課、黃埔學院等行業頂級的技術交流活動,為開發者提供從深度學習入門到企業應用的一站式服務。
更多瞭解:http://www.github.com/paddlepaddle/paddle