一年 5712 件:百度領跑中國專利申請數量排行榜
2019 年,百度繼續領跑國內機構專利申請數量排行榜。
截至 2019 年 10 月,中國人工智慧專利申請量累計 44 萬餘件,已超越美國成為 AI 領域專利申請量最高的國家。
在這份成績單中,百度表現亮眼。在 12 月初國家工業資訊保安發展研究中心釋出的 2019 年度《人工智慧中國專利技術分析報告》中,百度以全年 5712 件的專利申請數量位列第一,這也是百度連續兩年蟬聯第一。
在深度學習技術、語音識別、計算機視覺、雲端計算、自然語言處理、智慧駕駛技術、智慧機器人七個人工智慧核心領域中,百度包攬了四項分榜的第一名。另據世界智慧財產權組織報告顯示,百度在深度學習領域專利申請量位居全球第二。
蟬聯專利申請榜的背後,是百度 AI 在核心技術上的深厚積累和堅定投入。在 11 月公佈的百度 2019 年第三季度財報中,百度第三季度研發投入達 47 億元人民幣,佔營收比重 16.7%,這一規模的投入,在全球科技公司中位居前列。
23 個冠軍、200 多篇論文:前沿技術研究大放異彩
2019 年,百度 AI 在各個國際頂會、各項 AI 賽事中,展示出了 AI 核心玩家的實力。
在諸如 CVPR、ICCV、NeurIPS、MRQA 等全球公認的 Top 級賽事及學術頂級會議上,百度 AI 共包攬 23 項國內外競賽冠軍,200 多篇論文被各大頂會收錄,在語義評測、中英翻譯、閱讀理解領域均取得優異成績,包括國際語義評測比賽、MRQA 等多個大賽冠軍。
2 月,在第十三屆國際語義評測比賽的論壇評論建議挖掘任務評測中,百度一舉擊敗來自全球的 210 餘支隊伍,最終以 F 值 78.12% 的成績奪得冠軍,填補了評論建議挖掘領域的空白。
在 4 月的 ICME 人臉 106 關鍵點檢測比賽中,百度大腦視覺技術團隊與全球 20 多個優秀代表隊同臺競技,最終奪得冠軍。
5 月,在國際權威的多目標追蹤挑戰(Multiple Object Tracking Challenge,MOT)的 MOT16 榜單上,百度視覺技術團隊超越眾多實力強勁團隊,獲得榜單世界第一的好成績。MOTA 指標顯著提升,超越第二名 1.8 個點。
6 月,百度在 CVPR 2019 中共摘得 10 項競賽任務的冠軍,包括視覺領域下的視訊理解與分析、目標檢測、影像超解析度、智慧城市車輛識別、人臉&人體檢測等眾多熱門子領域。
8 月的 MRQA2019 閱讀理解國際評測比賽中,在飛槳的助力下,百度團隊以平均 F1 值 72.55% 的成績奪得這一次機器閱讀理解測評的冠軍,超過了第二名近兩個百分點,同時,在全部 12 個測試資料集中的 10 個排名第一。
10 月,百度首次參加 ICCV VOT 2019 單目標跟蹤國際競賽,百度大腦視覺技術團隊&華中科技大學電信學院團隊擊敗了來自全球知名企業、高校研究所的 46 支團隊,憑藉跟蹤演算法 ATP,在測試集上以 27.5% 的成績奪得冠軍,同期在 Wider Challenge 人臉檢測國際競賽中,百度大腦視覺團隊又以 mAP 值 57.13% 的成績獲得人臉檢測的冠軍,遠超去年冠軍 55.82% 的成績。
10 月,NeurIPS 2019: Learn to Move 強化學習賽事落下帷幕,百度繼 2018 年奪得冠軍後再度蟬聯冠軍,也是參賽的 300 支隊伍中最終完成挑戰的 3 支隊伍之一。基於飛槳的強化學習框架 PARL 不僅成功完成挑戰,還大幅領先第二名 143 分。
國際權威賽事的冠軍,是百度大腦在前沿技術領域的實力體現。
這一年,百度大腦提出流式多級的截斷注意力模型 SMLTA,在國際上首次實現流式注意力建模超越整句注意力模型的效能,也是國際上首次實現線上語音識別大規模使用注意力模型。SMLTA 在大幅提升識別速度的同時,也提高了識別準確率。輸入法有效產品相對準確率提升 15%,音響有效產品相對準確率提升 20%。
流式多級的截斷注意力模型 SMLTA
這一年,在視覺技術方面,百度形成了包括影像、視訊、AR/VR、重要垂類、軟硬一體化五大方向的特色視覺技術矩陣。OCR、物體檢測、視訊理解、目標跟蹤等業界領先的影像與視訊技術多次在國內外頂級賽事中取得佳績,例如在 CVPR 2019 就取得 10 項冠軍,並已在機械製造、金融、醫療、教育等領域得到廣泛應用。創新的 3D 和 AR 視訊互動技術,已經實現人臉、手勢、環境、肢體多維度的技術突破,可用於一體化人機互動等創新應用。
這一年,在語言和技術方面,百度大腦的預訓練模型 ERNIE 讓業界驚豔。
預訓練模型 ERNIE 登頂 GLUE 排行榜
2019 年底,百度 ERNIE 模型超越微軟 MT-DNN-SMART、谷歌 T5、ALBERT,登頂 GLUE 排行榜。
12 月初,國際人工智慧頂會 NeurIPS 2019 拉開帷幕,1.3 萬人齊聚加拿大溫哥華。作為 NeurIPS 2019 的重度參與者,百度在會上展示了 NLP 領域的最新突破,其中最亮眼的要數預訓練模型 ERNIE 2.0。
ERNIE 是百度打造的一個可持續學習的知識增強語義理解框架,通過建模海量資料中的實體、概念等先驗知識,學習真實世界的語義關係。
大會召開期間,ERNIE 模型在自然語言處理領域權威資料集 GLUE 中榮登榜首,以 9 個任務平均得分首次突破 90 大關重新整理該榜單,超越微軟 MT-DNN-SMART, 谷歌 T5、ALBERT 等一眾國際頂級預訓練模型。
在自然語言理解領域,GLUE(General Language Understanding Evaluation)是一個很重要的行業標準,用於評估 NLP 模型在現有的多個自然語言理解任務中的效能,包括文字蘊涵、情感分析和語法判斷等。由於其公認的權威性,谷歌、Facebook、微軟、卡內基梅隆大學等國際頂尖企業和機構不斷向該排行榜發起挑戰。
從 2018 年下半年以來,BERT、XLNET、T5 等預訓練語言模型先後重新整理 GLUE 排行榜,表明對大型語料庫的預訓練可能在自然語言處理中起著至關重要的作用。但這些模型的出現也在不斷推高自然語言處理任務的基線水準。在這樣的形勢下,基線的進一步推進變得越來越困難。
刷榜背後,ERNIE 今年的表現可謂驚豔。3 月份,百度提出知識增強的語義表示模型 ERNIE 1.0;7 月底釋出持續學習語義理解框架 ERNIE 2.0,當時在共計 16 箇中英文任務上超越 BERT、XLNET,取得了 SOTA 的效果;11 月,百度釋出基於 ERNIE 的語義理解開發套件。從原理、應用到開源及平臺化,百度在 NLP 預訓練領域進行了極具價值的創新及實踐。
目前,ERNIE 已經在閱讀理解、情感分析、搜尋智慧問答、視訊推薦、CTR 預估等工業級應用中廣泛使用,效果提升非常明顯。
打造中國 AI 核心競爭力,不斷升級的百度飛槳
2019 年,人工智慧的發展走入快速落地期,在全球科技競爭日益加劇的當下,關於深度學習框架的「基礎設施之爭」愈演愈烈。
深度學習掀起了第三次人工智慧熱潮,以深度學習框架為核心的深度學習平臺下接晶片,上承各種應用,是「智慧時代的作業系統」。IDC《中國深度學習平臺市場份額調研》報告顯示,在接受調研的企業和開發者中,86.2%選擇使用開源深度學習框架。
但在談到深度學習開源框架時,我們的第一反應可能是 Facebook 的 PyTorch 或谷歌的 TensorFlow,前者稱霸學界,後者固守業界,佔據了深度學習平臺市場的大部分份額。然而,從今年發生的種種科技、貿易爭端來看,這種對於國外平臺的嚴重依賴長遠來看不利於國內深度學習生態的發展。
在全球開源深度學習框架排行榜上,百度飛槳成為排行榜前五中唯一的「國貨」。
從 2008 年起,百度開始建設大規模機器學習基礎設施、模型、工具及實驗平臺,並在 2013 年推出了飛槳的原型「Paddle」。2016 年,百度正式開源 PaddlePaddle,這也是國內唯一開源開放、功能完備的深度學習框架——飛槳。
上述報告顯示,百度飛槳與谷歌、Facebook 在深度學習平臺市場份額中名列前三,領銜中國深度學習平臺市場,也是市場份額前五中唯一的國貨。
這一年來,飛槳圍繞深度學習框架的基本功能、效能、晶片支援的完備性等技術指標進行了一系列的易用性開發和效能迭代。
當下,飛槳在核心技術方面具備了 4 大代表性的領先技術:
開發便捷的產業級深度學習框架。飛槳深度學習框架採用基於程式設計邏輯的組網正規化,對於普通開發者而言更容易上手,符合他們的開發習慣。同時支援宣告式和指令式程式設計,兼具開發的靈活性和高效能。網路結構自動設計,模型效果超越人類專家。
超大規模深度學習模型訓練技術。飛槳突破了超大規模深度學習模型訓練技術,實現了世界首個支援千億特徵、萬億引數、數百節點的開源大規模訓練平臺,攻克了超大規模深度學習模型的線上學習難題,實現了萬億規模引數模型的實時更新。
多端多平臺部署的高效能推理引擎。飛槳不僅相容其他開源框架訓練的模型,還可以輕鬆地部署到不同架構的平臺裝置上。同時,飛槳的推理速度也是全面領先的。尤其經過跟華為麒麟 NPU 的軟硬一體優化,使得飛槳在 NPU 上的推理速度進一步突破。
覆蓋多領域的產業級開源模型庫。在上述能力強化的基礎上,飛槳官方支援 100 多個經過長期產業實踐打磨的主流模型,其中包括在國際競賽中奪得冠軍的模型,同時開源開放 200 多個預訓練模型,以助力快速產業應用。
飛槳產業級深度學習開源開放平臺全景圖
此外,華為麒麟晶片也與百度飛槳深度合作,打通深度學習框架與晶片 AI 算力,強強聯合創造中國 AI 核心競爭力。
23 個城市,300 萬公里:Apollo 的飛速奔跑
2019 年,全球進入自動駕駛量產階段,百度 Apollo 也在路上飛速地奔跑著,從硬核技術到商業落地,成果斐然。
自從百度 Apollo 自動駕駛開放平臺釋出後,兩年以來,百度 Apollo 平臺開原始碼數量超過 56 萬,匯聚了全球範圍內 97 個國家 3.6 萬名開發者和 177 家生態合作伙伴,Apollo 自動駕駛平臺已成為全球最強大、最開放、最活躍的自動駕駛平臺。
其中,大規模自動駕駛資料集 ApolloScape 是首個來自大型自動駕駛公司的大規模開放資料集,是行業內環境最複雜、標註最精準的三維自動駕駛公開資料集之一,自 2018 年 3 月釋出以來,已經在全球範圍內被下載上萬次。
ApolloScape 資料集示例:彩色影像(上部)及其二位語義標籤(下部)
2019 年,百度 Apollo 公開了自動駕駛純視覺城市道路閉環解決方案「百度 Apollo Lite」,這也是國內唯一的城市道路 L4 級視覺感知解決方案,能夠支援對 10 路攝像頭、200 幀/秒資料量的並行處理,單視覺鏈路最高丟幀率能夠控制在 5‰以下,實現全方位 360°實時環境感知,前向障礙物的穩定檢測視距達到 240 米。同時百度 Apollo Lite 價格低廉且便於獲得,為企業、開發者們提供了一個低價、優質的自動駕駛解決方案,讓自動駕駛商業落地變得更加觸手可及。
L4 級自動駕駛純視覺城市道路閉環解決方案——百度 Apollo Lite
在 1 月的拉斯維加斯,百度正式釋出 Apollo Enterprise(企業版),面向汽車企業、供應商和出行服務商,提供的全球首個量產、定製、安全的自動駕駛和車聯網解決方案。Apollo 正式開啟商業化元年,從內部研發逐步走入市場。一年之間,Apollo 的足跡也走過了中國更多城市的土地。
2019 年 6 月,Apollo 獲得長沙市政府頒發的 45 張可載人測試牌照。8 月 2 日,首批車輛陸續抵達長沙。9 月,首批 45 輛 Apollo 與一汽紅旗聯合研發的「紅旗 EV」Robotaxi 車隊在長沙部分開放測試路段開始試運營。
百度自動駕駛計程車隊 Robotaxi 在長沙正式開啟試運營。
8 月底的智博會期間,百度與重慶市人民政府就共同推進大資料融合創新發展進行合作簽約,百度 Apollo 宣佈攜手重慶合作「西部自動駕駛開放測試基地專案」。
10 月,百度宣佈攜手紹興共同打造中國首條以自動駕駛車路協同創新示範為特色的智慧快速路,為紹興智慧快速路提供一體化的車路協同元件、車路協同邊緣雲控平臺等整體解決方案及產品技術支援。
11 月,Robotaxi 在河北之境留下第一條車轍。百度 Apollo 在滄州舉辦了開放道路自動駕駛測試啟動暨首批載人測試體驗活動,標誌著我國首個區級全域自動駕駛可載人測試路網正式開放。
迄今,百度 Apollo 累計測試里程已經突破 300 萬公里,走過了全球 23 個城市,智慧駕駛專利 1237 項,位列全國第一。此外,百度擁有自動駕駛路測牌照 150 張,佔中國全部獲批自動駕駛路測牌照一半以上。
12 月 18 日,百度 Apollo 生態大會在長沙舉行,Apollo 自動駕駛開放平臺升級至 5.5 版本,此外車路協同開放平臺和智慧車聯開放平臺也正式釋出。
智慧音響小度出貨量全球第二
2019 年,百度的小度助手和小度智慧音響也代表「國家隊」出戰,在硬體、軟體、生態等方面表現不俗。
2019 年 12 月,中科院物聯網研究發展中心釋出的《智慧音響的智慧技術解析及其成熟度測評》報告顯示,小度智慧音響在聽清率、聽懂率和滿足率三個緯度上全面領先,成為智慧音響領域的「全能冠軍」。
軟體方面,截至 6 月份,搭載小度助手的智慧裝置啟用數量已突破 4 億臺,小度助手語音互動超過 36 億次。
硬體方面,根據 Strategy Analytics 的統計,在 2019 年第二季度出貨量排名前五的企業中,中國企業佔了三家,百度更是超越谷歌,市場份額躋身全球第二,同比增長 3700%。2019 年上半年,小度有屏音響出貨量超過了排名其後四位品牌出貨量總和,穩居全球第一。
在技術創新方面,2019 年,小度助手 5.0 的對話能力迎來重大技術革新——全雙工免喚醒能力,實現了「一次喚醒,多輪互動」免喚醒詞連續對話。
在平臺建設方面,過去一年中,小度技能開放平臺(DuerOS 技能開放平臺)上的技能開發者數量已經超過 3.7 萬人。小度技能開放平臺可提供包括遊戲、效率工具、網路電臺、直播、兒童教育、智慧家居等 3500 多種技能支援。
品牌合作生態上,小度助手的合作伙伴數量已經超過 500 家,與華為、OPPO、vivo、創維、TCL、索尼、小天才等多領域頭部品牌建立了多個層級的合作。小度助手可以控制的 IoT 智慧家居裝置已經超過了 7000 萬。
百度大腦 AI 開放平臺 5.0:中國服務規模最大的 AI 開放平臺
自 2016 年以來,百度已經開放了 228 項領先 AI 能力,開發者數量超過 150 萬,日均呼叫量突破 1 萬億次,語音、人臉、NLP、OCR 呼叫量中國第一,是業內最全面、最領先、服務規模最大的 AI 開放平臺。
2019 年,百度大腦已經升級到 5.0 時代,包括基礎層、感知層、認知層、平臺層和 AI 安全五大部分的核心架構已經成型,打通了人工智慧產業化應用落地的全部流程。百度大腦開放平臺已經在語音、視覺、語言與知識等方面實現全面升級,具備深度學習框架、場景化 AI 能力、定製化訓練平臺到軟硬一體模組和解決方案等,可以為不同 AI 技術積累和場景需求的開發者提供助力,解決實際問題。
國內首個開源邊緣計算框架——BAETYL
除了為自身及國內開發者提供基礎技術支援及產品服務外,百度也在積極走出國門,在國際舞臺上發揮自己的技術影響力。
2019 年 9 月,在 2019 年 Open Networking Summit Europe 大會上,百度智慧雲宣佈將百度智慧邊緣計算框架 BAETYL 捐贈給 LF Edge 基金會。BAETYL 成為中國首個開源的邊緣計算框架。
LF Edge 基金會是 Linux 在舊金山成立的針對邊緣計算的基金會,百度智慧雲既是 LF Edge 的創始成員,同時也是國內最早推進邊緣計算技術的雲服務商之一。
BAETYL 是聚焦在物聯網邊緣計算的雲原生基礎設施,具有平臺中立、系統中立、網路中立的特點,是國內屈指可數的、廠商中立的開源專案和生態系統。作為中國首個 LF Edge 捐贈專案,百度智慧雲將領先的技術及產品進一步貢獻給全球的開發者,「雲+AI」助力全球邊緣計算的發展,創造更多的價值。
此外,BAETYL 和百度智慧邊緣 BIE(Baidu IntelliEdge)雲端管理套件配合使用可以達到雲端配置、邊緣執行的效果,滿足各種邊緣計算場景的需求。
基於中國第一款雲端全功能 AI 晶片「百度崑崙」的雲伺服器上線
在人工智慧技術發展的浪潮中,計算硬體經歷了從 CPU、GPU 到專用晶片的演變。
也正是基於這麼多年來在 CPU、GPU 和 FPGA 的 AI 加速器研發經驗,「百度崑崙」在 2018 年 7 月面世,這是百度自研的中國第一款雲端全功能 AI 晶片,包含訓練晶片百度崑崙 818-300 和推理晶片百度崑崙 818-100。近日,「百度崑崙」晶片已經完成研發,將在 2020 年初實現量產。
今年,基於「百度崑崙」的雲伺服器也首次亮相。在 150 瓦功耗下,它能帶來 260 萬億次定數的 AI 運算,提供 512GB/s 的記憶體頻寬;提供完整的開發工具鏈,支援使用者使用 C/C++開發運算元,具有很好的可程式設計性;提供一套圖編譯框架 XTCL,能夠支援百度飛槳、TensorFlow 和 Pytorch 等主流深度學習框架;支援語音,影像,NLP 等不同的演算法模型,其中 ERNIE 模型的效能是 T4 GPU 的三倍以上。
跨越 2019:百度 AI「Do Better」,科技為更好
2019,百度 AI 也從未停下創造美好的腳步。正如百度董事長兼執行長李彥宏所說:「我們會始終堅守積極、正向的 AI 倫理觀,讓人工智慧成為服務社會、助人成長的變革力量。」
在「百度 AI 尋人」平臺,已經發起過接近 40 萬次照片比對,迄今已有 9000 多個走失者在百度 AI 的幫助下與家人重新團聚。
隨著垃圾分類政策在全國的推廣實施,「百度 AI 垃圾分類」智慧小程式已在全面上線百度 App,基於百度 AI 在視覺和語音方面的處理技術,讓大眾通過語音搜尋或識圖搜尋,就可以方便快捷地對垃圾進行分類。
基於醫學知識圖譜、醫學自然語言處理等 AI 技術,通過學習權威教材、指南及三甲醫院優質病歷,百度 AI 開發了臨床輔助決策系統(CDSS),目前已經覆蓋全國 16 個省市,服務近百家大型醫院和近千家基層醫療機構,上萬名醫生。
5 月,百度聽障兒童無障礙閱讀計劃正式釋出,同時推出全球首款聽障兒童 AI 手語翻譯小程式,將繪本文字翻譯為手語,幫助聽障兒童實現無障礙閱讀。
百度地圖上線了全國首個與政府機構合作、覆蓋多個城市的母嬰室位置資訊查詢產品——母嬰室地圖,使用者可在百度地圖中一次性查詢周邊甚至全程的母嬰室,並直接導航前往。
此外,百度也將 AI 應用在了颱風路徑查詢、瀕危土家語保護、A 改造盲人按摩院等方面,讓 AI 抵達無數的遠方,讓無數的人的生活因 AI 而變得更好。
百度 CTO 王海峰用三句話總結了百度 AI 的 2019 年:「打造了紮實的底座,推動了真實的改變,創造了值得信賴的未來。」
2019 年,百度大腦的演算法算力不斷突破,各項核心技術領先國際,百度 AI 成為「軟硬一體 AI 大生產平臺」,讓中國的 AI 技術走入標準化、自動化、模組化的階段,為中國智慧經濟的發展打造了「紮實的底座」。
2019 年,百度 AI 的核心技術正在走到更廣闊的天地中去,這些能力通過百度智慧雲「雲+AI」的高速公路輸送到了中國的各行各業,在當下人工智慧與實體經歷相互交融的浪潮中推動著「真實的改變」。
2019 年,百度 AI 依然從「Do Better,科技為更好」出發,以 AI 技術服務社會,讓人們的生活變得更美好,為每一箇中國人創造著「值得信賴的未來」。
2020 年,百度 AI 仍然在路上。