作為 WAIC 開發者日的重要延續,為期兩天的大會圍繞開發者關心的話題,設定了主題演講、公開課、開發者工作坊、黑客馬拉松、技術和產業閉門研討會等環節,為全球優秀的人工智慧開發者們提供了一個學術交流、技術探討和溝通合作的平臺。
在 12 月 6 日上午的主題演講環節,商湯科技聯合創始人兼 CEO 徐立、依圖科技聯合創始人林晨曦、華為智慧計算副總裁/晟騰生態負責人易詠成、谷歌研究科學家/普林斯頓大學電腦科學系教授 Yoram Singer、南京大學人工智慧學院教授俞揚等來自 AI 領域的重磅嘉賓為參會者們分享了不同的技術主題。此外,華為開源生態主任工程師黃之鵬與領規科技創始人黃康還進行了一場人工智慧新銳開發者對話。
在下午的人工智慧開發工作坊環節,加州大學伯克利分校人工智慧系統中心創始人兼電腦科學專業教授 Stuart Russell、北京大學電腦科學技術系副教授/AI 自動程式碼補全 aiXcoder 專案負責人李戈、Kaggle Competitions Grandmaster 沈濤、百度 AI 技術生態部高階技術經理謝永康、亞馬遜上海人工智慧研究院應用科學家/著名開源人工智慧系統 MXNet、MinPy 和 DGL 發起人及主要貢獻者王敏捷、英偉達開發者社群經理何琨分享了各自在技術及產業實踐中的經驗和體會。
機器之心對當日嘉賓演講及對話的精彩觀點進行了整理,以下為內容實錄:
商湯科技聯合創始人兼 CEO 徐立
商湯科技聯合創始人兼 CEO 徐立的分享主題為「人工智慧的顛覆式創新」。徐立表示,無論是從當前的產業實踐還是從大眾生活日常上看,都可以說,人工智慧作為顛覆性的創新技術,已經深刻地改變了我們的生活。
徐立認為,人工智慧是否能夠成為顛覆性的技術創新,需要從兩個角度觀察。首先是技術發展角度,技術的大發展、大躍遷往往是非連續的。從技術變革的大趨勢來看,當前這個時代正處於技術大發展大變革的前一個階段,資料、算力、感測器、儲存和演算法都出現了井噴式的發展,下一階段的技術進步將會是非連續的跨越式發展。
另一個角度則是應用成熟度。目前,各種各樣的人工智慧應用已經在善政、興業、惠民等多個方面進入到人們的工作和生活中。在演講中,徐立以商湯在這些場景中完成的相關技術創新和應用研發為例,來說明人工智慧技術特別是計算機視覺領域的技術,正在走向成熟階段。
依圖科技聯合創始人 林晨曦
第二位登臺的是依圖科技聯合創始人林晨曦,他的演講主題是「無與倫比的 AI 時代」。
林晨曦首先回顧了近年來人工智慧技術的發展歷程。以人臉識別方面的技術進展為例,林晨曦提到,近年來人工智慧技術發展確實進入了一個「無與倫比」的時代。接著,他也介紹中國和美國在人工智慧技術上的發展和對比,說明了我國在人工智慧技術上仍有潛力,可以彎道超車。
談到依圖科技在人工智慧方面的發力,林晨曦舉出了一些案例。例如,依圖科技在演算法層面,包括計算機視覺、語音識別、聲紋識別、自然語言等領域的研究。同時,在應用層面,依圖在智慧醫療領域發力,使人工智慧兒科醫生達到了三年制醫生的水平。
林晨曦認為,人工智慧普及最重要的關鍵是智慧的密度。從巨集觀上,單體、單模態的智慧會變成多模態、群體的智慧,在不同的行業裡落地。從微觀上來講,算力的支撐——也就是單位面積智慧的算力,是產業前進非常重要的因素。
在演講的後半部分,林晨曦介紹了依圖在 AI 晶片領域的開發進展,以及視覺計算創新平臺的開放計劃。依圖希望為視覺計算開發者提供更加標準和高效的支援與服務,提升智慧晶片、智慧演算法和智慧產品的整體產業能力,助力中國晶片設計業和人工智慧的結合。
華為智慧計算副總裁/晟騰生態負責人 易詠成
華為智慧計算副總裁、晟騰生態負責人易詠成首先回顧了我國在 AI 技術領域的政策和進展。他認為,我國在 AI 應用領域方面已超過所有國家,包括美國。
但是,在 AI 領域,依然有三個可以看到的現象值得注意。首先,沒有人工就沒有智慧。當前人工智慧依賴大量人工標註的情況還沒有實現根本改變。其次,演算法落地應用依然困難。儘管在實驗室中的演算法效能達到很高的水平,但在實際應用還沒有得到很好的應用。第三,AI 和其他技術的連線依然不充分,AI 和其他技術應用的深度融合將會是潛力巨大的商業機會。
之後,易詠成總結了華為在人工智慧領域的一些進展。目前,華為正在與全世界的研究機構聯合進行研發,進一步打造全棧方案,構建投資生態。回顧華為的 AI 產品,易詠成重點介紹了華為全場景處理器,包括鯤鵬、昇騰系列和麒麟系列等。在全棧方面,華為進行了從模組到推理卡,到訓練卡,到中心的主機的研發工作,以有開發框架和應用的合作伙伴產品的合作,包括在端邊緣和雲方面,華為也進行了佈局。
最後,易詠成呼籲合作伙伴加入到華為的生態營銷活動中,也鼓勵開發者加入到昇騰開發者社群。華為使用獎金等方式,鼓勵開發者參與。
谷歌研究科學家/普林斯頓大學電腦科學系教授 Yoram Singer
在 WAIC 開發者定製公開課環節,大會請到了谷歌研究科學家、普林斯頓大學電腦科學系教授 Yoram Singer,進行《Re-laying the foundations of effective machine learning》課程分享。
Yoram Singer 從機器學習的應用案例開始,介紹了人工智慧的基本原理。他提到,機器學習其實與統計學密切相關,通過一系列的資料輸入,神經網路等演算法能夠擬合資料的分佈,並最終發現其中的隱藏規律。
如何讓神經網路實現這樣的能力?Yoram Singer 介紹了神經網路的架構和原理。神經網路實際上依靠的是類神經元的計算方式。通過帶有權重的神經元進行非線性變換的方式,加上多個神經元的深度連線,使得多層的神經網路具有強大的學習能力。
此外,Yoram Singer 也介紹了卷積神經網路的基本原理,以及在影像領域的一些應用。他還提到了自動駕駛,以及機器學習怎樣實現自動駕駛的方法。
最後,Singer 教授談到了如何利用深度學習參與到類似於 TPU 叢集計算和加速訓練收斂的方法,同時也介紹了一些谷歌在這方面的創新,帶給與會者很大的啟發。
南京大學人工智慧學院教授 俞揚
在主題演講環節的最後,南京大學人工智慧學院教授俞揚為與會嘉賓和開發者帶來了在強化學習領域的研究經驗分享。
俞揚介紹說,在我們的生活中,人工智慧在兩個方面實現了廣泛的應用,一是預測和識別,二是決策。這兩方面的研究在實際的學科劃分上亦有不同。
隨後,俞揚介紹了在機器學習領域中強化學習和監督學習這兩個技術的不同點,也介紹了強化學習應用於推薦系統的一些案例和方法。之後,俞揚談到了強化學習在實際應用中可能遇到的問題,以及目前一些可能的解決方法。以淘寶為例,他介紹了推薦系統對使用者行為帶來的影響,以及強化學習的實際應用存在的困難和解決方法。
除了商品場景外,俞揚同時也介紹了閒魚砍價、物流等方面的工作。俞揚介紹在這些場景和案例中的方法論,談到了如何成功應用強化學習的方法。最後,俞揚談到了為開發者做的工作,包括強化程式設計和框架等。開發者可以利用這一框架,使得程式設計和研發演算法更加容易。
在上午主題演講之後,大會還特別策劃了「人工智慧新銳開發者對話」環節,華為開源生態主任工程師黃之鵬與領規科技創始人黃康圍繞「中國自主的 AI 工具包」這一熱門話題展開了討論。
在下午的人工智慧開發者工作坊環節,首位分享嘉賓是加州大學伯克利分校人工智慧系統中心創始人兼電腦科學專業教授 Stuart Russell,他的分享主題為「Probabilistic Programming」。未來到現場的 Stuart Russell 通過視訊分享的方式,與在場開發者分享了自己概率程式語言和人工智慧二者關聯研究方面的一些心得。
北京大學資訊科學技術學院軟體研究所副教授、北京大學元培學院 李戈
在 Stuart Russell 之後,北京大學資訊科學技術學院軟體研究所副教授、北京大學元培學院導師李戈上臺進行了演講。李戈是 AI 自動程式碼補全工具 aiXcoder 的專案負責人,他分享了程式分析和程式碼生成領域最近的發展。
在深度學習時代,自動程式碼生成方向有了很大進展。「在 aiXcoder 之上,我們希望能夠打造一個全部基於深度神經網路的程式碼引擎,」李戈說道。「程式碼的處理工具和對自然語言、影像等內容的處理引擎大有不同。」
李戈發現,深度學習在自然語言處理時的典型方式在於樹形結構解析,這個方式比傳統的 NLP 方法更加精準,並遵循這一思路開發了各種新興的神經網路。驗證了序列模型,圖神經網路模型等方法。這一方向的研究並不是一開始就顯露出巨大優勢的。「在 2017 年,有研究還拿非深度神經網路和深度神經網路的程式碼生成方法進行了對比,DL 優勢不大。」李戈說道。
深度學習興起之前,人們對於程式語言生成就有了不少思考。一些研究認為,我們完全可以使用已有程式來構造新的程式,但需要研究已有程式應被切割成多大的片段;另一方面,程式語言具有自然語言的特性,但你所定義的程式語言只能在定義之內才具有意義。
這些特性是處理程式語言時人們面臨的問題,也為深度學習處理程式帶來了有利的條件。把目光拉回到最近,2019 年有一篇論文《Maybe Deep Neural Networks are the Best Choice for Modeling Source Code》已經提出了一種開放詞彙神經語言模型,實現了一流的效能,甚至優於專門為程式碼建模而設計的 Hellendoorn 和 Devanbu 等最新方法。
「通過程式碼表徵模型和深度學習演算法,我們可以實現很多功能,」李戈說道。「計算機程式在未來或許可以理解程式碼內容,避免惡意程式碼的破壞。」
隨後,李戈展示了這一工具的優勢:因為 aiXcoder 可以進行整行的、連續的推薦,它類似於 Gmail 中的自動續寫,僅需寫一個開頭就可以進行補完。對比其他類似的工具,aiXcoder 僅需輸入 1/3 內容即可完成同樣任務。今年 3 月,aiXcoder 釋出了線上版本,使用者僅需下載一個外掛就可以在程式設計工作中使用它。現在這款工具已有註冊使用者 4 萬多人。
「不管是做研究還是做工具,我們的工作都是圍繞程式語言進行的。aiXcoder 的背後完全是神經網路,一切程式碼推薦都是由 AI 來完成的。」李戈說道。
Kaggle Competitions Grandmaster 沈濤
之後為大家分享的是 Kaggle Competitions Grandmster 沈濤。沈濤在 Kaggle 平臺上的排名是全球第八,共獲得過 10 塊金牌。同時他也是一位就職於騰訊 AI Lab 的醫療 AI 演算法工程師,曾代表騰訊獲得過醫療影像頂會 RSNA 2019 顱內出血檢測挑戰賽的冠軍。這一次挑戰賽的經歷和成果也是沈濤本次分享的重點。
在今年的 RSNA 上,RSNA 和 Kaggle 聯合推出了顱內出血檢測挑戰賽,任務是開發一個機器學習演算法來識別急性顱內出血及其亞型。從應用層面上說,這對於搶救腦出血病人和病情診斷等方面具有重要意義。
比賽的難點在於,要求所開發的演算法能夠在短時間內從超過 3 萬個病例的腦部 CT 影像中,找到顱內出血的病變規律,而且這些資料中還存在部分異常的「噪聲」標註資訊。
在解決本次的 CT 影像任務的過程中,除了 CNN 模型,團隊還使用了 Sequence Model,採用了多階段建模的方式來提升建模效果。在 Base CNN 階段,提取影像資訊;在 Sequence Model 1 階段,融合多張 CT slice 的空間特徵資訊;在 Sequence Model 2 階段,再次整合影像資訊、空間融合資訊以及影像原始資訊。
針對 CT 這種特殊影像資料,團隊設定了三種窗寬窗位,分別是 Brain window(40-80)、Subdural window(80-200)、Bone window(600-2800),組成了一種全新的「3 通道影像」進行輸入。在訓練過程中,團隊採取了 5 折交叉檢驗的策略,從不同的 StudyID 中隨機取樣,並使用迴圈學習率,從各個階段提取不同的特徵資訊。
最終,沈濤團隊依靠具備「多模型、多階段、多資訊」三個優勢的解決方案,獲得了挑戰賽的冠軍,這也是國內團隊的首次奪冠。
百度 AI 技術生態部高階技術經理 謝永康
百度 AI 技術生態部高階技術經理謝永康分享了了百度大腦開發平臺的一些應用實踐,飛槳、EasyDL 和 EasyEdge 都是百度大腦開發平臺中的產品,除了講解技術原理之外,謝永康也用視訊為開發者做了現場演示。
目前,百度大腦開放平臺最底層的是飛槳框架,在此之上是面向企業和個人開發者的 AI 開發者的 AI 開發者的 AI 開發平臺,包括 EasyDL 和 EasyEdge,在開放能力之上,是面向行業場景落地的各種方案和技術,包括面向企業服務、工業、農業等方向,以及面向私有計算的部署方案。目前,平臺已經發布了多達 228 項的能力,擁有了超過 150 萬的開發者。
謝永康位在場開發者介紹了四款飛槳開發套件:
ERNIE 是基於(英文)多工學習預訓練的框架,使用多工學習增量式構建預訓練任務,將詞法分析、情感分析典型任務的目標函式整合在一起,進行相互分享,從而得到整體效果的提升。
PADDLESEG 則是用於影像語義分割庫的開發套件,目前包含了 18 個預訓練模型,四大主流影像分割網路,在訓練速度 GPU 的利用率、視訊記憶體佔用等維度上明顯超過業內同類產品,可廣泛應用於工業智慧化領域、智慧影像處理以及像農業的地塊識別場景。
接下來是 PADDLEDETECTION,其主要用於端部署和端計算的優化,在訓練速度、訓練效果以及每秒的效果上面表現優秀,可廣泛應用在智慧交通、安防監控以及商品檢索等領域。
最後是基於分散式 CPU 訓練的 CTR 預估的模型 ELASTICCTR,它具備了全非同步的引數伺服器、流式訓練以及高效能 IO 這三個技術特點,可以廣泛應用在視訊、資訊排序和搜尋排序的場景當中。
在百度大腦的建設過程,基於行業需求的定製化 AI 模型和演算法也是一個重要問題。為此,百度大腦釋出了定製化模型訓練和服務平臺 EasyDL 和 EasyEdge。在 EasyDL 上,使用者所做的只是將資料上傳,幾乎不需要編寫任何一行程式碼,就可以獲得一個定製化的 AI 模型,去解決他們領域定製化的問題。目前,EasyDL 已經上線了經典版、專業版和行業版:經典版和專業版分別提供了定製化影像分類等六個能力方向,行業版則面向行業客戶,更加深入地結合行業業務場景去優化模型效果,以及提供對應的業務系統。
EasyEdge 同樣具有易上手、低門檻、廣適配、一站式體驗的產品特點。使用者能夠把已經在雲端、服務端用主流框架訓練好的模型,通過 EasyEdge 去進行面向端裝置的轉換、加速,並且最終提供可以直接部署在端裝置上的安裝包。
亞馬遜上海人工智慧研究院應用科學家 王敏捷
隨後演講的是亞馬遜上海人工智慧研究院應用科學家王敏捷,他也是著名開源人工智慧系統 MXNet、MinPy 和 DGL 的發起人及主要貢獻者,演講主題為「深度圖學習在人工智慧中的探索和研究」。
演講伊始,王敏捷首先闡釋了何為人工智慧,並以 AlphaGo 和 Alexa 語音助手為例說明了人工智慧在實際生活中的應用,並丟擲瞭如何衡量人腦與人工智慧的差距這一問題。隨後,王敏捷介紹了「深度圖學習」這一概念,即將深度學習放在圖上進行學習,並因此誕生一種新的圖神經網路。
他通過自制的圖表展示了近年來圖神經網路(Graph Neural Network,GNN)在機器學習領域的火爆程度:下圖左是 2014 年至 2018 年期間,GNN 論文發表數量的增長趨勢;圖右是關鍵詞的引用率,其中 GNN 在所有關鍵詞中增長幅度最大。之後,通過一個簡單的社交網路,王敏捷向大家解釋了圖神經網路的定義,即學習點/邊/圖的特徵。
接下來,王敏捷分別詳述了深度圖學習在分子醫藥、知識圖譜、推薦系統以及計算機視覺領域和自然語言處理五個領域的應用,並再次丟擲了一個問題:傳統深度學習框架對深度圖學習是否友好?答案是否定的,所以他們提出了專門面向深度圖學習的 DGL(Deep Graph Library)人工智慧框架。
演講的後半部分,王敏捷著重闡述了 DGL 的設計理念、系統架構和卓越的效能表現(支援各種訊息傳遞計算、支援各種訊息傳遞模式和適用於各類場景),並對 DGL 和其他面向深度圖學習的工具進行了對比。然後,他向大家展示了 DGL 的幾種程式設計體驗、異構圖支援、程式設計介面總結和系統優化(批處理訊息傳遞計算和融合訊息傳遞資訊)。
隨著演講進入尾聲,王敏捷向大家分別展示了開源專案 DGL 的成長簡史、在工業界和學術界的應用現狀、社群互動、效能評測和未來的計劃等多方面內容。
英偉達開發者社群經理 何琨
英偉達開發者社群經理何琨是下午的最後一位演講者,他的演講主題是英偉達深度學習推演加速引擎:TensorRT。
演講開始,何琨向大家展示了英偉達的開發工作內容,其中就包括的 TensorRT。他首先介紹了 TensorRT 是基於 GPU 的推理引擎,然後舉例說明完整深度學習解決方案或研發流程,包括樣本採集、模型訓練和模型部署三個階段,而 TensorRT 就服務於部署階段。
何琨表示,英偉達 TensorRT 是一種高效能深度學習推理優化器和執行時加速庫,可為深度學習推理應用程式低延遲和高吞吐量。這些都是 TensorRT 的優點。
接著,何琨向大家展示了 TensorRT 的工作流程,包括輸入一個預訓練的 FP32 模型和網路,輸出時自動優化出一個部署在 GPU 的推理引擎。他表示,在整個流程中不需要再次執行優化步驟。
在輸入訓練好的神經網路模型生成可執行推理引擎的過程中有五個步驟,分別是精度校準、層和張量融合、核心自動調整、動態張量記憶體和多流執行。何琨隨後向大家展示了 GoogleNet 中 Inception 結構、垂直融合(Vertical Fusion)、水平融合(Horizontal Fusion)和 Concat Elision 的網路層架構。
接著,何琨詳細說明了在實際場景中利用 TensorRT 構建網路和進行加速的八個步驟,分別是建立 Builder、建立 Network、建立 Parser、繫結輸入輸出以及自定義元件、序列化或反序列化、傳輸計算資料(host—>device)、執行計算和傳輸計算結果(device—>host)。其中,何琨還單獨講述了 TensorRT 的架構圖。
在人工智慧開發者工作坊之後,大會在 12 月 6 日晚上安排了時長為四個小時的黑客馬拉松挑戰賽,本場挑戰賽共設定了三個賽題,分別為「英偉達-基於輪式機器人 Jetbot 的深度學習方法體驗」、「AWS DGL 圖深度學習大賽」和「谷歌開發者社群智慧對話機器人:面向任務的單輪對話之命名實體識別大賽」,從不同應用場景出發,充分結合了工作坊演講內容與賽題發起方平臺工具,為開發者搭建了學習和實踐平臺。
近兩百名開發者參與了這場現場程式設計競技活動,最終三個賽場共決出 7 支獲獎隊伍,獲得了現金獎勵。
谷歌開發者機器學習方向專家孔曉泉 , 亞馬遜應用科學家王敏捷、甘全、周金晶,英偉達 GPU 應用市場總監侯宇濤 , 機器之心創始人、CEO 趙雲峰為獲獎團隊頒發獎金。