整理 | CTA 直播小分隊出品 | AI科技大本營(id:rgznai100)
杭州國際博覽中心,這裡曾經是二十國集團領導人第十一次峰會的主場館,5 月 26 日 CTA 核心技術與應用峰會(杭州)同樣在這裡正式召開!
正如 CSDN 谷磊總編在大會開幕詞中講到的,在過去 20 年時間裡,CSDN 見證了技術浪潮從 PC網際網路到移動網際網路、大資料、雲端計算、人工智慧、萬物互聯的發展階段,也見證了一代又一代開發者從優秀到卓越的心路歷程。在 CSDN 社群,大家開放共享的精神,成為後來者技術精進的階梯。
本次大會的指導單位工業和資訊化部人才交流中心的黨委副書記陳新,也在講話中特別提到數字經濟人才聚集區的人才建設問題,將聚焦人工智慧、大資料、雲端計算、物聯網、VR/AR等前沿技術。工信部人才交流中心將通過整合國內外專業資源,打造數字經濟人才學習交流、創新創業、合作共贏的平臺,為當地數字經濟產業的發展營造良好的產業發展生態。
隨後,大會就進入了全天的技術風暴中,來自阿里巴巴達摩院、騰訊音視訊實驗室、Hulu 研究院、騰訊優圖、滴滴、微博等科技公司的一線技術專家,帶來了當下最新的技術成果與解讀,為開發者在機器學習的研究與應用之路提供了深度、有價值的意見。接下來,就跟著營長一起回顧今天不可錯過的精彩內容。
華先勝:AI技術與應用成功的關鍵因素是創造價值
阿里達摩院城市大腦實驗室負責人華先勝指出,人工智慧技術發展“潑了一盆冷水”,然後指出 AI 技術和應用成功的關鍵因素是創造價值:錦上添花、雪中送炭、無中生有,最後是形成商業價值。
隨後,基於阿里在大規模AI應用場景的基礎,他從視覺智慧、視覺智造、視覺診斷和城市大腦四個層面具體講述了以機器視覺為主的技術應用案例。以視覺搜尋為例,其中的關鍵技術是特徵學習以及索引和搜尋系統,從其應用中得到啟發是視覺搜尋應該關注核心需求:技術至上vs應用先行、剛性需求vs錦上添花、使用者先行vs資料先行。
而視覺 智造的 主要應用有視覺編輯(比如廣告植入)、自動平面設計等。對此,他給出了實踐經驗:要創造一個需求(不只是來自設計師),只和行業頂尖高手合作,另外,要先關注剛性需求,而不是炫酷的技術,要用商業創新反哺技術創新。
最後,他總結了對人工智慧技術實踐的看法。第一,人工智慧發展 勢不可當 ,進展迅猛,侷限巨大,無行業不 AI;第二,不深入行業,就沒有深度的AI,AI+算力+資料等於價值,要首先看到價值到底是什麼;第三,人工智慧發展機會非常多,要用AI做人力所不能及的事情,要讓AI服務於人。
高孟平:音視訊領域應用落地廣泛,未來挑戰同樣艱鉅
騰訊音視訊實驗室專家研究員高孟平講述了騰訊音視訊實驗室的多模態機器學習技術在人眼視覺服務中的落地情況。他表示,在視訊服務裡有幾個重要的環節,如視訊理解、處理、編輯、質量評估。利用深度學習等AI技術、基於人眼視覺標準的端到端視訊處理平臺,在視訊理解、視訊處理、質量評估等三個方向有非常深入的研究。
隨後,高孟平從視訊、音訊、影像三方面分別講述了智慧封面的架構。關於未來的工作與挑戰,高孟平舉了兩個例子進行說明。一是 Semi-Reference Architecture,二是使用影像美學(Image Aesthetics)的通用模型,因為有些內容是無法用精彩視訊描述的,如QQ音樂、K歌等,沒有特定的動作。如果直接透過影像美學的評價,不用精彩視訊,或許也是一個好的解決辦法。
謝曉輝:推動 AI 認知,解決語義的鴻溝,需要藉助知識圖譜等技術
Hulu首席研究主管謝曉輝分享了視訊理解在個性化推薦與內容發現中的應用,內容涉及視訊理解在內容冷啟動、視訊精細化標籤和分組、深度推薦模型中的應用等。
隨後在 Panel 環節中他還提到,所有在 AI 領域深耕的人,包括 Hulu,都會發現語義的鴻溝仍然是一個非常具有挑戰性的問題,這最終還需要藉助知識圖譜等技術,來幫助整個AI認知取得新進展。
彭靖田:TensorFlow 2.0 力圖實現普惠 AI
谷歌機器學習專家彭靖田以《TensorFlow 2.0實現AI大眾化》為題進行了演講。他為大家分享到:TensorFlow 2.0 力圖打造易於上手、效能強勁和靈活通用的端到端機器學習平臺。通過 tf.keras 定義的高層次機器學習 API,使用者可以快速驗證模型效果、一鍵實現分散式訓練、跨平臺部署模型等。未來,TensorFlow 社群將持續提升使用者體驗,真正實現普惠 AI。
彭湃:讓 AI 更有溫度,“科技向善”也是使命之一
騰訊優圖實驗室高階研究員彭湃為大家講述了內容稽核工作中 AI CV演算法的實踐與應用。AI 出現之前內容稽核的方式都是人工稽核,人工稽核一百張違規照片需要 12 分鐘左右,如果是 AI,只需要 1 秒鐘。而 AI 稽核模型是通過深度卷積神經網路實現的,從實際業務場景中探索出雙模型級聯合結構——DeepEye。資料是核心彈藥,如何構建符合實際需要,價效比高的資料?採用主動學習機制進行資料積累,通過資料引擎挑選出值得標註的資料。
如何把網路模型 ResNet-152 變為 ResNet-50,效率提升 2 倍,精度損失降低於 1%?在效能優化工作中設計了 Deepsmart 高效模型,採用知識蒸餾兼顧大模型效果與小模型的效率,以及有助於提升模型魯棒性的資料擴增工作。20年後的今天,AI 帶來這麼多的技術的升級,“科技向善”也是 AI 的使命之一,我們 AI 從業者需要有更多的社會責任感和擔當,讓AI更有溫度,科技向善,以人為本。
謝迪:動態恆常性是深度學習模型優化和穩定性的核心
海康威視研究院前沿技術部負責人、資深演算法專家謝迪講述了團隊在完善機器學習流水線上的實踐,包括資訊生成(Annotation)、模型訓練(Train)以及部署(Deployment)。通過分析資訊初始化方法(即靜態恆常性和動態恆常性)的一些特點和優勢,可以得知:訓練一個真正的深度網路,批量標準化是必要條件;二動態恆常性相比靜態恆常性更為重要;三是相較於單個方向保持動態恆常性,在訓練時保持兩個方向同時保持動態恆常性,才是解決問題的關鍵;四是如果模型非常深,可能還需要顯示對傳播的訊號進行調控除錯。
最後,謝迪還總結了四點看法:一是在目前的深度學習框架中,模型對資訊生成方式是非常敏感的;二是需要找到超越Bounding Box的更加優雅的表示方式;三是訓練神經網路時,一個非常關鍵的因素是動態恆常性(Dynamic isometry ),它是深度學習模型優化和穩定性的核心;四是可能還需要顯式對傳播訊號進行調製。
齊彥傑:決定 Push 效果的背後機制——博文質量、演算法模型與分發效率
微博研發中心技術專家齊彥傑分享了微博基於機器學習在個性化 Push 任務中的實踐與應用。微博的 Push 任務有基於熱點、人物關係、地理區域、個性化資訊等多種型別,齊彥杰特別針對個性化 Push 場景下的技術實踐與應用、打通鏈路的關鍵技術做了詳細解讀。
4.6 億 MAU 的微博是如何進行使用者增長的?這不得不提個性化 Push 任務。而決定 Push 效果的背後機制則主要是博文質量、演算法模型與分發效率三方面。機器學習架構自底至上主要包括基礎資料、特徵工程、模型服務於排序策略四層。在此架構之後,還有一個重要的技術環節——構建推薦系統,最後,通過興趣、實時、關係與環境四個維度構建特徵體系,選擇擬合與使用者之間的關係模型,無論是早期的 LR 模型、還是 FM 模型、wide&deep 模型我們都進行過嘗試,而樣本數量在其中發揮著不可忽視的作用。
熊超:對話問答通過圖靈測試還有很長一段路要走
滴滴 AI Labs NLP 智慧對話團隊負責人熊超在分享中講到,對話問答領域面臨的最大的挑戰就是圖靈測試,目前的多輪對話能很好的回覆問題,但並不表示完全理解了使用者背後真正的意圖,想要順暢的解決特定領域的對話任務還需更長時間。
圓桌討論:AI 如何助力認知能力,提升業務水平?
數字化資訊時代,雖然所有行業都在進行數字資訊化,但是卻沒有將其真正利用。藉助深度學習的快速發展,現在大家開始試圖藉助 AI 技術理解真實世界。”如何利用 AI 演算法認知世界“就成為了核心問題。在本次 Panel 中,各位嘉賓就將圍繞這個核心問題,並結合實際的業務場景中,為大家分享 AI 技術如何賦能與真實落地場景?又面臨著哪些挑戰?
營長特意將圓桌討論中每位嘉賓的精彩觀點進行了摘錄:
謝曉輝: 所有在 AI 領域深耕的人,包括 Hulu,都會發現語義的鴻溝仍然是一個非常具有挑戰性的問題。做標籤會發現標籤距離最終產品想要的標籤,二者間語義的鴻溝很大的。最終都要藉助知識圖譜等技術,幫助整個 AI 認知取得下一步的進展。過去幾年,AI 像脫疆的野馬,快速奔跑,無論是否逼進峰值,技術的快速發展都給產業落地留下了廣闊空間,未來仍大有可為!
齊彥傑: 推薦系統構建於認知層之上。如何基於多模態資訊理解使用者是當下的一個挑戰。業內現在不僅會分析文字內容,影像內容,視訊內容理解也成為技術熱點。當前技術飛速發展,技術團隊需要隨著發展做出調整,提高效率,讓技術更好地落地。同時,需要知道自身資料和哪些新技術契合,才能夠更高效的提升自己的業務,不被淹沒在新技術的海洋之中。
高孟平: 我的業務中更多的關注於視訊本身的理解,如標籤或者高階語義的理解。技術進展也推動了應用的發展,提供了問題的解決方案,但是很多仍存在挑戰,還有很多無法解決,如質量評估。我們的解決的思路是:先定位問題,然後尋找 AI 的解決方法,最後通過業務利用客觀指標反映技術的提升效果。如果只是在某個領域裡不斷重新整理指標,反而可能錯失新領域的應用機會。
熊超: 我們現在做的是智慧客服,在對話問答領域面臨的最大的挑戰就是圖靈測試,尤其是在對話非常豐富的情況下,更是一項艱鉅的任務。能很好的回覆問題,但並不表示完全理解了使用者背後真正的意圖。其次,想要順暢的解決特定領域的對話任務還需要一個質的飛躍,也許幾年、十年甚至更長的時間。
彭湃: 首先,內容稽核業務面臨的一個非常大的挑戰就是:不同的客戶,因其業務的形態不同,需要過濾的規則邊界也會有所差異。其次,從 To C 產品到現在助力產業網際網路,會服務不同的產業客戶、面臨不同的需求,而這些是否都是 AI 可以解決的問題,是需要思考的。20年後的今天,AI 帶來這麼多的技術的升級,"科技向善"也是 AI 的使命之一,我們AI從業者需要有更多的社會責任感和擔當,讓AI更有溫度,科技向善,以人為本。
正如謝曉輝所總結的:“未來,機器學習技術仍具有廣闊的空間,大有可為”,這並不是一句簡單的鼓舞人心的話語,而是在各行業技術專家、各行業的技術落地等綜合考量下,深入機器學習領域本身,對未來給予的厚望。今日暴露的短板正是明日奮勇前進的方向,也更是證明了,作為中國開發者,我們想做的、能做的還很多!
最後,再次奉上本次大會官方連結,一鍵獲取大會活動詳情及部分嘉賓演講PPT:
https://bss.csdn.net/m/topic/cta_meet/index#