CCAI 2020 | 塗威威:AI發展、監管處於動態博弈狀態

AIBigbull2050發表於2020-08-13


2020-08-08 16:58:17

CCAI 2020 | 塗威威:AI發展、監管處於動態博弈狀態

CCAI2020年8月29日-30日

2020年中國人工智慧大會(Chinese Congress on Artificial Intelligence 2020,簡稱“CCAI 2020”)將於8月29日-30日在南京召開。CCAI 2020以“智周萬物”為主題,探討人工智慧作為引領未來的戰略性技術,如何以周知萬物的學術境界賦能未來,帶動時代發展,實現互聯世界的遠大理想。

第四正規化副總裁、主任科學家塗威威將出席本次大會並擔任《智慧防疫專題論壇》論壇主#席。

塗威威:在大規模分散式機器學習系統架構、大規模機器學習演算法設計和應用、線上營銷系統方面有深厚積累。塗威威曾在百度鳳巢從事計算廣告相關工作,設計開發了百度機器學習計算框架ELF。目前就職於第四正規化,是第四正規化先知平臺獨有的大規模分散式機器學習框架 GDBT 的設計者,將 AutoML 及遷移學習應用到工業界並取得顯著的效果提升。塗威威在AAAI、IJCAI、KDD、ICML、NeurIPS、ICLR等會議及其工作會議上發表數十篇論文。塗威威也是NeurIPS 2018 AutoML比賽負責人、PAKDD 2018/2019比賽主席、PRICAI 2018 AutoML Workshop主席,IJCNN 2019 AutoCV比賽組織者,NeurIPS 2019 AutoDL比賽主要組織者,KDD Cup 首屆以及第二屆AutoML比賽負責人,WAIC 2019 AutoNLP比賽負責人,ACML 2019 AutoSpeech以及AutoWSL比賽負責人,IEEE TPAMI首個AutoML特刊創辦人,NeurIPS 2019 CiML Workshop主席, NeurIPS 2019 / ICML 2020 / NeurIPS 2020 New In ML組織導師,ChaLearn理事會核心成員。

在日常生活場景,AI細分技術領域應用速度不斷加快,在推動能源、交通、建築、醫療等行業轉型升級過程中起到的作用日益突顯;在疫情防控工作中,AI技術應用可以準確掌握疫情發展動態,對疫情的影響進行預演判斷。

值得注意的是,在應用過程中,AI技術的不足之處、軟硬體之間融合應用存在裂縫等問題也隨之暴露。由濫用AI技術所引發的個人隱私資料洩露等問題,也引發了業界的擔憂。

《每日經濟新聞》記者(以下簡稱“NBD”)專訪AI獨角獸企業第四正規化主任科學家塗威威,其談及了AI資料保護等問題。塗威威表示,AI的發展和監管處於動態博弈的狀態,無論是治理和資料保護都是為了更好的發展。能夠平衡兩者關係,制定AI治理規則及資料保護的法律,才能更好引領AI行業的發展,掌握競爭主動權。

CCAI 2020 | 塗威威:AI發展、監管處於動態博弈狀態

資料質量決定AI價值 隱私保護成本仍存挑戰

NBD:資料對AI技術的重要性何在?

塗威威:AI三要素是資料、演算法、算力。對於任何企業,打牢資料基礎都非常關鍵。AI真正核心是從資料中發掘更多業務規律和價值。在演算法、算力的支援下,資料的數量、質量決定AI價值。

NBD:目前,AI企業在資料安全建設方面面臨什麼問題?

塗威威:對於多數大眾以及企業而言,資料隱私保護是複雜又龐大的工程。技術層面面臨兩方面的挑戰:在效果方面,需要讓資料安全、使用者隱私得到相同保護強度,並且提出更有效的演算法,解決應用場景問題;在成本方面,機器學習、隱私保護技術複雜程度高,技術環節仍需要較多專家介入到資料預處理、特徵工程、模型調參當中,這也加大了人工接觸資料的機會,理論上增加洩露隱私風險。

NBD:在保護資料安全方面,有哪些探索路徑?

塗威威:為了更好的實現資料保護,我認為企業需要從技術、標準兩方面發力。在技術層面,我們在隱私技術方面的工作主要為差分隱私、隱私保護的遷移學習技術等。

此外,我們研究出自動多方機器學習技術。讓機器自動完成資料預處理、特徵工程、模型調參等工作。大幅減少了專家人工的介入,提升安全性的同時,也大幅降低了隱私保護技術的使用門檻,並與多方機構開展了深度合作。不過,以差分隱私技術為代表的隱私保護技術與自動機器學習相結合還需要解決很多問題。例如,如何在保護隱私的同時保證自動機器學習的效果與效率、如何有效自動分配隱私預算等。

在標準方面,我們此前透過GDPR認證。也希望在資料隱私保護方面探索更多國際交流、合作空間。

線上資料持續攀升 資料保護要求更高

NBD:疫情期間,AI技術發揮出哪些作用?

塗威威:在疫情防控工作中,關鍵在於及時發現高風險人群與超級傳染者,準確掌握疫情發展動態並就不同政策對疫情的影響進行預演判斷,以及更快速地追溯到病毒的傳播路徑,提高政府部門的防控效率。

之前,我們聯合高校研究所、醫療機構臨床專家,研發出基於AI的智慧疫情防控方案投入應用。主要包含三部分:一是利用AI技術豐富現有的防控篩查規則模型,精準篩查高風險易感人群,進行精準防控;二是構建了更接近實際情況的可學習的省、市、區、縣級數字孿生系統,實時預演分析疫情發展,做出拐點的預測;三是利用AI技術構建疫情溯源系統,快速追溯傳染路徑。

NBD:疫情下,AI應用場景有哪些新突破?

塗威威:疫情帶來最大的變化就是企業線上化程度加深。線上化不是簡單把貨品從線下搬到線上,而是對經營行為進行數字化行為、智慧化服務。需要透過智慧推薦、智慧搜尋、智慧推送、智慧客服等AI技術引擎,幫助企業多快好省地實現線上化智慧運營,解決流量暴漲帶來的消費者體驗和資源調配最佳化等問題,開闢線上化發展新局面。

NBD:這給企業帶來了哪些新思考?

塗威威:這次疫情中,我們服務的大型零售企業都在思考兩方面的內容:一是解決突然增長的線上訂單壓力;二是思考怎樣把線上客戶轉為私域流量。

為了幫助企業應對突然爆發的線上需求,AI企業也需要提供線上化、智慧化的精細化運營能力,幫助零售、金融、製造等傳統行業擁抱數字化革新、把握線上發展新機遇。未來,線上使用者、商品服務組合、使用者線上積累資料會不斷攀升。同時,也意味著對使用者隱私保護的技術提出了更高的要求。

資料保護制定權或成未來競爭方向

NBD:業界認為,AI治理規則及資料保護制定權至關重要,您怎樣看待?

塗威威:資料應用隱私問題一直備受關注。2018年,“史上最嚴個人資料保護法”歐盟GDPR強制執行。2019年初,谷歌因違反GDPR條例被法國資料保護監管機構處以5000萬歐元罰款。

GDPR之後,各個國家、地區重點加大了隱私保護關注力度,並透過立法等方式進行有效干預。2020年1月,加州消費者隱私法案(CCPA)生效。3月6日,國內《個人資訊保安規範》正式釋出,在現有《網路安全法》的基礎上,積極推動《資料安全法》、《個人資訊保護法》等,進一步加強隱私保護的力度。

因而,資料是AI的基石,保護隱私是AI落地的必要條件,AI治理規則、資料保護的制定權將成為未來競爭的方向。

NBD:此前有APP收集人臉資訊,如何面對資料帶來的倫理道德挑戰?

塗威威:對於企業來說,直接收集資料是成本最低,效率最高的方式。例如,網際網路金融行業,企業透過買第三方資料判定信用等級,成本極其低。但這種方式存在侵權風險。

除了提高資料隱私保護意識和技術解決能力之外,目前,國家不斷完善資料隱私保護層面的法律法規制定。相關行業標準也在制定中,其中包括了操作流程及規範、人員管理、技術選型等方面。

NBD:對於行業未來的發展,您還有何建議?

塗威威:AI的本質在於能更有效、更精細化地挖掘資料的價值,而挖掘資料的同時,伴隨著洩露隱私的風險。然而,以往常用的加密及普通的匿名化手段並不能完全保證資料安全,攻擊者還可以對分析結果的差分攻擊以及查表撞庫等方法反推原資料。

隱私保護這場風暴仍在席捲全球科技行業,國際及國內在資料合規方面的整體意識不斷增強。AI企業在隱私保護和資料安全這條道路上並沒有什麼捷徑可走,AI企業必須靜下心來做好產品和技術本身。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2711248/,如需轉載,請註明出處,否則將追究法律責任。

相關文章