京東雲與AI 10 篇論文被AAAI 2020 收錄,京東科技實力亮相世界舞臺
美國時間2月7-12日,AAAI 2020大會在紐約正式拉開序幕,AAAI作為全球人工智慧領域的頂級學術會議,每年評審並收錄來自全球最頂尖的學術論文,這些學術研究引領著技術的趨勢和未來。
京東雲與AI在本次大會上有10篇論文被AAAI收錄,涉及自然語言處理、計算機視覺、機器學習等領域
,充分展現了京東用技術驅動公司成長的發展模式以及技術實力,技術創新和應用落地也成為這些論文最吸引行業關注的亮點。
本屆會議共收到的有效論文投稿超過8800篇,其中7737 篇論文進入評審環節,最終錄取數量為1591篇,錄取率為20.6%。京東雲與AI共有10篇論文入選AAAI 2020,研究領域涵蓋人臉識別、人臉解析、機器閱讀理解、文字生成、對抗樣本與模型魯棒性、智慧城市等前沿的技術研究領域,這些能力目前已在市政安防、實體零售、智慧客服等業務場景下規模化落地,未來京東雲與AI作為值得信賴的智慧技術提供者,會持續進行技術與業務融合的探索,這些落地的技術能力也將迎來更加廣闊的應用前景。
以下是京東雲與AI此次入選10篇論文:
對抗樣本與模型魯棒性研究
1. 基於Frank-Wolfe框架的高效對抗攻擊演算法A Frank-Wolfe Framework for Efficient and Effective Adversarial Attacks
論文連結:
;
根據模型攻擊者可獲取的資訊量來區分,對抗樣本攻擊可分為白盒與黑盒兩種攻擊形式。雖然基於最佳化的攻擊演算法如PGD等可以在白盒攻擊情況下獲得較高的攻擊成功率,但它們生成的對抗樣本往往有著較高的失真度。此外,它們相應的黑盒攻擊演算法通常查詢效率較差,需要對被攻擊的黑盒模型訪問非常多次才能實現攻擊,從而大幅限制了它們的實用性。針對這一問題,京東、弗吉尼亞大學和加州大學洛杉磯分校合作提出了一種基於Frank-Wolfe框架的高效對抗攻擊演算法,可靈活運用於白盒和黑盒對抗樣本攻擊。
作者從理論上證明了所提的攻擊演算法具有的收斂速率,並在ImageNet和MNIST資料集上驗證了所提出演算法的效能。對比所有參評的白盒與黑盒攻擊基準演算法,本文提出的演算法在攻擊成功率,攻擊時間和查詢效率上均顯著佔優。
2. 透過對抗樣本評估序列到序列模型魯棒性Seq2Sick: Evaluating the Robustness of Sequence-to-Sequence Models with Adversarial Examples
論文連結:
;
利用對抗樣本攻擊的難易度來評估深度神經網路的魯棒性已成為業界常用的方法之一。然而,大多數現有的對抗攻擊演算法都集中在基於卷積神經網路的影像分類問題上,因為它的輸入空間連續且輸出空間有限,便於實現對抗樣本攻擊。在本文中,來自京東、加州大學洛杉磯分校和IBM研究院的研究者們探索了一個更加困難的問題,即如何攻擊基於迴圈神經網路的序列到序列(Sequence to Sequence)模型。這一模型的輸入是離散的文字字串,而輸出的可能取值則幾乎是無窮的,因此難以設計對抗攻擊方案,在本文之前也未被成功攻破過。為了解決離散輸入空間帶來的挑戰,研究者們提出了結合group lasso和梯度正則化的投影梯度方法。針對近乎無限輸出空間帶來的問題,他們也設計了一些全新的損失函式來實現兩種新的攻擊方式:(1) 非重疊攻擊,即保證模型被攻擊後的輸出語句與正常情況下的輸出語句不存在任何重合,(2)目標關鍵詞攻擊,即給定任意一組關鍵詞,保證模型被攻擊後的輸出語句包含這些關鍵詞。
最終,研究者們將演算法應用於序列到序列模型常用的兩大任務機器翻譯和文字摘要中,發現透過對輸入文字做輕微的改動,即可以顯著改變序列到序列模型的輸出,成功實現了對抗樣本攻擊。同時,研究者們也指出,雖然攻擊取得了成功,但與基於卷積神經網路的分類模型相比,序列到序列模型的對抗攻擊難度更大,且對抗樣本更容易被發現,因此從對抗攻擊的角度進行衡量,序列到序列模型是一種魯棒性更優的模型。
機器閱讀理解
3.多跳多文件閱讀理解研究
Select, Answer and Explain: Interpretable Multi-hop Reading Comprehension over Multiple Documents
論文連結:
;
可解釋的對多文件多跳閱讀理解(RC)是一個具有挑戰性的問題,因為它需要對多個資訊源進行推理並透過提供支援證據來解釋答案預測。《Select, Answer and Explain: Interpretable Multi-hop Reading Comprehension over Multiple Documents》論文中提出了一種可解釋的多跳多文件閱讀理解的方法,透過設計一個有效的文件篩選模組和基於圖神經網路的推理模組,針對給定問題可以同時準確的找出問題的答案以及支援答案的證據。
文字生成
4.基於要素感知的多模態電商商品摘要Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products
論文連結:
;
《Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products》論文中提出了一個基於商品要素的多模態商品資訊自動摘要系統,其可以根據商品的文字描述和商品圖片自動生成商品營銷短文。商品的外觀決定了使用者對該商品的第一印象,商品的功能屬性最終決定了使用者的購買行為,論文提出的多模態商品資訊自動摘要系統可以有效的整合商品的外觀和功能資訊,自動捕捉到該商品的特色賣點,併為其生成一段簡短的營銷短文。不同的使用者關注的商品要素往往是不同的,比如冰箱的“能耗”和”容量”,手機的“記憶體”和“螢幕”。系統以商品要素為切入點,挖掘商品最有賣點的商品要素,並從商品要素維度控制輸出文字的資訊冗餘度、可讀性和對輸入資訊的忠實度,最終生成一段簡潔凝練、賣點突出、流暢、合規的商品營銷短文,以期待引起潛在購買者的共鳴。
5.基於關鍵詞指導的生成式句子摘要Keywords-Guided Abstractive Sentence Summarization
論文連結:
;
《Keywords-Guided Abstractive Sentence Summarization》論文中提出了一種文字摘要的新方法,即利用輸入文字的關鍵詞資訊提高了文字摘要模型的質量。論文模擬了人類生成摘要的過程:當人類為某一段文字生成摘要時,首先會對該文字進行閱讀,並識別出裡面的關鍵詞,進而透過創作加工,將這些關鍵詞以流暢的語言表達出來。另外,文字摘要和文字關鍵詞抽取在本質上是相通的,即都是在輸入文字中提取關鍵資訊,僅僅是輸出的形式有所差異。基於上述思考,論文提出一個多工學習框架,透過一個共享的編碼器,互相強化文字摘要和關鍵詞抽取任務。在解碼器生成摘要時,利用關鍵詞的資訊和原始輸入文字進行互動,透過雙重注意力和雙重複製機制,在關鍵詞的指導下,為輸入文字生成摘要。
6.基於多模態資訊指導的多模態摘要Multimodal Summarization with Guidance of Multimodal Reference
論文連結:
;
論文《Multimodal Summarization with Guidance of Multimodal Reference》提出了一種基於多模態資訊監督的多模態自動摘要模型,該模型以文字和圖片作為輸入,生成圖文並茂的摘要。傳統的多模態自動摘要模型在訓練過程中,往往以文字參考摘要的極大似然損失作為目標函式,然後利用注意力機制來挑選與文字相對應的圖片。這種做法容易帶來模態偏差的問題,即模型會傾向於最佳化文字生成的質量而忽視了圖片挑選的質量。論文提出的模型最佳化了多模態摘要模型的目標函式,即在文字參考摘要的損失函式的基礎上增加了圖片參考摘要的損失函式。實驗發現,在引入了多模態資訊監督訓練後,多模態自動摘要模型的圖片挑選質量得到了顯著的改善,文字生成質量也有所改進,從而可以生成更高質量的圖文摘要。
7.文字到SQL的生成研究
Zero-shot Text-to-SQL Learning with Auxiliary Task
論文連結:
;
近年來,在Text-to-SQL任務中使用神經Seq2Seq模型取得了巨大的成功。但是,很少有研究關注這些模型如何推廣到實際不可見資料中。論文《Zero-shot Text-to-SQL Learning with Auxiliary Task》透過設計一個有效的輔助任務支援模型以及生成任務的正則化項,以增加模型的泛化能力。透過在大型文字到SQL資料集WikiSQL上實驗評估模型,與強大的基線粗到精模型相比,論文中打造的模型在整個資料集上的絕對精度比基線提高了3%以上。在WikiSQL的Zero-shot子集測試中,這一模型在基線上獲得了5%的絕對準確度增益,清楚地證明了其卓越的通用性。
智慧城市研究
8.車站潛在客流的智慧化預測Potential Passenger Flow Prediction: A Novel Study for Urban Transportation Development
論文連結:
;
隨著城市人口的增多和城市化的不斷髮展,公共交通工具如地鐵正在發揮著越來越重要的作用。為了讓地鐵能夠發揮更大的作用,方便人們出行,需要精準預測每個車站在未來的潛在客流量,從而為地鐵站的選址和建設規模提供建議。針對這一問題,京東和悉尼科技大學的研究者們合作提出了一種多檢視區域性相關性學習方法。其核心思想是利用自適應權重來了解目標區域及其區域性區域之間的客流相關性,並透過嵌入一些領域知識到多檢視學習過程中的方法來綜合提升對潛在客流的預測準確性。
文中透過大量的實驗結果表明,相比於一些其他預測演算法,論文中提出的方法取得了顯著更優的預測準確性,可以為車站規劃和城市智慧化建設提供更為有力的保障。此外,文中所提的思路也對解決推薦系統中的冷啟動問題提供了一定的借鑑意義。
人臉識別
9.基於分錯特徵引導的損失函式
Mis-classified Vector Guided Softmax Loss for Face Recognition
論文連結:
;
在人臉識別領域,各個場景下的應用對演算法能力提出了更高的要求。人臉識別的規模已從原來的千人、萬人級增大到百萬人甚至千萬人。目前研究面臨的一大挑戰是在識別規模越來越大的場景下,如何在較低的誤識率的同時保持識別透過率。現有的人臉識別主流訓練演算法主要歸類為margin-based和mining-based兩大類,但都存在各自的方法上的缺陷。論文《Mis-classified Vector Guided Softmax Loss for Face Recognition》就針對如何讓模型學習得到判別能力更優秀的人臉特徵,研究了一種新的人臉識別訓練演算法,利用論文中提出的Mis-classified Vector Guided Softmax,能夠同時最佳化現有方法存在的缺陷,並且幫助識別網路在訓練過程中獲得更有針對性的難例強調,實現更據鑑別能力的模型訓練。論文的方法在目前多個公開人臉識別測試集上驗證了有效性,並且識別精度超過了現有的方法。
人臉解析
10.資料庫和一種邊緣感知的語義分割方法
A New Dataset and Boundary-Attention Semantic Segmentation for Face Parsing
論文連結:
;
近年來,人臉解析因其潛在的應用價值而受到了越來越多的關注。論文《A New Dataset and Boundary-Attention Semantic Segmentation for Face Parsing》從人臉解析領域存在的問題出發,在資料和演算法兩個方面做出了貢獻。首先,論文提出了一種高效的畫素級的人臉解析資料標註框架,該框架極大的降低了資料的標註難度,使他們在短時間內構建了一個大規模的人臉解析資料集(LaPa)。該資料集包含了超過22,000張人臉圖片,且覆蓋了多種姿態、光照和表情變化。同時,本文還提出了一種有效的邊界注意力的語義分割方法(BASS),該方法從網路結構和損失函式兩方面著手,充分利用影像的邊界資訊來提升語義分割精度,論文中設計了大量的實驗來驗證該方法的有效性,同時該方法取得了公開資料集Helen上SO他的效能。
從這些前沿的研究成果不難看出, 京東雲與AI正致力於將語音語義、計算機視覺、機器學習等技術在商品推薦、實體零售等領域持續落地應用,不僅注重技術的先進性,更注重應用的可信賴 。一直以來京東雲與AI致力於踐行可信賴的AI,“可信賴的AI”不是口號,也不僅僅是價值觀層面。它有六個維度,公平、魯棒性、價值對齊、可複製、可解釋和負責任,此次入選論文中就包含著對“對抗樣本與模型魯棒性”的研究。一面是對技術的巨大挑戰,一面是人文精神,成為最值得信賴的智慧技術提供者正是京東雲與AI執著追求的社會責任與價值體現。
2019年8月,以NeuHub京東人工智慧開放平臺為載體,京東入選智慧供應鏈國家人工智慧開放平臺,依託這一平臺的技術積累,京東雲與AI在疫情期間快速推出應急資源資訊釋出平臺,上線半個月時間即幫助湖北、武漢及其他疫情波及地區供應醫療類、消毒類、生活類等各類救援物資超過2.6億件,供應藥品超過4億盒。其中包含各類口罩1.5億隻、護目鏡40.6萬個、防護服鞋套283.72萬套等抗疫必需品;基於京東雲與AI領先的語音語義技術研發的智慧疫情助理,已在北京、山東、安徽、江蘇、江西、四川等地的十多個行業、一千餘家組織和機構中快速落地,免費提供疫情諮詢服務,累計服務諮詢數量達數百萬條。切實讓民眾在疫情這一特殊時期感受到技術帶來的溫暖和便利。
2019年,京東在雲、AI、IoT等技術領域和業務的探索完成了京東雲與AI在ABCDE技術戰略的佈局。這個戰略是我們技術上深度融合,融合AI(人工智慧)、Big Data(大資料)、Cloud(雲端計算)、Devices(IoT)和Exploration(前沿探索)對外賦能,為產業融合、科技創新,提供最堅實、最前沿、最可信賴的基礎設施和服務。
京東雲與AI總裁、京東集團技術委員會主席周伯文博士表示,京東技術戰略“ABCDE”的本質是促進技術融合帶來的價值疊加,透過前沿技術的研發,與行業Know-how進一步緊密結合,與合作伙伴一道共建良好的技術合作生態,並時刻要以用例為中心,用京東雲與AI的技術積累對外賦能,解決真實場景問題,以最終實現面向社會創造更多價值。
如何進行技術和產業的融合一直是AI行業和企業關注的重點。
2020年,京東雲與AI作為“技術輸出”的先行者,他的身影還將在更多的全球頂級學術、科技大會上出現,並持續深耕技術與實體經濟的融合,探索技術的邊界與應用價值,推動產學研用的一體化建設
。京東雲與AI也將繼續用紮實的技術積累對外賦能,與社會各界共同創造並見證雲智聯世界、產業網際網路蓬勃發展的新時代!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69912185/viewspace-2675962/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 京東科技集團21篇論文高票入選國際頂會AAAI 2021AI
- 京東城市6篇論文被KDD2019收錄,展示AI和大資料在智慧城市的落地應用AI大資料
- 實錘!購自京東的茅臺確屬假貨 京東:被掉包
- 百度15篇論文被AAAI 2019收錄AI
- 【相聚東京】綠盟科技亮相PacSec大會
- 京東被約談整改的原因 京東被約談整改怎麼回事?
- 京東智聯雲4篇論文入選國際語音頂級大會Interspeech 2020
- 京東智聯雲亮相KubeCon 2020 探尋雲原生技術發展之路
- 亮劍INTERSPEECH 2020,思必馳10篇論文被收錄
- 京東雲開發者|提高IT運維效率,深度解讀京東雲AIOps落地實踐運維AI
- 京東短網址高可用提升最佳實踐 | 京東雲技術團隊
- 茅臺回應“京東假茅臺風波”:信任劉強東 京東能查明真相
- 探尋京東雲核心競爭力的源泉
- 京東雲Kubernetes叢集最佳實踐
- 2024.09.14 京東
- AI主播“小可”亮相,分享京東11.11全方位技術保障AI
- 京東APP百億級商品與車關係資料檢索實踐 | 京東雲技術團隊APP
- 京東物流財報:2022年京東物流營收1374億 同比增長31.2%營收
- 京東數科:2020年京東區塊鏈技術實踐白皮書(附下載)區塊鏈
- 京東雲“殺”出來了
- 618京東到家APP-門詳頁反爬實戰 | 京東雲技術團隊APP
- 京東科技風格 NutUI 釋出了UI
- 京東金融科技學堂開班,AI 在金融雲上有了新成果AI
- 京東金融更名懸念揭開,京東數字科技將成為母公司
- 京東雲開發者|京東雲RDS資料遷移常見場景攻略
- 京東商品詳情介面,京東商品優惠券介面,京東商品分析資料介面,京東API介面封裝程式碼API封裝
- 乾貨 | 京東雲部署Wordpress最佳實踐
- 京東教育:2019年度京東教育白皮書
- 京東:2020青年消費資料
- 糟糕,被SimpleDateFormat坑到啦!| 京東雲技術團隊ORM
- 【京東】【京東雲】【北京】邊緣計算資深測試開發工程師工程師
- 新基建下區塊鏈雲服務再升級,京東數科與京東智聯雲聯合釋出雲版BaaS平臺區塊鏈
- 京東數科與螞蟻科技的IPO競賽
- 京東掃描平臺EOS—JS掃描落地與實踐JS
- 京東科技設計稿轉程式碼平臺介紹
- 京東技術中臺的Flutter實踐之路Flutter
- 京東技術中臺Flutter實踐之路(二)Flutter
- 京東丁俊:京東分散式K-V儲存設計與挑戰分散式