騰訊AI Lab多篇論文入選CVPR、ACL及ICML等頂級會議(附論文下載)

AI科技大本營發表於2017-07-19

騰訊AI Lab微信公眾號今日釋出了其第一條訊息,宣佈騰訊AI Lab多篇論文入選即將開幕的CVPR、ACL及ICML等頂級會議。

在AI科技大本營公眾號會話中輸入“騰訊”,打包下載騰訊AI Lab入選CVPR、ACL及ICML的論文。

騰訊AI實驗室授權轉載


1. CVPR

IEEE Conference on Computer Vision and Pattern Recognition

IEEE國際計算機視覺與模式識別會議

7月21日 - 26日 | 美國夏威夷

CVPR是近十年來計算機視覺領域全球最有影響力、內容最全面的頂級學術會議,由全球最大的非營利性專業技術學會IEEE(電氣和電子工程師協會)主辦。2017谷歌學術指標(Google Scholar)按論文引用率排名, CVPR位列計算機視覺領域榜首。今年CVPR稽核了2620篇文章,最終收錄783篇,錄取率29%,口頭報告錄取率僅2.65%。

騰訊AI Lab計算機視覺總監劉威博士介紹到,“CVPR的口頭報告一般是當年最前沿的研究課題,在學界和工業界都影響很大,每年都集齊如史丹佛大學和谷歌等全球最知名高校和科技公司。”

騰訊AI Lab六篇論文入選CVPR

論文一:Real Time Neural Style Transfer for Videos

本文用深度前向卷積神經網路探索視訊藝術風格的快速遷移,提出了一種全新兩幀協同訓練機制,能保持視訊時域一致性並消除閃爍跳動瑕疵,確保視訊風格遷移實時、高質、高效完成。

* 此論文後附詳細解析

論文二:WSISA: Making Survival Prediction from Whole Slide Histopathological Images

論文首次提出一種全尺寸、無標註、基於病理圖片的病人生存有效預測方法WSISA,在肺癌和腦癌兩類癌症的三個不同資料庫上效能均超出基於小塊影象方法,有力支援大資料時代的精準個性化醫療。

論文三:SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning

針對影象描述生成任務,SCA-CNN基於卷積網路的多層特徵來動態生成文字描述,進而建模文字生成過程中空間及通道上的注意力模型。

論文四:Deep Self-Taught Learning for Weakly Supervised Object Localization

本文提出依靠檢測器自身不斷改進訓練樣本質量,不斷增強檢測器效能的一種全新方法,破解弱監督目標檢測問題中訓練樣本質量低的瓶頸。

論文五:Diverse Image Annotation

本文提出了一種新的自動影象標註目標,即用少量多樣性標籤表達儘量多的影象資訊,該目標充分利用標籤之間的語義關係,使得自動標註結果與人類標註更加接近。

論文六:Exploiting Symmetry and/or Manhattan Properties for 3D Object Structure Estimation from Single and Multiple Images

基於曼哈頓結構與對稱資訊,文中提出了單張影象三維重建及多張影象Structure from Motion三維重建的新方法。


CVPR重點論文解析

CVPR選中的六篇文章,我們將重點解析《視訊的實時神經風格遷移》(Real-Time Neural Style Transfer for Videos)[1]這篇頗具創新的文章。

在過去很長一段時間內,業界流行的影象濾鏡通常只是對全域性顏色屬性的調整,比如亮度、色相、飽和度等。在2016年的CVPR,Gatys等人[2]首創性地提出將深度神經網路應用於影象的藝術風格遷移,使得輸入影象能夠模仿如梵高的星空、莫奈的日出印象等任何型別的藝術風格,效果驚豔。

Gatys等人工作雖然取得了非常好的效果,但是缺點是基於優化,非常耗時;到2016 ECCV時,Johnson等人[3]提出了使用深度前向神經網路替代優化過程,實現了實時的影象風格遷移,修圖工具Prisma隨之風靡一時。但直接將影象風格遷移的方法應用到視訊上,卻會使得原本連貫的視訊內容在不同幀中轉化為不一致的風格,造成視訊的閃爍跳動,嚴重影響觀感體驗。為了解決閃爍問題,Ruder等人[4]加入了對時域一致性的考慮,提出了一種基於優化的視訊藝術濾鏡方法,但速度極慢遠遠達不到實時。


騰訊AI Lab多篇論文入選CVPR、ACL及ICML等頂級會議(附論文下載)


騰訊AI Lab科學家使用深度前向卷積神經網路,探索視訊藝術風格快速遷移的可能,提出了一種全新的兩幀協同訓練機制,保持了視訊時域一致性,消除了閃爍跳動瑕疵,同時保證視訊風格遷移能夠實時完成,兼顧了視訊風格轉換的高質量與高效率。


視訊藝術濾鏡模型如下圖所示。通過損失網路(Loss Network)計算連續兩個輸入視訊幀之間的損失來訓練風格變換網路(Stylizing Network)。其中空間損失(Spatial Loss)同時描述了影象的內容損失以及風格損失;時間損失(Temporal Loss)描述了兩個風格變換後的視訊幀之間的時間一致性。


騰訊AI Lab多篇論文入選CVPR、ACL及ICML等頂級會議(附論文下載)


文章相關論文

[1] Haozhi Huang, Hao Wang, Wenhan Luo, Lin Ma, Wenhao Jiang, Xiaolong Zhu, Zhifeng Li, and Wei Liu. Real-Time Neural Style Transfer for Videos. CVPR, 2017.

[2] L. A. Gatys, A. S. Ecker, and M. Bethge. Image style transfer using convolutional neural networks. CVPR, 2016.

[3] J. Johnson, A. Alahi, and L. Fei-Fei. Perceptual losses for real-time style transfer and super-resolution. ECCV, 2016.

[4] M. Ruder, A. Dosovitskiy, and T. Brox. Artistic style transfer for videos. German Conference on Pattern Recognition, 2016.



2. ACL

Meetings of the Association for Computational Linguistics

國際計算機語言協會年會

7月30日 - 8月4日|加拿大溫哥華


ACL是計算語言學裡最重要的國際會議,今年是第55屆。會議涵蓋生物醫學、認知建模與心理語言學、互動式對話系統、機器翻譯等各個領域,今年有194 篇長論文、107 篇短論文、21 個軟體演示及 21 篇主題演講。在2017谷歌學術指標(Google Scholar)按論文引用率排名, ACL是計算機語言學和自然語言處理領域最高階別國際學術年會。


騰訊AI Lab副主任俞棟認為,「自然語言的理解、表達、生成和轉換一直是自然語言處理的核心問題。近年來有很多新的解決思路和方法。今年的ACL涉及自然語言處理的各方面,尤其在語義解析、語義角色標註、基於語義和語法的自然語言生成、機器翻譯和問答系統方向上都有一些有趣的工作。」


騰訊AI Lab主任張潼介紹到,「ACL早期利用語法和規則分析自然語言,90年代後,隨著以LDC(Linguistic Data Consortium)為代表的自然語言資料集建立擴充,統計自然語言方法在計算語言學裡作用越來越大併成為主流。2000年後隨著網際網路高速發展及以自然語言為核心的人機互動方式興起,自然語言研究被賦予極高應用價值。」


騰訊AI Lab三篇文章入選ACL


論文一:Modeling Source Syntax for Neural Machine Translation

本文提出將句法樹轉化為句法標籤序列的輕量級方法,有效將源端句法資訊引入神經網路翻譯系統,被證實能顯著提高翻譯效果。


論文二:Chunk-Based Bi-Scale Decoder for Neural Machine Translation

本文引入一個額外組塊神經網路層,從組塊到詞的層次生成譯文,幫助實現神經網路翻譯系統短語級別的建模,實驗表明該方法在多種語言上都能顯著提高翻譯效果。* 本文作者亦致謝前任職機構


論文三:Deep Pyramid Convolutional Neural Networks for Text Categorization

文章提出了一種能有效表達文字長距離關係的複雜度詞粒度CNN。本文研究瞭如何加深詞粒度CNN對文字進行全域性表達,並找到了一種簡單網路結構,通過增加網路深度提升準確度,但不過多增加計算量。實驗表明15層的DPCNN在六個情感和主題分類任務上達到了目前最佳結果。



3. ICML

International Conference on Machine Learning

國際機器學習大會

8月6日 - 11日|澳大利亞悉尼


機器學習是人工智慧的核心技術,而ICML是機器學習最重要的兩個會議之一(另一個是NIPS)。ICML源於1980年在卡內基梅隆大學舉辦的機器學習研討會,現由國際機器學習學會(IMLS)主辦。2017谷歌學術指標以「機器學習」關鍵詞排名,ICML位列第一。


騰訊AI Lab主任張潼博士介紹到,「很多經典論文和演算法,如CRF,都是在ICML上首次提出的,這個會議涉及機器學習相關的所有研究,包括近年非常熱門的深度學習、優化演算法、統計模型和圖模型等。在早期,ICML更注重實驗和應用,而NIPS更注重模型和演算法,但近年來兩個會議有些趨同。」


騰訊AI Lab四篇文章入選ICML


論文一:Scaling Up Sparse Support Vector Machines by Simultaneous Feature and Sample Reduction

本文提出了第一個能在模型訓練開始前,同時檢測和去除稀疏支援向量機中不活躍樣本和特徵的篩選演算法,並從理論和實驗中證明其能不損失任何精度地把模型訓練效率提升數個量級。


論文二:GSOS: Gauss-Seidel Operator Splitting Algorithm for Multi-Term Nonsmooth Convex Composite Optimization

本文提出了求解多塊非光滑複合凸優化問題的運算元分裂新演算法,該演算法採用Gauss-Seidel迭代以及運算元分裂的技巧處理不可分的非光滑正則項,並以實驗證實了該演算法的有效性。


論文三:Efficient Distributed Learning with Sparsity

本文提出了一個高維大資料中能更有效學習稀疏線性模型的分散式演算法。在單個機器訓練樣本足夠多時,該演算法只需一輪通訊就能學習出統計最優誤差模型;即使單個機器樣本不足,學習統計最優誤差模型的通訊代價只隨機器數量對數曲線上升,而不依賴於其他條件數。


論文四:Projection-free Distributed Online Learning in Networks

本文提出了去中心化的分散式線上條件梯度演算法。該演算法將條件梯度的免投影特性推廣到分散式線上場景,解決了傳統演算法需要複雜的投影操作問題,能高效處理去中心化的流式資料。


騰訊AI Lab於2016年四月成立,專注於機器學習、計算機視覺、語音識別和自然語言理解四個領域「基礎研究」,及內容、遊戲、社交和平臺工具型四大AI「應用探索」。騰訊AI Lab主任及第一負責人是機器學習和大資料專家張潼博士(詳情可點連結),副主任及西雅圖實驗室負責人是語音識別及深度學習專家俞棟博士。目前團隊有50餘位AI科學家及200多位應用工程師。




騰訊AI Lab多篇論文入選CVPR、ACL及ICML等頂級會議(附論文下載)



活動預告:中國國內級別最高、規模最大的人工智慧大會——中國人工智慧大會(CCAI)將於7.22-7.23在杭州舉行,趕快掃描下方圖片中的二維碼或點選【閱讀原文】火速搶票吧。


關於CCAI

中國人工智慧大會(CCAI),由中國人工智慧學會發起,目前已成功舉辦兩屆,是中國國內級別最高、規模最大的人工智慧大會。秉承前兩屆大會宗旨,由中國人工智慧學會、阿里巴巴集團 & 螞蟻金服主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智慧大會(CCAI 2017)將於 7 月 22-23 日在杭州召開。


作為中國國內高規格、規模空前的人工智慧大會,本次大會由中國科學院院士、中國人工智慧學會副理事長譚鐵牛,阿里巴巴技術委員會主席王堅,香港科技大學計算機系主任、AAAI Fellow 楊強,螞蟻金服副總裁、首席資料科學家漆遠,南京大學教授、AAAI Fellow 周志華共同甄選出在人工智慧領域本年度海內外最值得關注的學術與研發進展,匯聚了超過 40 位頂級人工智慧專家,帶來 9 場權威主題報告,以及“語言智慧與應用論壇”、“智慧金融論壇”、“人工智慧科學與藝術論壇”、“人工智慧青年論壇”4 大專題論壇,屆時將有超過 2000 位人工智慧專業人士參與。

騰訊AI Lab多篇論文入選CVPR、ACL及ICML等頂級會議(附論文下載)

騰訊AI Lab多篇論文入選CVPR、ACL及ICML等頂級會議(附論文下載)


騰訊AI Lab多篇論文入選CVPR、ACL及ICML等頂級會議(附論文下載) 戳原文,搶門票!


相關文章