都說ICCV的論文錄用率非常低,實際在今年4303篇論文的投稿中,最終有1077篇論文被接收。相較於2017年28.9%的接收率,今年25.02%的錄用率雖略有下降,但與其他AI領域的國際頂會相比論文錄用率基本持平。
作為視覺領域的國際頂會,ICCV 2019的一舉一動都牽動著CVer的心。
除了投稿數量翻倍,今年的參會人數也是直線上升,據大會官網訊息,目前已有7000多名參會者註冊報名,可謂相當火爆!
今年的會議為期7天,將於27日正式開幕,2日結束。ICCV大會官網目前已經放出了會議議程,其中60場主題豐富的Workshop、12個Tutorials和Doctoral Consortium等一系列活動都將同期舉行。
其中,在10月29日舉行的Neural Architects Workshop尤為亮眼。屆時,計算機視覺領域奠基人Alan Yuille、馬爾獎獲得者Ross Girshick、Faster RCNN和ResNet作者任少卿等知名專家學者將會聚一堂,為大家帶來精彩的主題報告。
而最受期待的最佳論文和最佳學生論文獎也將會在10月29日揭曉。同時,Azriel Rosenfeld 終身成就獎、Distinguished researcher award(傑出研究員獎)、Mark Everingham 獎、Helmholtz prize 經典論文獎屆時也將陸續公佈。
最終的大獎將花落誰家呢?有沒有很期待呢?
劇透來了!本公號會在接下來的幾天將會對ICCV2019錄用的優秀論文進行解讀,同時也會跟進報導本次大會的盛況,歡迎感興趣的小夥伴及時關注最新動態哦!
接下來,我們就先來回顧下過去五年ICCV的會議情況。
詳解ICCV
不同於在美國每年召開一次的CVPR和只在歐洲召開的ECCV,ICCV在世界範圍內每兩年召開一次,ICCV的論文錄用質量是三大會議中公認級別最高的。
根據AMiner對AI會議的最新排名統計,ICCV位居排行榜第五位,H5指數為127,10H值為23938。目前在中國計算機學會推薦國際學術會議的排名和清華計算機學科推薦列表中,ICCV均為人工智慧領域的A類會議。
通過對AMiner平臺中ICCV近五年來收錄論文資料地進一步挖掘,(詳情可查https://www.aminer.cn/conference/53a72d7620f7420be8c6646b),從詞雲可以看出,ICCV的關鍵詞主要集中在人體姿態估計、目標檢測、語義分割、單一影像、視覺跟蹤、深度神經網路、卷積神經網路等方向。
通過對五年來ICCV接收論文中所有學者資訊的提取,我們分析了這些學者的性別比例、國籍分佈與語言分佈情況。可以看出,ICCV的投稿學者以男性為主,佔比88.7%。從學者分佈情況來看,投稿學者主要來自美國、中國,分別佔比30.88%、29.25%,其次是日本和義大利,佔比4.41%、3.76%。
從投稿學者發表所屬機構來看,五年來在ICCV會議中,香港中文大學以65篇論文數量排在首位,卡耐基梅隆大學與中國科學院均以55篇位列第二,清華大學和微軟分列第三、第四,分別各發表33篇、30篇。
近五年高引論文TOP10
近五年來ICCV的高引論文TOP1是Facebook RGB大神Ross B. Girshick發表的《Fast R-CNN》一文,引用量高達5695次。
2014年R-CNN橫空出世,首次將卷積神經網路帶入目標檢測領域。受SPPnet啟發,Ross在2015年發表了Fast R-CNN,它的構思精巧,流程更為緊湊,大幅提高目標檢測速度。
在同樣的最大規模網路上,Fast R-CNN和R-CNN相比,訓練時間從84小時減少為9.5小時,測試時間從47秒減少為0.32秒。在PASCAL VOC 2007上的準確率相差無幾,約在66%-67%之間。
高引論文TOP2是發表於2015年的《Delving Deep into Rectifiers:Surpassing Human-Level Performance on ImageNet Classification》,引用量5027次。
這篇文章出自當時還在微軟亞洲研究院的何愷明、孫劍以及來自西安交通大學和中國科學技術大學的實習生張祥雨和任少卿。如今,何凱明去了Facebook;張祥雨作為孫劍首個深度學習的博士也隨孫劍加入了曠視,成為曠視研究院base model組負責人;而任少卿已成為自動駕駛公司Momenta合夥人兼研發總監,而他也會在今年的Workshop中亮相。
這篇文章的研究成果基於深度卷積神經網路(CNN)的計算機視覺系統,是視覺識別挑戰中第一個超越人類視覺能力的計算機系統,在ImageNet 1000挑戰中首次超越了人類進行物件識別分類的能力,在ImageNet 2012分類資料集中的錯誤率已降低至4.94%。
排名第三的是發表於2017年的《Mask R-CNN》一文,引用量2423次。作者同樣是何愷明、Ross B. Girshick與Georgia Gkioxari、 Piotr Dollár。
Mask R-CNN是一個小巧、靈活的通用物件例項分割框架(object instance segmentation),它不僅可對影像中的目標進行檢測,還可以對每一個目標給出一個高質量的分割結果。它在Faster R-CNN基礎之上進行擴充套件,並行地在bounding box recognition分支上新增一個用於預測目標掩模(object mask)的新分支。該網路還很容易擴充套件到其他任務中,比如估計人的姿勢,也就是關鍵點識別(person keypoint detection)。該框架在COCO的一些列挑戰任務重都取得了最好的結果,包括例項分割(instance segmentation)、候選框目標檢測(bounding-box object detection)和人關鍵點檢測(person keypoint detection)。
歷年最佳論文
通過AMiner 的Best Papers vs. Top Cited Papers in Computer Science 頁面(https://www.aminer.cn/bestpaper/ICCV),可以看到ICCV歷年來的最佳論文。
ICCV2017年的最佳論文正是排在高引論文第三位的《Mask R-CNN》。
更牛的是本屆最佳學生論文獎《Focal Loss for Dense Object Detection》一文也有何愷明的參與。
該篇論文的第一作者 Tsung-Yi Lin 博士畢業於康乃爾大學紐約理工學院,這是他在 Facebook 工作時進行的研究。Tsung-Yi Lin 最著名的工作是他在微軟期間提出的 Coco 資料集(論文:《Microsoft coco:Common objects in context》)。
ICCV2015的最佳論文獎授予了由微軟劍橋研究院(Microsoft Research, Cambridge UK)、卡內基梅隆大學和義大利布魯諾凱斯勒研究中心(Fondazione Bruno Kessler)合作的論文《深度神經決策森林》(Deep Neural Decision Forests)。
該論文提出將分類樹模型和深度神經網路的特徵學習相結合進行端到端訓練的深度學習方法。該方法使用決策森林(decision forest)作為最終的預測模型,提出了一套完整的、聯合的、全域性的深度學習引數優化方法。在手寫資料庫MNIST和影像分類資料庫ImageNet的實驗中都取得了超越當前最好方法的結果。
ICCV2013最佳論文《From Large Scale Image Categorization to Entry-Level Categories》
作者:Vicente Ordonez,Jia Deng, Yejin Choi, Alexander C. Berg, Tamara L. Berg
ICCV2011最佳論文《Relative attributes》
作者:Devi Parikh,Kristen Grauman
ICCV上的其他獎項
Azriel Rosenfeld 終身成就獎
該獎用於獎勵在長期職業生涯中為計算機視覺領域作出突出貢獻的傑出研究者。
ICCV2017 的Azriel Rosenfeld 終身成就獎頒發給了MIT的Tomaso Poggio教授。Tomaso Poggio是MIT大腦和認知科學系Eugene McDermott教授,生物和計算學習中心聯合主任,電腦科學和人工智慧實驗室成員,是AAAI Founding Fellow。
傑出研究員獎(Distinguished researcher award)
基於主要研究貢獻及影響激發其他研究,該獎項用於獎勵對計算機視覺發展作出重大貢獻的研究者。
2017年傑出研究獎授予了ETH Zentrum 教授 Luc Van Gool 與 Facebook 研究科學家、計算攝影學團隊創始人Richard Szeliski。
Luc van Gool是ETH Zurich大學教授,研究領域為計算機視覺和影像處理。Richard Szeliski是Facebook的研究科學家、計算攝影組主任。
Mark Everingham獎
該獎項用於獎勵為計算機視覺社群作出無私而重要貢獻的研究員,包括個人和團隊。
2017年的Everingham prize頒發給了Caffe團隊和ICVSS組織者。深度學習框架Caffe,它的作者賈揚清目前任職於阿里巴巴,曾在Facebook、谷歌大腦工作過,也是TensorFlow的作者之一。
Helmholtz prize經典論文獎
該獎項主要頒發給對計算機視覺研究有重大意義、十年前的的論文,以表彰他們在計算機視覺領域作出的基礎貢獻。
2017年的經典論文主要有以下7篇:
Space-time interest points I Laptev and T Lindeberg,I Laptev and T Lindeberg
Recognizing action at a distance,A Efros, A Berg, G Mori, J Malik,
Video Google:A text retrieval approach to object matching in videos,J Sivic, A Zisserman,
Recognising panoramas,M Brown, D Lowe,
Discovering objects and their location in images,J Sivic, B Russell, A Efros, A Zisserman, W Freeman
The pyramid match kernel:Discriminative classification with sets of image features,K Grauman, T Darrell
Actions as space-time shapes,M Blank, L Gorelick, E Shechtman, M Irani, R Basri