“快到沒朋友”的目標檢測模型YOLO v3問世,之後arXiv垮掉了…

量子位發表於2018-03-27
安妮 編譯整理
量子位 出品 | 公眾號 QbitAI

今天有三件事挺有意思。

一是以“快到沒朋友”著稱的流行目標檢測模型YOLO推出全新v3版,新版本又雙叒叕提升了精度和速度。在實現相近效能時,YOLOv3比SSD速度提高3倍,比RetinaNet速度提高近4倍。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

二是有細心網友發現,模型一作在arXiv上釋出研究論文時,腦回路清奇地將自己這篇論文自引自用了一下。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

三是……在小哥自引自用後沒多久,arXiv官方賬號宣佈伺服器由於不明原因掛掉了……

640?wx_fmt=png

更快更強

先說更新這件正經事~

通過調整YOLO模型中的一些細節,v3模型增大了一些準確率也有所提升,速度依舊非常快。客官不妨先看一下介紹視訊——


對於320x320的影像,YOLOv3的檢測速度可達22ms,mAP值可達28.2,與SSD的準確率相當但速度快3倍。

當用舊版.5 IOU mAP檢測指標時,YOLOv3在英偉達TitanX顯示卡上51ms達到57.9AP50的效能。相比之下,RetinaNet則用198ms達到57.5AP50的效能,兩者效能相近但速度相差近4倍。

640?wx_fmt=png 在實現相同準確度情況下,YOLOv3速度明顯優於其他檢測方法(單一變數實驗)

640?wx_fmt=png 在COCO資料集上不同模型的執行情況對比

作者,和他的少女心

YOLOv3出自華盛頓大學的Joseph Redmon和Ali Farhadi之手。

Ali Farhadi是華盛頓大學的副教授,一作Joseph Redmon是他的博士生,曾在IBM實習,其實還當過電臺DJ。Redmon是一個少女心有點爆棚的程式設計師,這裡有一份他的簡歷,可以自行感受下。

640?wx_fmt=png

處於不知名的原因,小哥有一些“小馬情結”,可以再次感受下個人網站的畫風——

640?wx_fmt=png

“論文就該實在點”

如果單單是YOLOv3釋出新版本,可能在Reddit上還達不到熱度200的水平。有意思在,論文從頭到尾都透露著“不太正經”的氣息,比如作者自引自用論文,比如這個Introduction的開頭——

自己今年沒怎麼做研究,花了很多時間在Twitter上,搗鼓了一下GAN。

沒錯,這真的是一篇arXiv上的論文。Redmon還在論文中寫了寫自己嘗試但失敗了的方法。結尾,也不忘調侃一下熱點。

“還有一個更好地問題:‘我們如何使用檢測器?’Facebook和Google的很多研究員也在做相關研究啊。我認為,我們至少能知道技術被應用在了有利的方面,並且不會被惡意利用並將它們賣給…等一下,你說這就是它的用途??Oh!”

Reddit上網友的稱讚每篇論文都應該這樣實在,小哥在Reddit已收穫大批粉絲……

640?wx_fmt=jpeg

相關資料

對了,對論文有疑問還是不要去@作者了,反正對方也不會回,論文中都說了~

640?wx_fmt=png

你可以選擇冒險再回看研讀一下論文和程式碼。

論文下載地址:

https://pjreddie.com/media/files/papers/YOLOv3.pdf

專案地址:

https://pjreddie.com/darknet/yolo/

相關程式碼:

https://github.com/pjreddie/darknet

不過你得小心

畢竟……YOLO模型的全稱可是You Only Look Once(只能看一眼),再看可能會被吃掉!

640?wx_fmt=jpeg

活動推薦

640?wx_fmt=jpeg

 點選圖片閱讀原文

即可獲取更多詳情


聯想高校AI精英挑戰賽,覆蓋全國28個省份、8大賽區和260所高校,經過在中科大、華中科技大學、清華大學、上海交通大學等8所AI領域具有頂尖優勢的理工科高校的半決賽路演,產生最終入圍總決賽的十支參賽隊伍,並將於3月29日在北京中國科學院計算技術研究所迎來全國總決賽。

加入社群

量子位AI社群15群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot6入群;


此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。


進群請加小助手微訊號qbitbot6,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)


誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。

640?wx_fmt=jpeg

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態


相關文章