誰人不識YOLOv1？

輕墨發表於2019-04-30

原文網址 : https://juejin.im/post/5cc866896fb9a0322564cc73

YOLOv1

如需講解視訊，請關注我的個人微信公眾號：AI研究小院

麻煩大家給我點個贊，就是那種讓我看起來，寫的還不錯的樣子!?????

YOLOv1是繼Faster R-CNN後，第一個one stage物體檢測演算法，開創了物體檢測演算法一個全新流派，自YOLOv1後，物體檢測基本分為one stage和two stage兩個流派。

下圖是YOLO在整個物體檢測演算法歷史上的座標。

背景

可以看出，YOLOv1是在Faster R-CNN之後提出的，但檢視首次上傳arXiv的時間可知（見下圖），YOLOv1和Faster R-CNN基本是同時提出的，因此YOLO作者動筆之時，Fast R-CNN是SOTA(state of the art)，Faster R-CNN尚未出世，因此YOLO作者的主要對比物件是Fast R-CNN。當然，作者後續還是補充了與Faster R-CNN的對比結果做參考。

下面簡單分析下Fast R-CNN的原理。

Fast R-CNN主要由四部分組成（如下圖），首先是共用的Feature Extractor，然後是傳統的Region Proposal演算法，有了共用的Extracted Feature Map和ROI（Region Of Interest）後，將Extracted Feature Map上對應ROI部分擷取出來，經過ROI Pooling，轉成解析度固定的Feature Map，輸入到物體檢測部分，以迴歸物體類別和bounding box，完成整個物體檢測流程。

由於Fast R-CNN分為Extract Feature和Region Proposal兩個過程，因此是two stage的，這導致了Fast R-CNN的常常準確度高，但速度做不到實時性。

YOLO的提出就是解決Fast R-CNN的缺點，將two stage合成為一個stage，從而達到實時性。

Idea

具體YOLO是如何將two stage合成為一個stage的呢？

1）首先，將輸入圖片劃分為7x7的網格

2）然後，每一個網格cell輸出兩個bounding box的預測和一個共享的類別預測。如下圖。每一個bounding box的預測包含五個值C,x,y,w,h，其中C表示預測框的置信度，x,y,w,h表示預測框的位置和尺寸，p_ci表示預測框屬於類別ci的概率。

可以看出，一個cell預測兩個框，但輸出的時候只能輸出一個預測結果，一般取置信度C值大的那個預測框作為這個cell的預測結果，框的類別取p_ci最大的類別。 3）既然一個cell有兩個預測框，那每個預測框的Ground Truth怎麼計算呢？首先，一個Ground Truth框分配給其center所在的cell，如下圖，自行車的綠色Ground Truth框分配給粉色的cell，

其次，在一個cell內部，Ground Truth會分配給與其IOU最大的predictor，如下圖，粉色cell中的兩個預測框是紅色框，綠色GT框會分配給寬矮的紅色預測框。

有了輸出，有了GT，再設計設計網路結構，即輸入到輸出的對映，就可以利用梯度下降進行訓練了。

Network

下圖是簡化版的網路結構，

下圖是詳細的網路結構，

可以看出，圖片先經由一個作者設計的24層的Feature Extractor，提取特徵，然後再經過兩個全連線層，就得到最後7x7x30的輸出。

需要注意的是，這個7x7的輸出的意義就是作者說的將網格劃分為7x7的網格。

Loss

Loss主要分為三個部分，位置損失、置信度損失和類別損失。

上式中，SxS是輸出結果的解析度，也是cell的個數，B是一個cell中的預測框的個數，兩個sigma意思是遍歷所有cell的所有box求和，lambda是損失權重，1函式是指示函式，條件為真時取1，為假時取0。

1）位置損失

這裡首要的是弄清楚給定一個predictor，其預測的x，y，w，h的含義，紅色框住的是對應的標籤。 x，y的含義是預測框的中心點相對cell左上角的相對座標，其值在0~1之間。 w，h的含義是預測框的寬度與圖片寬度的比值，預測框的高度與圖片高度的比值，其值也在0~1之間。也即predictor預測的x，y，w，h都是歸一化後的的相對值，以下圖為例，紅色框是綠色GT框的預測框，則預測的x=X/64，y=Y/64，w=W/448，h=H/448。預測框x，y，w，h對應的標籤也是相同的計算方法。

2）置信度損失

Ci預測的是Pr(object)*IOU，綜合反映了預測框有object的概率和預測框與truth的IOU大小。所以對於一個cell的C_i的標籤的計算方法是：

3）類別損失

預測的p_ci是條件概率，即Object已知的情況下，Class_i的概率，如果GT的類別是ci，則p_ci的標籤是1，其他p_ci的標籤為0。

Training

YOLO模型訓練採用了以下技巧： 1）資料增強包括隨機縮放，隨機擷取，隨機調整曝光度和飽和度 2）dropout 估計是全連線層，使用了dropout，dropout rate取0.5 3）優化器採用momentum優化器，超引數beta取0.9 4）weight decay 採用了權重衰減，係數為0.0005 5）batch size為64 6）learning rate

總共訓練136個epoch，第一個epoch，學習率穩定從0.001升至0.01，接著保持0.01的學習率學習75個epoch，然後將學習率降至0.001訓練30個epoch，再將學習率降至0.0001訓練30個epoch。

Experiments

學習效果如上表，可以看到YOLO的速度成碾壓態勢，而準確率依然很高。

Error Analysis

作者還對YOLO進行了誤差分析，對比了Fast R-CNN與YOLO的誤差來源。首先作者將識別結果分為五類：

正確分類：類別正確，IOU>0.5
位置錯誤：類別正確，0.1<IOU<0.5
近似錯誤：類別識別為近似類別，IOU>0.1
其他錯誤：類別錯誤，IOU>0.1
背景錯誤：IOU<0.1

Fast R-CNN與YOLO的誤差組成如下圖：

可以看出，Fast R-CNN以背景錯誤為主，YOLO以位置錯誤為主。

結論

YOLO開創性的提出了一步式演算法，做到了實時檢測和高準確率。

無人不識又無人不迷糊的this
2024-03-26
天下誰人不識君：當IPv6+成為千行百業的朋友
2022-04-29
YOLOv1文章理解與資料
2020-10-17
YOLOv1
誰來識別AI生成的假新聞？英媒：解鈴還須系鈴“人”
2019-06-11
AI
人臉識別的「巔峰」之作！甭管整成啥樣，3秒扒出你是誰
2024-10-15
再有誰說還不會資料庫基礎知識點！就把這個直接甩過去
2023-02-22
資料庫
誰負責業務知識的管理？
2022-03-08
誰是魚誰是餌？紅隊視角下蜜罐識別方式彙總
2022-06-23
戰無不勝的撲克機器人讓人類見識到遊戲 AI 的未來
2019-07-22
機器人遊戲AI
誰會成為今年的Best CIO人選
2019-01-21
三億人是誰，為什麼要用拼多多
2018-07-30
連不上 GitHub 的朝鮮，也開發出了人臉識別技術
2022-12-05
Github
程式設計師：活到 35 歲，我對不起誰？
2019-04-11
程式設計師
“既要效能，也要安全”，這樣的Rust，誰不喜歡！
2022-03-29
Rust
年輕人不講武德不僅白piao介面測試知識還白piao介面測試工具會員
2020-11-19
SQL 最佳化極簡法則，還有誰不會？
2020-11-06
SQL
誰爹是誰兒？雙人合作解謎遊戲《合力逃脫》現已登陸PC
2024-11-13
遊戲
[AI]生物本能vs機器人工程:誰才有“意識”?
2023-11-30
AI機器人
無人機、無人車與機器人，未來誰更適合當快遞員？
2018-03-07
無人機機器人
opencv 人臉識別
2018-11-21
OpenCV
【深度學習論文篇 02-1 】YOLOv1論文精讀
2022-04-14
深度學習YOLOv1
雲端計算工程師培訓，Linux不為人知的七個知識點
2018-07-16
工程師Linux
是誰點燃了人們居家健身的熱情？
2022-05-24
新火種AI | 拼多多“後發制人”殺入大模型，誰將勝出，誰先出局
2023-11-28
AI大模型
不學無數——初識反射
2018-09-03
反射
centos 7 不識別ifconfig命令
2019-03-15
CentOS
深度模型的日誌異常檢測，還有誰不會？
2021-09-11
模型
全球第一創投人是誰？2019全球全球最佳創投人完整名單
2019-04-04
創投
人生思考---公司不養閒人
2024-05-28
哪些人不建議學IT？
2021-07-24
不為人知的 Linus 大神
2020-12-12
曾國藩識人用人
2020-10-14
《底特律：變人》：誰說只有改變世界的才叫主角？
2019-07-15
python基礎（補充）：正經人誰用遞迴呀
2021-04-15
Python遞迴
人臉識別與人體動作識別技術及應用pdf
2018-08-23
軟Apple不硌牙 - 初識iOS
2018-07-28
APPiOS
希捷硬碟插入電腦不識別
2024-07-17
希捷硬碟
python不識別install如何解決
2021-09-11
Python