目標檢測入門系列手冊一:定位 + 分類問題的解法

視覺計算發表於2019-12-10

,學習全套目標檢測演算法&模型

image.png

定位 + 分類問題 是分類到目標檢測 的一個過渡問題,從單純地圖片分類到分類後給出目標所處位置,再到多目標的類別和位置。接下來,我們看一下定位+ 分類問題的解法。

image.png

分類不用多說,上一章我們以分類為例講了卷積神經網路。在定位問題中,則需要模型返回目標所在的外接矩形框,即目標的(x,y,w,h)四元組。

接下來介紹一種比較容易想到的思路,把定位當做迴歸問題,具體步驟如下:

(1)訓練(或下載)一個分類模型,例如AlexNet、VGGNet 或ResNet;

(2)在分類網路最後一個卷積層的特徵層(feature map)上新增“regression head”,如圖1-2 所示;補充說明:神經網路中不同的“head”通常用來訓練不同的目標,每個“head”的損失函式和最佳化方向不同。如果想讓一個網路實現多個功能,通常是在神經網路後面接多個不同功能的“head”。

(3)同時訓練“classification head”和“regression head”,為了同時訓練分類和定位(定位是迴歸問題)兩個問題,最終損失函式是分類和定位兩個“head”產生損失的加權和。

image.png

(4)在預測時同時使用分類和迴歸head 得到分類+ 定位結果。這裡強調一下,分類預測出的結果就是C 個類別,迴歸預測的結果可能有兩種:一種是類別無關,輸出4個值;一種是類別相關,輸出4*C 個值,這要看讀者想要哪種結果了。


文章來源: 阿里雲-機器智慧技術


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956605/viewspace-2667643/,如需轉載,請註明出處,否則將追究法律責任。

相關文章