論文提要“Selective Search for Object Recognition”

查志強發表於2015-09-10

【原文:http://blog.csdn.net/cv_family_z/article/details/46727519

這篇2012年的IJCV使用分割和窮舉搜尋的方法產生目標proposal,最近出現的R-CNN就是在這些proposal上學習特徵進行目標識別的,目標proposal是相對於滑動窗產生的候選框來說的,proposal的數量要少很多。

區域可以歸併到一起的原因有很多,如下圖所示,(b)顏色,(c)紋理,(d)包含問題,車輛包含車輪等。 
這裡寫圖片描述

論文提出了一種資料驅動的SS,結合窮舉搜尋和多元化取樣方法捕獲所有的可能區域,文章回答了幾個問題:1)自適應分割的多元化策略有哪些,2)產生高質量loc的效率,3)使用SS結合好的分類器和模型描述方法來做目標識別;

演算法描述: 
SS演算法的設計基於以下考慮:1)捕獲所有尺度,2)多樣化歸併方法,3)速度快。首先使用論文“Efficient Graph-Based Image Segmentation”中的方法生成一些起始的小區域,之後使用貪心演算法將區域歸併到一起:先計算所有臨近區域間的相似度,將最相似的兩個區域歸併,然後重新計算臨近區域間的相似度,歸併相似區域直至整幅影象成為一個區域,演算法具體描述如下: 
這裡寫圖片描述

多元化策略:使用不同的顏色空間和不同的相似度計算方法 
A.互補的顏色空間 
在一系列顏色空間中實現多級歸併演算法,包括RGB,灰度圖,Lab,rgI,HSV,歸一化RGB,etc. 
B.互補的相似度度量 
1)顏色相似度,顏色直方圖交叉函式這裡寫圖片描述 
2)紋理相似度,使用類SIFT度量,對每個顏色通道在8個方向上進行高斯微分,每個通道的每個方向提取出一個bin是10的直方圖,獲得一個240維大小的直方圖,最後使用L1 範數進行歸一化,同樣適用交叉函式進行相似度度量 
3)尺度相似度,計算兩個區域共同佔有影象面積的比例,小區域優先合併,同時放置某個區域將其他區域全部吞併。 
4)填充相似度,主要用來填充縫隙,如果ri 包含在rj 內,顯然需要將它們合併,定義BBij 為包圍ri 和rj 的框,填充相似度計算BBij 中沒被ri 和rj 覆蓋的區域佔整幅影象的比例: 
這裡寫圖片描述

最終的相似度度量是以上四種相似度度量的組合: 
這裡寫圖片描述

Combining Locations 
對假設的目標進行排序,對於給定的歸併策略j,使用rji 表示層i對應的區域,i=1時區域為整幅影象,令其位置值vji=RND×i,最終的排名是使用vji對區域進行排序. (沒懂啥意思)

目標分類 
分類使用的特徵是BOW,採用顏色-SIFT和精細空間分割,詞袋適合可變物體的識別,HOG適合剛體的識別,分類器使用的SVM。訓練框架如下圖所示: 
這裡寫圖片描述
正樣本為物體的ground truth,負樣本為SS產生的與正樣本交疊20%~50%的proposal,同時剪除了重疊面積大於70%的負樣本,這些負樣本是hard樣本,在分類中能夠成為支援向量。


相關文章