HOG_SVM_行人檢測資料集合_INRIA資料集

馬衛飛發表於2017-12-12

HOG+SVM是經典的行人檢測方法,論文作者同時搞了一個INRIA資料集。

INRIA資料集官方頁面:http://pascal.inrialpes.fr/data/human/,不過說真的,資料集搞的挺亂的。

首先,INRIA資料集的原始圖片,來自GRAZ 01資料集和網路上的一些圖片。這些圖片相比於MIT行人資料集,人的姿態和光照條件啥的都更加全面,適合做行人檢測。每張圖片中都進行了行人區域的標定,也就是畫了一個矩形框,把矩形框的左上定點座標和矩形長度、寬度記錄下來。 
但是,第一次使用INRIA資料集的人,是要重現論文中的效果的!而論文中使用的圖片,是歸一化後的圖片。怎麼歸一化的我們不細究,反正效果就是,相當於原有的標定矩形框放大了一圈,然後裁剪出行人區域,然後區域縮放(通常是縮小,縮放後到一個固定尺寸)。那,就用這個歸一化後的圖片做重現實驗吧!

但是,問題又來了。這些歸一化的影象在哪裡?INRIA資料集裡面放了原始資料和標定資訊,以及歸一化後的影象,按官網上的說法先找到train_64x128_H96目錄,說裡面有posneg兩個子目錄,以及找到test_64x128_H96目錄,裡面也有posneg兩個子目錄。然後說,在train/pos下的是96x160的圖片,test/pos下的是70x134的圖片。我倒要問,train目錄是哪個?不是train_64x128_H96嗎?INRIA資料集根目錄下本身有一個Train目錄好麼,你這麼講我很容易搞混的!而實際上,應當是train_64x128_H96而不是traintest目錄也是一樣的情況。

還有幾個混亂的地方。 
我在windows下解壓了INRIA資料集,在train_64x128_H96目錄下沒找到neg目錄。這是因為用了軟連結,是在linux下做的資料集。我想說,沒有必要裝這個逼的。把資料集放到Linux下解壓,我用的是fedora23系統,進入到train_64x128_H96/neg目錄,把裡面圖片都拷到windows上,拷貝到train_64x128_H96/neg目錄下。 
另外就是test_64x128_H96目錄下的neg目錄的問題。這個目錄下的圖片有用麼?反正,看官網的說明,鳥用沒有。So,忽略這個目錄吧。

然後在Linux下檢視整個資料集目錄,發現最外層96X160H96和70x134H96兩個目錄。實際上歸一化的影象都存在這兩個目錄下。那你搞train_64x128_H96test_64x128_H96兩個目錄做什麼?軟連結裝逼?

同時有個問題,為什麼會有歸一化的測試影象呢?test_64x128_H96/pos目錄下的影象都是70x134大小,實際中的影象都是尺寸不一的,還要考慮多尺度的問題呢。這個目錄下的圖片並沒有用。直接用原始的測試圖片就可以了。

還有,原始影象的命名。為什麼以crop_作為字首?有用麼?以及,目錄命名怎麼一會兒大寫開頭,一會兒小寫開頭,trainTrain都有?另外對於原始資料的標定我也很無語,為什麼有標錯的地方?座標怎麼出現負數的,嗯? 
算了,原始影象我就用

OK,講了這麼多,目的是整理出一個合理的資料集來,以後自己用也好用。經過整理後的INRIA資料集,目錄結構和說明:

INRIADATA{
    normalized_images{
        train{
            pos:96x160大小,訓練正樣本,需要crop中間的64x128大小。已經做過flip,即包含左右對稱的圖
            neg:大小不一,通常是幾百乘幾百,訓練負樣本,需要從每張圖中隨機crop 10個區域作為訓練負樣本
        }
    }
    original_images{
        train{
            pos:訓練正樣本,大小不一
            neg:訓練負樣本,大小不一
            annotations:標註資訊
        }
        test{
            pos:大小不一
            neg:大小不一
            annotations:標註資訊
        }
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

訓練和測試的時候有幾種選擇方式: 
normalized_images目錄下的圖片做訓練,或者用original_images目錄下的圖片+annotations獲取行人區域做訓練;測試則都在original_images/test/pos上測試。

整理後的資料集有點大,上傳百度網盤了:http://pan.baidu.com/s/1eSdlw7g

相關文章