HOG_SVM_行人檢測資料集合_INRIA資料集
HOG+SVM是經典的行人檢測方法,論文作者同時搞了一個INRIA資料集。
INRIA資料集官方頁面:http://pascal.inrialpes.fr/data/human/,不過說真的,資料集搞的挺亂的。
首先,INRIA資料集的原始圖片,來自GRAZ 01資料集和網路上的一些圖片。這些圖片相比於MIT行人資料集,人的姿態和光照條件啥的都更加全面,適合做行人檢測。每張圖片中都進行了行人區域的標定,也就是畫了一個矩形框,把矩形框的左上定點座標和矩形長度、寬度記錄下來。
但是,第一次使用INRIA資料集的人,是要重現論文中的效果的!而論文中使用的圖片,是歸一化後的圖片。怎麼歸一化的我們不細究,反正效果就是,相當於原有的標定矩形框放大了一圈,然後裁剪出行人區域,然後區域縮放(通常是縮小,縮放後到一個固定尺寸)。那,就用這個歸一化後的圖片做重現實驗吧!
但是,問題又來了。這些歸一化的影象在哪裡?INRIA資料集裡面放了原始資料和標定資訊,以及歸一化後的影象,按官網上的說法先找到train_64x128_H96
目錄,說裡面有pos
和neg
兩個子目錄,以及找到test_64x128_H96
目錄,裡面也有pos
和neg
兩個子目錄。然後說,在train/pos
下的是96x160的圖片,test/pos
下的是70x134的圖片。我倒要問,train
目錄是哪個?不是train_64x128_H96
嗎?INRIA資料集根目錄下本身有一個Train
目錄好麼,你這麼講我很容易搞混的!而實際上,應當是train_64x128_H96
而不是train
,test
目錄也是一樣的情況。
還有幾個混亂的地方。
我在windows下解壓了INRIA資料集,在train_64x128_H96
目錄下沒找到neg
目錄。這是因為用了軟連結,是在linux下做的資料集。我想說,沒有必要裝這個逼的。把資料集放到Linux下解壓,我用的是fedora23系統,進入到train_64x128_H96/neg
目錄,把裡面圖片都拷到windows上,拷貝到train_64x128_H96/neg
目錄下。
另外就是test_64x128_H96
目錄下的neg
目錄的問題。這個目錄下的圖片有用麼?反正,看官網的說明,鳥用沒有。So,忽略這個目錄吧。
然後在Linux下檢視整個資料集目錄,發現最外層96X160H96和70x134H96兩個目錄。實際上歸一化的影象都存在這兩個目錄下。那你搞train_64x128_H96
和test_64x128_H96
兩個目錄做什麼?軟連結裝逼?
同時有個問題,為什麼會有歸一化的測試影象呢?test_64x128_H96/pos
目錄下的影象都是70x134大小,實際中的影象都是尺寸不一的,還要考慮多尺度的問題呢。這個目錄下的圖片並沒有用。直接用原始的測試圖片就可以了。
還有,原始影象的命名。為什麼以crop_
作為字首?有用麼?以及,目錄命名怎麼一會兒大寫開頭,一會兒小寫開頭,train
和Train
都有?另外對於原始資料的標定我也很無語,為什麼有標錯的地方?座標怎麼出現負數的,嗯?
算了,原始影象我就用
OK,講了這麼多,目的是整理出一個合理的資料集來,以後自己用也好用。經過整理後的INRIA資料集,目錄結構和說明:
INRIADATA{
normalized_images{
train{
pos:96x160大小,訓練正樣本,需要crop中間的64x128大小。已經做過flip,即包含左右對稱的圖
neg:大小不一,通常是幾百乘幾百,訓練負樣本,需要從每張圖中隨機crop 10個區域作為訓練負樣本
}
}
original_images{
train{
pos:訓練正樣本,大小不一
neg:訓練負樣本,大小不一
annotations:標註資訊
}
test{
pos:大小不一
neg:大小不一
annotations:標註資訊
}
}
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
訓練和測試的時候有幾種選擇方式:
用normalized_images
目錄下的圖片做訓練,或者用original_images
目錄下的圖片+annotations獲取行人區域做訓練;測試則都在original_images/test/pos
上測試。
整理後的資料集有點大,上傳百度網盤了:http://pan.baidu.com/s/1eSdlw7g
相關文章
- 目標檢測資料集分析
- 最強資料集集合:50個最佳機器學習公共資料集機器學習
- 【資料集合】並集、交集、差集、子集
- 【資料集】Maple-IDS——網路安全惡意流量檢測資料集
- SAR目標檢測資料集彙總
- 用DPM(Deformable Part Model,voc-release3.1)演算法在INRIA資料集上訓練自己的人體檢測模型ORM演算法模型
- WCF使用資料集(DataSet)、資料表(DataTable)、集合(Collection)傳遞資料 (轉)
- 目標檢測資料集,全部有標註
- 利用RGB-D資料進行人體檢測 People detection in RGB-D data
- 網路安全公開資料集Maple-IDS,惡意流量檢測資料集開放使用!
- js檢測資料型別JS資料型別
- javascript 資料型別檢測JavaScript資料型別
- Web資料集合Web
- 目標檢測兩種常用的資料集COCO和VOC
- 檢視oracle資料庫字符集Oracle資料庫
- javascript資料型別檢測方法JavaScript資料型別
- 資料結構-集合資料結構
- 資料結構:集合資料結構
- voc資料集轉換成coco資料集
- Alink漫談(七) : 如何劃分訓練資料集和測試資料集
- 大資料 (巨量資料集合(IT行業術語))大資料行業
- 資料探勘資料集下載資源
- 為Deepfake檢測研究提供資料支援
- JavaScript的資料型別及其檢測JavaScript資料型別
- 資料探勘——SVM(乳腺癌檢測)
- UCI資料集整理(附論文常用資料集)
- Java 學習資料集合Java
- 人工智慧大資料,公開的海量資料集下載,ImageNet資料集下載,資料探勘機器學習資料集下載人工智慧大資料機器學習
- php資料集PHP
- SST資料集
- oracle資料集Oracle
- 利用HOG特徵進行人體檢測HOG特徵
- 資料檢索
- 檢測資料庫遷移準確性資料庫
- 基於工業資料的檢測分析
- 【exp】快速檢測資料檔案壞塊
- 大資料如何採集資料?大資料的資料從何而來?大資料
- python將目標檢測資料匯入到指定資料庫中Python資料庫