RCNN的安裝與簡單使用

查志強發表於2015-09-08

【原文:http://blog.csdn.net/kuaitoukid/article/details/46740477

最近準備從物體檢測的角度來重新審視文字檢測這個方向,所以看了下CNN大火以後的幾篇經典文獻,OverFeat,Region CNN, Dense Neural Pattern等等。

對這個方向來說,百聞不如一試,趁著其他程式還在跑沒什麼事,我安裝了一下RCNN來看看效果


RCNN的安裝

下載與安裝說明地址:https://github.com/rbgirshick/rcnn

其實我覺得安裝並沒有太多要說的,RCNN本身並沒有很難安裝,難點是caffe的安裝,caffe安裝好了剩下的就好說了


我就提一下我覺得兩個要注意的點吧:

1. 這套程式碼是依賴於caffe的,在安裝過程中也會說明,大家把安裝說明中提到的caffe安裝好就行了(裡面有下載地址)


2. 假如說linux系統沒有連線外網,需要自己手動下載Selective Search以及兩個pretrain的model


Selective Search庫的下載地址在selective_search資料夾下,執行sh檔案看報錯資訊能知道,然後把下載的壓縮包解壓在selective_search資料夾就好


pre-train的model在data下面,執行sh檔案看報錯資訊也能知道對應的下載地址,注意這兩個model非常大,每個有1.5G,建議迅雷下載



RCNN的demo

額不得不說ssh協議下沒法顯示影象的確是蛋疼,最終我是在windows看了看結果,之後我會改改程式碼直接在影象上畫框,而不是類似imshow這樣的機制。不多說了,看結果吧




參考文獻

Rich feature hierarchies for accurate object detection and semantic segmentation

OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks

Generic Object Detection with Dense Neural Patterns and Regionlets

Object Detection Networks on Convolutional Feature Maps

BoxSup: Exploiting Bounding Boxes to Supervise Convolutional Networks for Semantic Segmentation

AttentionNet: AggregatingWeak Directions for Accurate Object Detection


----------------------------------------------------分割線-----------------------------------------------------------

下面是我自己照的照片的識別結果

由於圖片大小限制,只能給低解析度的結果,高解析度的結果會更準確而且召回率高



(竟然把紅框裡的當冰箱了,不過score並不高,也就是0.2左右)



相關文章