筆記:Deep attributes from context aware regional neural codes
這篇文章是基於CNN特徵結合傳統分類器的一個文章,可以算是當前的一大熱點方向,最後的實驗結果在Pascal Voc07以及12上的效果也相當好,說明這個工作確實是很有價值的。
從兩個方面對文章進行說明:
1)特徵:文章的一個亮點就是採用了proposal來提取特徵,用於分類等等一些任務。這個的創新在於之前的特徵都是基於整幅圖,將整個圖片用在pre-trained CNN,然後將中間層的結果作為特徵,這種特徵一方面無法解釋, 另一方面整幅圖的特徵往往重點不突出,這個就是我理解的semantic information。本文采用的deep attributes(DA)採用的步驟如下:首先對整個影像提取proposal(本文提到的提取proposal的方法包括edge box或者是selective search),然後將這些proposal作為輸入,提取相應區域的regional feature;最後將這些feature作為輸入,做一個CRP(cross region pooling).作為最後訓練分類器的特徵。下面這個圖很好的表示了這個過程:
關於region features這塊確實很巧妙,不過它對於傳統的方法應該也是可以用的,將目標跟蹤的proposal引入到分類任務中,可以有效的區分背景與分類目標,當然這裡需要訓練集裡的目標也比較清晰。不知道這個是否之前在傳統的模型就有人試過。
2)訓練分類器:提取到DA之後,可以直接用於訓練傳統的分類器了,比如SVM或者其他線性分類器。文章在這個基礎上,進一步結合proposal的選取做了一個工作。我們知道一幅圖不同proposal對應影像不同的region,這樣的話每個region對與最終分類的貢獻也就不一樣,可以分為三類:目標region:本身包含了分類目標(比如人);context region:上下文,比如出現了一匹馬通常就會有人(一般是人騎馬);還有就是背景區域:比如一棵樹和人同時出現在影像中,而樹和人在日常生活中並沒有太相關的聯絡,所以可以把樹看成背景區域,包含噪聲。這三種很明顯的target region對分類的貢獻高於其他兩者,context region高於background noise region。如何利用這些資訊進行refining?文章提出了CARR(context aware region refining):
通俗的說就是依靠訓練的分類器給每個region一個分數,根據這個分數來進行排序;然後選取region中分數最高的(可以看作對分類貢獻最大的) 一部分做CRP構造整個圖的特徵用於訓練分類器。通過這種方式降低了圖片中的噪聲資訊對訓練階段的影響。
文章給出了對應的預測階段的分類演算法:
這裡有個地方不明白,測試階段為什麼還有for t=1:T那層迴圈,按照我的理解,應該只需要用訓練階段最終的分類器去判別不同region的分數,然後排序即可,也就是for t=T:T這個一層迴圈即可,而且也看不懂T-1層迴圈的結果對最終T層迴圈的結果有什麼影響。這個還有待看過文章的人的指點。
學習筆記,不當之處敬請指點~
相關文章
- Spatio-Temporal Representation With Deep Neural Recurrent Network in MIMO CSI Feedback閱讀筆記筆記
- 論文翻譯:2022_PACDNN: A phase-aware composite deep neural network for speech enhancementDNN
- 深度學習問題記錄:Building your Deep Neural深度學習UI
- Neural Networks and Deep Learning(神經網路與深度學習) - 學習筆記神經網路深度學習筆記
- 閱讀筆記(Communication-Efficient Learning of Deep Networks from Decentralized Data)筆記Zed
- COMP9444 Neural Networks and Deep Learning
- 《Docker Deep Dive》閱讀筆記(一)Docker筆記
- DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ | NEURAL NETWORKSPyTorch
- 《BASNet:Boundary-Aware Salient Object Detection》論文筆記Object筆記
- From Apprentice To Artisan 筆記(一)APP筆記
- Deep Transfer Learning綜述閱讀筆記筆記
- 論文閱讀:《Deep Compositional Question Answering with Neural Module Networks》
- A Neural Network Approach to Context-Sensitive Generation of Conversational ResponsesAPPContext
- 深度學習 DEEP LEARNING 學習筆記(一)深度學習筆記
- 深度學習 DEEP LEARNING 學習筆記(二)深度學習筆記
- 【論文筆記】A Survey on Deep Learning for Named Entity Recognition筆記
- 《Retrieval of oceanic chlorophyll concentration from GOES-R Advanced Baseline Imager using deep learning》論文筆記Go筆記
- [論文閱讀筆記] Community aware random walk for network embedding筆記Unityrandom
- 【論文筆記】Neural machine translation by jointly learning to align and translate筆記Mac
- DMCP: Differentiable Markov Channel Pruning for Neural Networks 閱讀筆記筆記
- (閱讀筆記)Oblivious Neural Network Predictions via MiniONN Transformations筆記ORM
- [論文閱讀筆記] Structural Deep Network Embedding筆記Struct
- Deep Learning(深度學習)學習筆記整理系列深度學習筆記
- 【面向程式碼】學習 Deep Learning(三)Convolution Neural Network(CNN)CNN
- 【論文閱讀筆記】An Improved Neural Baseline for Temporal Relation Extraction筆記
- Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer 筆記筆記
- 論文翻譯:2022_Phase-Aware Deep Speech Enhancement: It’s All About The Frame Length
- GUI_PICTURE以及context_menu學習筆記GUIContext筆記
- (翻譯)DeepInspect: A Black-box Trojan Detection and Mitigation Framework for Deep Neural NetworksMITFramework
- 林軒田機器學習技法課程學習筆記12 — Neural Network機器學習筆記
- Networking from the container's point of view 筆記AIView筆記
- 轉:SAP學習筆記(from 神話blog)筆記
- 論文筆記 Deep Patch Learning for Weakly Supervised Object Classication and Discovery筆記Object
- 筆記:ML-LHY-17/18: Unsupervised Learning - Deep Generative Model筆記
- Deep Learning(深度學習)學習筆記整理系列之(一)深度學習筆記
- oracle sys_context 使用小記_轉摘骨骨網友筆記OracleContext筆記
- 論文閱讀翻譯之Deep reinforcement learning from human preferences
- android中LayoutInflater.from(context).inflate的分析AndroidContext