細粒度屬性的影象看起來非常相似,且在不同光線、角度和背景下拍攝,其識別精度也會受到影響。
細粒度識別相比於一般的影象分類不僅需要使用影象的整體資訊,同時應注意到子類別所獨有的區域性特徵。
一般細粒度識別可以分為兩種,即基於強監督資訊的方法和僅使用弱監督資訊的方法。
基於強監督的細粒度識別通常需要使用邊界框和區域性標註資訊。僅使用類別標籤,是一種弱監督資訊的細粒度識別。
一般的解決辦法為:1、採用非常多的資料增強方法增加輸入影象,例如水平翻轉、旋轉、高斯模糊、銳化、擷取和歸一化等方法。
2、根據多個基礎卷積網路抽取輸入影象的特徵,並作出預測。
3、結合所有基礎模型的預測得出最終結果。