物體表面缺陷檢測現狀
傳統機器學習侷限性
- 傳統機器學習方法對於特定的演算法只能解決特定的問題,不夠靈活,無法快速適應新產品;
- 不同的問題有不同的特徵,當需要解決新問題時,需要重新設計特徵,開發週期長;
深度學習遇到的問題
- 訓練資料數量需求大;
- 標註精度、耗時需求嚴格;
- 計算能力需求高。
該篇paper解決了深度學習遇到的如上三個問題
Paper貢獻
該篇paper提出了一個兩階段的網路,即分割網路 + 決策網路。
- 分割網路用於對輸入的圖片進行缺陷的具體定位,最後生成分割掩碼(二值影像);
- 決策網路用於判斷輸入的圖片是否存在缺陷,生成二值分類輸出。
實現細節
分割網路
分割網路要在高解析度的影像表面上檢查小的缺陷,需滿足兩個要求:
- 具有較大的感受野;
- 能夠捕捉到較小的特徵細節;
因此,在設計時,需要具有下采樣層,在比較深的層中使用尺寸大的卷積核。
決策網路
為什麼要提出這樣的決策網路?有什麼作用?
簡單的分割網路似乎沒有足夠的資訊來預測影像中缺陷的存在。
- 決策網路能夠從最後一個分割層的特徵圖中捕獲資訊;
- 額外的下采樣增加了感受野的大小,能夠捕獲缺陷的全域性形狀。全域性形狀對分類很重要,有助於提高效能。
網路訓練過程
資料集
該篇paper中使用到的是工業界中電機轉向器的拍攝樣本集Kolektor
網路在不同配置下的評估
網路在四個配置組下進行評估:
-
五種精度的標註;
-
兩種損失函式 (均方誤差、交叉熵);
-
輸入影像是全尺寸(1408 x 512 px)還是半尺寸(704 x 256 px);
-
是否對輸入影像進行90°的旋轉。
實驗結果如下:
可見,paper提出的網路在如下:
1. 標註精度為Dilate = 5;
2. 交叉熵損失函式;
3. 全尺寸影像;
4. 不對影像進行90°旋轉。
配置,達到了最優的效能。
效能評估
paper的作者把提出的網路與目前最常用的兩個分割網路(DeepLab v3+與U-Net)和用於缺陷檢測的商業軟體Cognex ViDi Suite進行了效能對比。如下效能指標皆在三個網路和商業軟體最優配置下進行評估:
結果如上圖所示:
paper提出的網路AP最高,達到了99.9%,漏檢個數與誤檢個數也最少。
所需訓練樣本個數
如上圖所示,paper提出的網路,在僅有33個缺陷樣本的訓練下,AP能夠達到99.9%;在僅有5個缺陷樣本的訓練下,AP依舊能夠達到96.1%。超過了其它分割網路和商業軟體在同等配置下的效果,一定程度上解決了深度學習所需樣本數量大的問題。
所需訓練時間
如上圖所示:
paper提出的網路在對單張圖片進行檢測的平均準確度和時間上,都有著不錯的效果,如何能做到這樣的效果,也取決於上圖,可以看到,paper提出的網路所需的引數,遠少於另外兩種分割網路,因此在訓練以及檢測的過程中,花費的時間得到了很大程度的提升。