電子書開放下載!這應該是最全的一份目標檢測演算法&模型盤點
導讀:從簡單的影像分類到3D姿勢識別,計算機視覺從來不缺乏有趣的問題和挑戰。透過肉眼我們可以檢測出一張寵物照中的貓和狗,可以識別出梵高作品《星夜》中的星星和月亮,那如何透過演算法賦予機器“看”的智慧,就是我們接下來要講的。
本文首先會介紹目標檢測的概念,然後介紹一種簡化了的目標檢測問題——定位 + 分類以及它存在的問題,最後由淺入深逐步進入到目標檢測常用的模型及方法,如 Faster R-CNN、SSD 等。這個過程中 會涉及很多細節的概念和知識點,具體的技術講解請下載下方電子書詳閱。
>>
<<
書中精彩乾貨集合
1、目標檢測常用的模型及方法
1.1R-CNN
學者們在這個方向做了很多研究,比較有名的是 selective search 方法,具體方法這裡不做詳細說明,感興趣的讀者可以看關於 selective search 的論文。大家只要知道這是一種從圖片中選出潛在物體候選框(Regions of Interest,ROI)的方 法即可。有了獲取 ROI 的方法,接下來就可以透過分類和合並的方法來獲取最終的 目標檢測結果。基於這個思路有了下面的 R-CNN 方法。
- 選出潛在目標候選框(ROI)
- 訓練一個好的特徵提取器
- 訓練最終的分類器
- 為每個類訓練一個迴歸模型,用來微調 ROI 與真實矩形框位置和大小的偏 差
1.2Fast R-CNN
針對 R-CNN 的 3 個主要問題,我們思考一下是否有更好的解決方案。首先是速度,2000 個 ROI 的 CNN 特徵提取佔用了大量的時間,是否可以用更好的方法,比如共享卷積層來同時處理所有 2000 個 ROI ?
其次是 CNN 的特徵不會因 SVM 和迴歸的調整而更新。
R-CNN 的操作流程比較複雜,能否有更好的方式使得訓練過程成為端到端的? 接下來我們將介紹 Firshick 等人於 2015 年提出的 Fast R-CNN[2],它非常巧 妙地解決了 R-CNN 主要的幾個問題。
1.3 Faster R-CNN
Faster R-CNN[3] 作為目標檢測的經典方法在現今很多實戰專案和比賽中頻頻出現。其實,Faster R-CNN 就是在 Fast R-CNN 的基礎上構建一個小的網路,直接產生 region proposal 來代替透過其他方法(如 selective search)得到 ROI。這 個小型的網路被稱為區域預測網路(Region Proposal Network,RPN)。Faster R-CNN 的訓練流程其中的 RPN 是關鍵,其餘流程基本和 Fast R-CNN一致。
接下來我們看下 Faster R-CNN 的訓練過程:
- 使用 ImageNet 預訓練好的模型訓練一個 RPN 網路。
- 使用 ImageNet 預訓練好的模型,以及第(1)步裡產生的建議區域訓練 Fast R-CNN 網路,得到物體實際類別以及微調的矩形框位置。
- 使用(2)中的網路初始化 RPN,固定前面卷積層,只有調整 RPN 層的引數。
- 固定前面的卷積層,只訓練並調整 Fast R-CNN 的 FC 層。
1.4YOLO
由於在 R-CNN 的系列演算法中都需要首先獲取大量 proposal,但 proposal 之 間有很大的重疊,會帶來很多重複的工作。YOLO[5] 一改基於 proposal 的預測思路, 將輸入圖片劃分成 S*S 個小格子,在每個小格子中做預測,最終將結果合併。
接下來我們看一下 YOLO 學習的關鍵步驟:
YOLO 對於網路輸入圖片的尺寸有要求,首先需要將圖片縮放到指定尺寸 (448
448),再將圖片劃分成 SS 的小格。
每個小格里面做這幾個預測:該小格是否包含物體、包含物體對應的矩形框 位置以及該小格對應 C 個類別的分數是多少。
1.5 SSD
SSD[4] 同時借鑑了 YOLO 網格的思想和 Faster R-CNN 的 anchor 機制,使 得 SSD 可以快速進行預測的同時又可以相對準確地獲取目標的位置。接下來介紹SSD 的一些特點:
- 使用多尺度特徵層進行檢測。在 Faster Rcnn 的 RPN 中,anchor 是在主幹 網路的最後一個特徵層上生成的,而在 SSD 中,anchor 不僅僅在最後一個 特徵層上產生,在幾個高層特徵層處同時也在產生 anchor。
- SSD 中所有特徵層產生的 anchor 都將經過正負樣本的篩選後直接進行分類分數以及 bbox 位置的學 習。
2、目標檢測的產業應用實踐
前面具體講解了目標檢測的技術應用,技術如何和產業相結合,發揮出最大的價值,也是我們最為關注的。
在經濟穩預期的形勢下,國內製造業企業正在加快轉型升級的步伐。阿里作為一家有情懷和使命感的科技公司,我們希望透過技術手段來幫助傳統企業實現轉型升級。
在光伏行業,質檢環節長期面臨專業度高、招工難、人力不足等問題。工業自動化水平較高的德國曾推出過元件 EL 質檢技術,但只針對典型缺陷,僅能做到輔助人工(無法替代人工)。在國內,光伏企業在智慧 AI 識別技術領域做了近 10 年的嘗試,但多晶電池和元件的自動質檢遠未達到工業生產水平。
本文將重點介紹阿里推出的單晶、多晶元件 EL 質檢功能,目前已在產線執行且精度穩定在 95% 以上。
AI檢測在工業視覺“降本增效”領域上已經有了非常明顯的優勢。阿里雲未來將與更多的企業聯合,書寫智慧製造新篇章。
文章來源:阿里雲-機器智慧技術
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956605/viewspace-2667043/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 目標檢測演算法盤點(最全)演算法
- 增加檢測類別?這是一份目標檢測的基礎指南
- 做目標檢測,這一篇就夠了!2019最全目標檢測指南
- 你要的2019最全目標檢測都在這裡啦!
- 目標檢測---教你利用yolov5訓練自己的目標檢測模型YOLO模型
- 這應該是你見過的最全前端下載總結前端
- 大盤點 | 2019年4篇目標檢測演算法最佳綜述演算法
- NanoDet:這是個小於4M超輕量目標檢測模型NaN模型
- 基於混合高斯模型的運動目標檢測演算法模型演算法
- 0-目標檢測模型的基礎模型
- 訓練一個目標檢測模型模型
- 自動生成的電子郵件應該如何來檢測?
- 目標檢測模型的評價標準-AP與mAP模型
- 目標檢測演算法學習演算法
- R2CNN模型——用於文字目標檢測的模型CNN模型
- 52 個深度學習目標檢測模型深度學習模型
- 最新Anchor-Free目標檢測模型—FoveaBox模型
- Yolov5——訓練目標檢測模型YOLO模型
- 目標檢測
- 目標檢測 YOLO v3 訓練 人臉檢測模型YOLO模型
- 2018目標檢測
- 九、目標檢測
- [AI開發]目標檢測之素材標註AI
- 這應該是最全的Jenkins Android自動打包構建教程JenkinsAndroid
- 目標檢測 YOLO v3 驗證 COCO 模型YOLO模型
- CVPR2021 | 開放世界的目標檢測
- 盤點 Python 的目標受眾Python
- 這才是目標檢測YOLOv3的真實面目YOLO
- 3D目標檢測技術有哪些好用的模型?3D模型
- 使用關鍵點進行小目標檢測
- 深度剖析目標檢測演算法YOLOV4演算法YOLO
- 目標檢測之SSD
- 目標檢測之RetinaNetNaN
- 目標檢測面面觀
- 28-目標檢測
- 目標檢測綜述
- 2019 年的目標檢測指南
- 目標檢測:二維碼檢測方案