基於單目影像的3D目標檢測是在輸入RGB影像的情況下估計目標的3D包圍框,在自動駕駛領域非常有用。
今天來自中科院瀋陽自動化所等單位的學者公佈論文提出一種實時的單目3D目標檢測演算法RTM3D,快速版30fps,並且程式碼將開源。
以下是作者資訊:
RTM3D演算法的主要思路,如圖:
輸入RGB影像,經過深度神經網路,預測目標的9個空間點(1箇中心點,8個頂點),使用幾何限制估計更加精確的9個空間點,進而找到目標的3D包圍框。
下表為該文演算法與其他3D目標檢測方法比較,RTM3D不需要其他外部資料,而且速度達到實時。
演算法架構圖:
實驗結果
在KITTI資料集上的實驗結果,該演算法在精度達到SO他的同時,是目前少數達到實時的3D目標檢測演算法。
檢測結果示例:
論文地址:
https://arxiv.xilesou.top/pdf/2001.03343.pdf
程式碼地址:
https://github.com/Banconxuan/RTM3D
目前程式碼還未放出,期待早日開源。