自動駕駛中的機器學習演算法簡單介紹 - Haltakov

banq發表於2021-04-22

自動駕駛汽車需要解決不同的計算機視覺問題。
  • 物體檢測
  • 車道檢測
  • 可駕駛空間檢測
  • 語義分割
  • 深度估算
  • 視覺里程錶詳細資訊

 

物體檢測
最基本的任務之一-我們需要知道其他人和汽車在哪裡,需要考慮什麼標誌,交通訊號燈和道路標記。物件由2D或3D邊界框標識。相關方法:R-CNN,Fast(er)R-CNN,YOLO
 

距離估算
在知道存在哪些物件以及它們在影像中的位置之後,您需要知道它們在3D世界中的位置。由於相機是2D感測器,因此您首先需要估算到物體的距離。相關方法:卡爾曼濾波器,深層SORT
 

車道檢測
汽車需要知道的另一個關鍵資訊是車道邊界在哪裡。您不僅需要檢測車道標記,還需要檢測路緣,草邊等。有多種方法可以做到這一點:從傳統的基於邊緣檢測的方法到CNN。
 

行車路線預測
一種替代方法是訓練神經網路,該神經網路將直接輸出汽車需要駕駛的軌跡。例如,如果看不到車道標記,可以將其用作居中標記。
 

可駕駛空間檢測
此處的目的是檢測影像的哪些部分代表汽車可以實際行駛到的空間。這裡的方法通常與語義分割方法非常相似(請參見下文)。
  

語義分割
並非影像的所有部分都可以透過邊界框或車道模型來描述,例如樹木,建築物,天空。語義分割方法對影像中的每個畫素進行分類。相關方法:完全卷積NN,UNet,PSPNet
 

深度估算
目的是估計到影像中每個畫素的距離,以便獲得更好的周圍3D模型。如今,諸如立體影像和運動結構之類的方法已被用於單個影像的自我監督式深度學習模型所取代。
 

視覺里程錶
雖然我們從車輪感測器和IMU知道了汽車的運動,但是確定攝像機中的實際運動可能會更準確,例如獲得俯仰角。視覺測距法可估計攝像機在兩幀之間的6 DoF運動。
 
當然,還有許多其他的計算機視覺問題可能會有所幫助,但是該主題將向您概述最重要的問題。如您所見,如今,深度學習方法(尤其是CNN)主導了計算機視覺的各個方面……


 

相關文章