全面解讀自動駕駛的關鍵組成部分

dicksonjyl560101發表於2019-06-16



本文簡要而全面地概述了自動駕駛汽車(自動駕駛系統)的關鍵組成部分,包括自動駕駛水平、自動駕駛汽車感測器、自動駕駛汽車軟體、開源資料集、行業領導者、自動駕駛汽車應用程式和正在面臨的挑戰。

引言

在過去的十年裡,在自動駕駛領域發表了許多研究論文。然而,它們大多隻關注特定的技術領域,如視覺環境感知、車輛控制等。此外,由於自動駕駛汽車技術的快速發展,這樣的文章很快就過時了。

在過去的十年中,隨著自動駕駛系統技術在世界範圍內的一系列突破,自動駕駛汽車(自動駕駛系統)商業化的競爭比以往任何時候都更加激烈。例如,2016年,Waymo在亞利桑那州推出了自己的自動駕駛計程車服務,吸引了廣泛的關注。此外,Waymo花了大約9年的時間開發和改進其自動駕駛系統,使用各種先進的工程技術,如機器學習和計算機視覺。這些前沿技術極大地幫助他們的無人駕駛汽車更好地理解世界,在正確的時間採取正確的行動。

由於自動駕駛技術的發展,近十年來發表了許多科學論文,其引用量呈指數增長,如圖1所示。我們可以清楚地看到,自2010年以來,每年的發表量和被引用量都在逐漸增加,並在去年達到了巔峰。

全面解讀自動駕駛的關鍵組成部分


圖1 在過去的十年中,自主駕駛研究的出版物和引文的數量

一、自動駕駛系統

自動駕駛系統使汽車能夠在沒有人類駕駛員干預的真實環境中執行。每個自動駕駛系統由兩個主要元件組成:硬體(汽車感測器和硬體控制器,即、油門、剎車、車輪等)及軟體(功能組)。

軟體方面,已在多個不同的軟體架構中建模,如Stanley (Grand Challenge)、Junior (Urban Challenge)、Boss (Urban Challenge)和同濟自動駕駛系統。Stanley軟體架構包括四個模組:感測器介面、感知、規劃和控制以及使用者介面。Junior軟體體系結構由感測器介面、感知、導航(規劃與控制)、線控驅動介面(使用者介面和車輛介面)和全域性服務五個部分組成。Boss採用三層架構:任務、行為和運動規劃。同濟自動駕駛系統將軟體架構劃分為:感知、決策和規劃、控制和底盤。本文將軟體架構劃分為感知、定位與對映、預測、規劃與控制五個模組,如圖2所示,圖2與同濟自動駕駛系統軟體架構非常相似。


全面解讀自動駕駛的關鍵組成部分


圖2 自動駕駛系統軟體構架

自動駕駛等級劃分

根據汽車工程師協會(SAE international),自動駕駛可以分為六個等級,如表1所示。人類駕駛員負責0-2級自動駕駛系統的駕駛環境監測(DEM)。從第4級開始,人類駕駛員不再負責動態駕駛任務回傳(DDTF)。目前,最先進的自動駕駛系統主要在2級和3級。業內人士普遍認為,要達到更高等級的自動駕駛水平可能還需要很長一段時間。


全面解讀自動駕駛的關鍵組成部分


表1

感測器 安裝在自動駕駛系統上的感測器通常用於感知環境。選擇每個感測器是為了權衡取樣率、視場(FoV)、精度、範圍、成本和整個系統複雜度。最常用的感測器有無源感測器(如攝像頭)、有源感測器(如鐳射雷達、雷達和超聲波收發器)和其他感測器型別,如全球定位系統(GPS)、慣性測量單元(IMU)。

攝像頭 透過收集反射到三維環境物件上的光來捕捉二維影像。影像質量通常取決於環境條件,即不同的天氣條件,不同的光照環境,都會對影像質量產生不同的影響。計算機視覺和機器學習演算法通常用於從捕獲的影像/影片中提取有用的資訊。

鐳射雷達 利用脈衝鐳射照射目標,透過分析反射脈衝,測量到目標的距離。由於鐳射雷達具有較高的三維幾何精度,通常用於製作高解析度的世界地圖。鐳射雷達通常安裝在車輛的不同部位以實現不同的作用,如頂部、側面和前部。

雷達 透過發射電磁波並對反射波進行分析,可以準確地測量出目標的距離和徑向速度。雷達特別擅長檢測金屬物體,當然雷達也可以檢測非金屬物體,比如在短距離內檢測行人和樹木。雷達已經在汽車工業應用多年,催生了ADAS功能,如自動緊急制動,自適應巡航控制等。

與雷達類似, 超聲波感測器 透過測量發射超聲波訊號到接收回波之間的時間來計算到目標的距離,超聲波感測器通常用於自動駕駛汽車的定位和導航。

GPS 是美國政府的一種基於衛星的無線電導航系統,可以為自動駕駛系統提供時間和地理位置資訊。然而,GPS訊號很容易被建築物和山脈等障礙物阻擋,例如所謂的城市峽谷,GPS在此類區域往往表現不佳。因此,慣性測量單元(IMUs)通常被整合到GPS裝置中,以確保自動駕駛汽車在“城市峽谷”等地的定位。

硬體控制器

自動駕駛汽車硬體控制器包括轉矩轉向電機、電子制動助力器、電子節流閥、變速桿和駐車制動。車輛的狀態,如車輪速度和轉向角,可自動感知,並透過控制器區域網路(CAN)匯流排傳送到計算機系統。這使得人類駕駛員或自動駕駛系統能夠控制油門、剎車和方向盤。

二、自動駕駛軟體

感知:感知模組 分析原始感測器資料,輸出自動駕駛汽車所處於的環境理解。這個過程類似於人類的視覺認知。感知模組主要包括物件(自由空間、車道、車輛、行人、道路損壞等)檢測與跟蹤、三維世界重建(利用運動結構、立體視覺等)等。 最先進的感知技術可以分為兩大類:基於計算機視覺和基於機器學習。 前者一般透過顯式射影幾何模型來解決視覺感知問題,並使用最最佳化方法尋找最佳解。基於機器學習的技術透過使用資料驅動的分類/迴歸模型(如卷積神經網路)來學習給定感知問題的最佳解決方案。SegNet和UNet在語義影像分割和物件分類方面取得優秀的成績。這種神經網路具有極高的易用性,可以很容易地用於其他類似的感知任務,如遷移學習。多感測器資訊融合的感知可以產生更好的理解結果。

定位和地圖: 利用感測器資料和感知輸出,本地化對映模組不僅可以估計自動駕駛汽車位置,還可以構建和更新三維世界地圖。自從同步定位和地圖(SLAM)的概念在1986年引入以來,就得到了業內人士的普遍關注。最先進的SLAM系統通常分為基於過濾器的SLAM和基於最佳化的SLAM。基於過濾的SLAM系統是由貝葉斯濾波得到的,通常透過增量整合感測器資料,迭代估計自動駕駛汽車姿態並更新三維環境地圖。最常用的濾波器有擴充套件卡爾曼濾波器(EKF)、無跡卡爾曼濾波器(UKF)、資訊濾波器(IF)和粒子濾波器(PF)。另一方面,基於最佳化的SLAM方法首先透過尋找新觀測值與地圖之間的對應關係來識別問題約束。然後,計算和改進自動駕駛汽車的姿勢,並更新3D地圖。基於最佳化的SLAM方法可以分為兩個主要分支:Bundle Adjustment (BA)和graph SLAM。前者利用高斯-牛頓法、梯度下降等最佳化技術,透過最小化誤差函式,聯合最佳化三維地圖和攝像頭姿態。後者將定位問題建模為一個圖形表示問題,並透過尋找不同車輛姿態的誤差函式來求解。

預測: 預測模組分析其他交通代理的運動模式,預測自動駕駛汽車未來的運動軌跡,使自動駕駛汽車能夠做出合適的導航決策。目前的預測方法主要分為兩大類:基於模型的預測方法和基於資料驅動的預測方法。前者根據基本的物理系統運動學和動力學,透過傳播其運動狀態(位置、速度和加速度)來計算自動駕駛汽車未來的運動。例如,賓士的運動預測元件使用地圖資訊作為約束來計算自動駕駛汽車的下一個位置。卡爾曼濾波在短期預測方面表現良好,但在長期預測方面表現不佳,因為它忽略了周圍的環境,比如道路和交通規則。在此基礎上,建立了基於引力和斥力的行人運動預測模型。近年來,隨著人工智慧和高效能運算的發展,許多資料處理技術,如隱馬爾可夫模型(HMM)、貝葉斯網路(BNs)和高斯過程(GP)迴歸,用來預測自動駕駛汽車狀態。近年來,研究人員利用逆強化學習(IRL)對環境進行建模,比如,採用逆最優控制方法對行人路徑進行預測。

規劃: 規劃模組根據感知、定位、對映以及預測資訊確定可能的安全自動駕駛汽車導航路徑。規劃任務主要分為路徑規劃、機動規劃和軌跡規劃。路徑是自動駕駛汽車應該遵循的幾何路徑點列表,以便在不與障礙物碰撞的情況下到達目的地。最常用的路徑規劃技術有:Dijkstra、動態規劃、A*、狀態格等。機動規劃是一個高層次的自動駕駛汽車運動表徵過程,因為它同時考慮了交通規則和其他自動駕駛汽車狀態。在找到最佳路徑和機動規劃後,必須生成滿足運動模型和狀態約束的軌跡,這樣才能保證交通的安全性和舒適性。

控制: 控制模組根據預測的軌跡和估計的車輛狀態向油門、剎車或轉向扭矩傳送適當的命令。控制模組使汽車儘可能接近計劃的軌跡。控制器引數可以透過最小化理想狀態和觀測狀態之間的誤差函式(偏差)來估計。比例積分導數(PID)控制、線性二次調節器(LQR)控制和模型預測控制(MPC)是最常用的最小化誤差函式的方法。PID控制器是一種利用比例項、積分項和導數項使誤差函式最小的控制迴路反饋機構。當系統動力學用一組線性微分方程表示,成本用二次函式表示時,利用LQR控制器使誤差函式最小化。MPC是一種基於動態過程模型的先進過程控制技術。這三種控制器各有優缺點。自動駕駛汽車控制模組一般採用上述方法的混合模式。例如,初級自動駕駛汽車使用MPC和PID來完成一些低階反饋控制任務,例如應用變矩器來實現所需的車輪轉角。百度Apollo採用了這三種控制器的混合的模式:PID用於前饋控制、LQR控制輪角、MPC對PID和LQR控制器引數進行最佳化。

三、開源資料集

在過去的十年中,已經公佈了很多開源資料集,這為自動駕駛研究做出了巨大貢獻。小編蒐集了幾種使用最多的資料集,並簡要說明各種資料集的用途。Cityscapes包含一個大規模的資料集,可以用於畫素級和例項級的語義影像分割。ApolloScape可用於各種自動駕駛汽車感知任務,如場景解析、汽車例項理解、車道分割、自定位、軌跡估計以及目標檢測和跟蹤。此外,KITTI提供了用於立體和流量估計、目標檢測和跟蹤、道路分割、里程估計和語義影像分割的視覺化資料集。6D-vision使用立體攝像機感知三維環境,提供立體、光流和語義影像分割的資料集。

四、行業領導者

最近,投資者開始把錢投向自動駕駛系統商業化競賽潛力股。自2016年以來,特斯拉的估值一直在飆升。這使得承銷商推測,該公司將在幾年內產生一支自動駕駛車隊。此外,自2017年報導通用汽車計劃製造無人駕駛汽車以來,該公司股價已經上漲了20%。截止2018年7月,Waymo已經在美國對其自動駕駛汽車進行了800萬英里的測試。在2018年度,通用汽車和Waymo事故最少:通用汽車在212公里以上發生了22次碰撞,而Waymo在563公里以上只發生了3次碰撞。除了行業巨頭,世界一流大學也加快了自主駕駛的發展。這些大學都很好地開展了產學研相結合的模式。這使高校更好地為企業、經濟和社會做出貢獻。

應用場景:自動駕駛技術可以應用於任何型別的車輛,如計程車、長途汽車、旅遊巴士、貨車等。這些交通工具不僅可以使人們從勞動密集型和單調乏味的工作中解脫出來,而且可以確保他們的安全。例如,配備自動駕駛技術的道路質量評估車輛可以修復檢測到的道路損傷。此外,使用自動駕駛技術,道路參與者可以相互溝通,公共交通將更加高效和安全。

五、現存挑戰

儘管自動駕駛技術在過去的十年中發展迅速,但仍然存在許多挑戰。例如,感知模組在惡劣的天氣和/或光照條件下或在複雜的城市環境中表現不佳。此外,大多數感知方法通常是計算密集型的,不能在嵌入式和資源有限的硬體上實時執行。此外,由於長期不穩定性,目前SLAM方法在大規模實驗中的應用仍然有限。另一個重要的問題是如何融合自動駕駛汽車感測器資料,以快速、經濟的方式建立更準確的三維語義詞。此外,人們何時才能真正接受自動駕駛和自動駕駛汽車,仍然是一個值得討論話題,由此也引發了嚴重的倫理問題的探討。

參考文獻:

[1] J. Jiao, Y. Yu, Q. Liao, H. Ye, and M. Liu, “Automatic calibration of multiple 3d lidars in urban environments,” arXiv preprint arXiv:1905.04912, 2019.

[2] H. Ye, Y. Chen, and M. Liu, “Tightly coupled 3d lidar inertial odometry and mapping,” in 2019 IEEE International Conference on Robotics and Automation (ICRA). IEEE, 2019.

[3] R. Fan, M. J. Bocus, Y. Zhu, J. Jiao, L. Wang, F. Ma, S. Cheng, and M. Liu, “Road crack detection using deep convolutional neural network and adaptive thresholding,” arXiv preprint arXiv:1904.08582, 2019.

[4] C. Coberly, “Waymo’s self-driving car fleet has racked up 8 million miles in total driving distance on public roads,” accessed: 2019-04-21.

[5] D. Welch and E. Behrmann, “Who’s winning the self-driving car race?” accessed: 2019-04-21.


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2647777/,如需轉載,請註明出處,否則將追究法律責任。

相關文章