使用平行的屬性網路模組化自動駕駛中的控制策略網路

ControlPlusAI發表於2019-07-04

原文網址 : https://www.jiqizhixin.com/articles/2019-07-04-10

作者簡介：許倬，UC Berkeley博士在讀，研究方向包括機器學習、增強學習、控制理論及其在機器人和自動駕駛等領域的應用。

目前神經網路控制策略在機器人和自動駕駛的領域中都被廣泛探索和應用，因為這些使用模仿學習和增強學習等方法所訓練的策略網路相比於傳統的控制方法具有相當多的優勢。首先，神經網路可以表示非常複雜的模型；其次，多種駕駛場景和模式可以同時、全面地影響策略網路的訓練；此外，相比於線上優化的方法，策略網路的執行往往更快。但是，策略網路的實際應用收到一系列限制，其中一個非常重要的問題則是訓練和知識遷移的困難性。

以以下的一個駕駛案例為例（見下圖），假設我們對於第一個駛向既定目標地的任務訓練了一個輸入維度為10維的策略網路。假設我們新增添了一個躲避障礙物的屬性，而這個屬性新增添了5維的資訊輸入，那麼我們需要新訓練一個15維輸入的神經網路。而由於我們對於神經網路的內部運轉的無知性，儘管這兩個任務非常相似，我們也無法複用任何已有知識而只能完全重新訓練新的策略網路。同理，假設我們新增添一個限速的屬性，而它又帶來了新的5維輸入，我們又不得不重新訓練一個新策略網路。

使用平行的屬性網路模組化自動駕駛中的控制策略網路圖1. 三個典型的類似的駕駛任務，但是對於他們的策略網路（非層級結構神經網路），沒有知識可以被複用，因此每個新任務需要重新訓練一個新的策略網路

因此我們的工作目標是建立起一套依據任務屬性的策略網路模組化系統，從而達到對於不同的駕駛屬性，如車道保持，障礙物躲避和交通規則，每一個屬性模組分別給出相關指示，而這些指示共同給出一個整體的駕駛指令。如下圖所示車道保持模組首先吸取車道相關資訊，並且給出相應的駕駛建議；障礙躲避模組吸收障礙物資訊，交通規則模組吸收交通規則相關的資訊，它們都給出和相應屬性相關的駕駛要求。最後，整個屬性網路整合所有屬性模組的要求，給出最終的駕駛指令，亦即策略網路的輸出。

使用平行的屬性網路模組化自動駕駛中的控制策略網路圖2. 平行的屬性網路的各模組的結構示意圖我們提出的平行屬性網路目標即為實現這一功能。這種層級結構的策略網路用一個獨立的神經網路來充當此前描述的屬性模組，該神經網路的輸入為該屬性相關的資訊，而輸出特定的駕駛要求。為了解釋不同屬性網路的輸出，我們首先把各個屬性分為兩類，一類是基礎的車道保持屬性，另一類是附加的屬性，如避障、遵守交通規則等。對於基礎的車道保持屬性，相應的屬性模組充當一個純車道保持策略網路，輸出一個當前時刻的駕駛命令，如下圖紅色向量所示。而對於其他的附加屬性，相應的屬性模組則輸出一個在駕駛命令空間裡的屬性集，這個屬性集被定義為，如果駕駛命令屬於該屬性集，則這一駕駛屬性可以被滿足，對於某兩個屬性，下圖中的藍色和黃色橢圓內的空間表示了這兩個屬性集。最後，平行屬性網路執行一個投影，將紅色向量指代的最初的指令向量投影到所有屬性集的交集中得到最終的指令，亦即圖中的綠色向量，即求得距離原指令最近的滿足所有屬性的命令。

使用平行的屬性網路模組化自動駕駛中的控制策略網路圖3. 平行屬性網路的內部執行方式我們進行了詳盡的模擬與實車實驗驗證了所提出的方法的有效性和優越性。在第一組實驗的訓練中，我們使用了線性屬性集假設，並且使用了增強學習和模仿學習的方法訓練了各個屬性網路，並且將各個屬性網路組合起來作為策略網路去控制無人車執行了很多未經訓練的駕駛任務。我們主要考察了查車道保持、避障、遵守紅綠燈和限速等常見駕駛屬性，下圖展示了若干未經直接訓練，而是直接通過屬性模組組合而成的策略網路執行相關任務時的駕駛行為示意圖。我們的實驗證明了：（1）使用模組化方法，高維的駕駛任務可以被降級成很多低維的屬性，從而更容易訓練；（2）平行屬性網路可以動態處理不同任務造成的不同維度的網路輸入；（3）對於一些未被訓練的任務，通過組合以訓練的屬性模組，我們可以得令人滿意的策略網路。

使用平行的屬性網路模組化自動駕駛中的控制策略網路圖4. 平行屬性網路作為策略網路控制無人車車道保持同時服從紅綠燈

使用平行的屬性網路模組化自動駕駛中的控制策略網路圖5. 平行屬性網路作為策略網路控制無人車車道保持同時服從限z

使用平行的屬性網路模組化自動駕駛中的控制策略網路圖6. 平行屬性網路作為策略網路控制無人車躲避障礙物同時服從紅綠燈和限速理論上，各個屬性模組的訓練可以使用增強學習和模仿學習，並且對於模仿學習，訓練集可以來自於人類標註或者理論計算結果。我們在實驗中比較了增強學習、模仿學習、以及用於生成模仿學習訓練集的專家執行者的表現，如下圖所示。這一實驗說明，增強學習可以得到比模仿學習更好的效果，這也是本方法的突出優勢之一。

使用平行的屬性網路模組化自動駕駛中的控制策略網路圖7. 增強學習、模仿學習training log以及生成模仿學習資料集的專家執行者的表現對比最後，我們還進行了實車實驗，驗證了我們的方法可以實時地控制無人車執行駕駛任務。實車實驗中我們使用平行屬性網路作為控制策略在模擬空間中生成一系列參考軌跡，再使用控制器控制無人車沿著軌跡形勢，這一部分工作主要整理發表在[2]文中。實驗表明，使用我們的平行屬性網路作為路徑規劃單元的控制系統可以控制無人車實時執行變道避障任務，下圖主要定性展示展示無人車在執行變道避障時的行為以及車載監控視角的表現。

使用平行的屬性網路模組化自動駕駛中的控制策略網路圖8. 變道避障實車實驗的現場照片以及車內監控視角示意圖

（具體方法及更詳盡的分析請參考論文）

[1] Zhuo Xu, Haonan Chang, Chen Tang, Changliu Liu, and Masayoshi Tomizuka, “Toward Modularization of Neural Network Autonomous Driving Policy Using Parallel Attribute Networks”in IEEE Intelligent Vehicles Symposium (IV), June. 2019

[2] Chen Tang^*, Zhuo Xu^*, and M. Tomizuka, “Disturbance Observer based Tracking Controller for Neural Network Driving Policy Transfer”, to appear in IEEE Transactions on Intelligent Transportation Systems in 2019.

華為：自動駕駛網路解決方案白皮書
2020-06-01
自動駕駛
中國移動：2021年中國移動自動駕駛網路白皮書
2021-07-29
自動駕駛
網際網路是模組化的 - Gordon
2022-04-17
Go
非同步網路模組之aiohttp的使用
2018-10-25
非同步AIHTTP
嬴徹大課堂 | 第三期：自動駕駛的「盾牌」- 網路安全
2020-03-23
自動駕駛
從網路工程師的角度看網路自動化的現狀
2021-02-24
工程師
自動駕駛系統的決策規劃模組介紹
2019-07-18
自動駕駛
自動駕駛控制演算法
2020-11-26
自動駕駛演算法
自智網路：網路自身的數字化轉型
2022-03-22
網路工程師眼中的自動化運維
2019-01-22
工程師運維
win10怎麼更改網路屬性_要如何更改網路屬性windows10
2020-08-20
Win10Windows
vue（24）網路請求模組axios使用
2021-07-27
VueiOS
IDC&華為：資料中心網路自動駕駛指數報告（附下載）
2022-03-17
自動駕駛
自動化簡化了移動傳輸網路的部署
2021-08-27
vue專案的網路模組封裝
2021-01-04
Vue封裝
2019年北京市自動駕駛路測報告
2020-03-02
自動駕駛
提供自動駕駛路況資訊採集服務
2023-01-30
自動駕駛
資料模型與網路自動化
2021-03-04
模型
使用Cloudflare for Teams的網際網路安全性
2021-03-02
Cloud
全面解讀自動駕駛的關鍵組成部分
2019-06-16
自動駕駛
美政府研究人們駕駛走神時間，證明自動駕駛的必要性
2018-03-06
自動駕駛
gPTP時間同步（時鐘同步）協議對智慧駕駛車載網路的重要性
2022-03-10
GPT協議
自動駕駛：兩種技術路線背後的產業思維
2020-07-27
自動駕駛產業
網路爬蟲的反扒策略
2021-09-11
爬蟲
Chinaev100：2020自動駕駛應用場景與商業化路徑
2020-10-29
自動駕駛
TensorFlow神經網路優化策略
2020-04-06
神經網路優化
自動駕駛資料閉環：實現高階自動駕駛的必由之路
2022-10-27
自動駕駛
利用魯棒控制實現深度強化學習駕駛策略的遷移
2018-12-19
強化學習
使用基於策略的網路擴充套件KubernetesDeployments
2018-12-15
套件
ReactNative自定義NetworkingModule網路模組
2018-06-13
React
vue - axios網路封裝模組
2020-11-09
VueiOS封裝
嬴徹科技CEO馬喆人：構建智慧卡車物流網路，引領自動駕駛落地
2019-04-03
自動駕駛
基於carla和python的自動駕駛模擬系列3
2020-09-26
Python自動駕駛
自動駕駛系列（七）——聊聊人機互動中的DMS駕駛員監控系統
2023-02-01
自動駕駛
【工業網際網路】李少遠：工業網際網路與智慧製造推動下的自動化技術
2018-04-23
感測器在自動駕駛中的應用
2023-03-03
自動駕駛
網路安全知識點中，Cookie有哪些安全屬性？
2021-03-05
Cookie
北京2020年度自動駕駛路測報告出爐
2021-02-06
自動駕駛

使用平行的屬性網路模組化自動駕駛中的控制策略網路

相關文章