機器人學前班助力機器人簡單快速學習,給予強化學習的自動駕駛策略 | 一週AI學術

大資料文摘發表於2019-05-27

機器人學前班助力機器人簡單快速學習,給予強化學習的自動駕駛策略 | 一週AI學術

大資料文摘專欄作品

作者:Christopher Dossman

編譯:fuma、Jiaxu、雲舟

嗚啦啦啦啦啦啦啦大家好,本週的AI Scholar Weekly欄目又和大家見面啦!

AI Scholar Weekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每週AI學術的前沿資訊。

週一更新,做AI科研,每週從這一篇開始就夠啦!

本週關鍵詞:自動駕駛、智慧機器人、GANs

本週熱門學術研究

機器人學前班

機器人需要以直觀和實用的方式學習操作,以便在現實環境中更成功地部署。為此,研究人員訓練了ResNet的一個變體,將手眼相機影像對映到末端效應器速度。

在他們的方法中,人類教師透過操縱桿向機器人演示簡單的服務型任務,並在一個小時內進行資料收集,訓練和部署。

機器人學前班助力機器人簡單快速學習,給予強化學習的自動駕駛策略 | 一週AI學術

本文的貢獻是一種資料有效的實用方法,可以在很短的時間內教授機器人新行為。這些都表明機器人可以透過實際演示快速學習簡單的任務。此外,該技術可用於學習資料低效強化學習的快速策略。

原文:

基於強化學習的高速公路自動駕駛汽車行駛策略

研究人員首次在基於強化學習的實時自動駕駛策略中為在高速公路上行駛的車輛做出了貢獻。這一策略透過部署Double Deep Q-Network實現,並且能夠引導在高速公路上行駛的自動駕駛汽車。

此外,該策略還能夠透過巧妙設計的目標函式來考慮乘客的舒適度。最終,該策略使得汽車產生了一條無碰撞軌跡,自動駕駛汽車將以所需速度向前移動,同時最小化其縱向和橫向加速度。

自動駕駛工程師在考慮交通密度和安全等多個角度的情況下制定除了可行的路徑規劃策略,這是一個很大的成功。

這項工作是學者們嘗試針對無限制高速公路制定強化學習策略的第一次嘗試。併為軌跡路徑規劃問題提供了很多見解。該工作還使用了已建立的SUMO微觀交通模擬器研究新強化學習策略的泛化能力和穩定性。

再計算成本上,動作的產生需要的計算成本顯著降低,並能夠推廣到以前看不見的駕駛情況。遺憾的是,目前該策略還不能保證產生無碰撞的軌跡。

在自動駕駛汽車中實現安全感知軟體

到目前為止,還沒有關於安全感知AV(Autonomous Vehicles)計算系統和架構設計的明確指南。這促使了研究人員進行實地研究,包括各個地區的自動駕駛車隊,道路狀況和交通模式。根據研究,傳統的計算系統效能指標不能完全滿足AV計算系統設計的安全要求。 相反,他們建議使用“安全評分”作為衡量AV計算系統設計安全水平的主要指標。他們還提出了感知延遲模型,以幫助架構師估計給定架構和系統設計的安全分數,而無需在AV中對其進行物理測試。

機器人學前班助力機器人簡單快速學習,給予強化學習的自動駕駛策略 | 一週AI學術

本文的貢獻是提出了安全感知AV計算系統設計的安全評分和感知延遲模型。它詳細闡述了AV計算系統的詳細設計和工作負載,並討論了安全感知的AV系統設計含義。由於自動駕駛汽車在透過道路自由行駛之前還有很長的路要走,因此本文的工作只是安全感知視聽系統設計研究的起點。這是一個呼籲人工智慧研究人員和工程師隨著領域的進步繼續改進它的優秀工作。

利用領域自適應彌補合成和實際點雲資料的差異

研究人員提出了一種基於深度學習的生成對抗網路(GANs)領域自適應方法,透過3D 光學雷達感測器獲取實際點雲資料以協助車輛檢測。該框架基於迴圈一致的生成對抗網路(CycleGAN)架構。

在真實鳥瞰圖(BEV)點雲影像中的車輛檢測任務上,該框架取得了有競爭力的結果。 在真實鳥瞰點雲影像上進行測試時,該框架比其他基線方法提高了超過七個百分點 。

機器人學前班助力機器人簡單快速學習,給予強化學習的自動駕駛策略 | 一週AI學術

經過訓練的模型獲得了64.29%的準確率,從而顯示了這一領域自適應方法在真實鳥瞰點雲影像中的車輛檢測任務上的有效性。 該框架的實施可以發展目標檢測的最新技術。

透過實際照片創造個性化的頭部對話模型

研究人員提出了一種用於對抗生成模型元學習的框架,該框架能夠以深度生成器網路的形式訓練高度逼真的虛擬對話頭像。 該框架僅透過少量照片即可建立一個新的模型。

在32幅影像上訓練的模型達到了完美的真實感和個性化評分。 新演算法能夠基於個人修改生成器和判別器的引數,從而僅使用少量影像快速完成訓練。

機器人學前班助力機器人簡單快速學習,給予強化學習的自動駕駛策略 | 一週AI學術

本文提出的框架能夠學習高度逼真和個性化的對話頭像。透過在大規模影片資料集上執行長時間的元學習,該方法能夠將陌生人臉對話頭像模型的小樣本學習作為高容量生成器和判別器的對抗訓練問題。

該方法可用於增強和實現人機互動、自然語言處理和自動對話系統,能夠在影片序列中合成合理的對話。

它還具有在網真(telepresence)領域的實際應用,包括視訊會議和多人遊戲以及特效行業。

原文:

其他爆款論文

透過視覺,鐳射雷達和GPS / IMU定位的全新物體檢測和跟蹤系統 。

使用Range-Image U-Net實現3D鐳射雷達點雲的簡單準確語義分割。

透過研究性學習和競賽幫助學生逐步實施機器人專案。

一種用於將重疊的腦組織資料數字化分層的成像模型 。

一種自動生成突出顯示的大腦結構影像的軟體。

AI新聞

比GPU更快的新型可程式設計晶片可以解決最棘手的最佳化問題。

資料科學家的需求水漲船高。

公司希望利用人工智慧,但缺乏技能以協助執行人工智慧策略。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2645750/,如需轉載,請註明出處,否則將追究法律責任。

相關文章