機器人學前班助力機器人簡單快速學習,給予強化學習的自動駕駛策略 | 一週AI學術
大資料文摘專欄作品
作者:Christopher Dossman
編譯:fuma、Jiaxu、雲舟
嗚啦啦啦啦啦啦啦大家好,本週的AI Scholar Weekly欄目又和大家見面啦!
AI Scholar Weekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每週AI學術的前沿資訊。
週一更新,做AI科研,每週從這一篇開始就夠啦!
本週關鍵詞:自動駕駛、智慧機器人、GANs
本週熱門學術研究
機器人學前班
機器人需要以直觀和實用的方式學習操作,以便在現實環境中更成功地部署。為此,研究人員訓練了ResNet的一個變體,將手眼相機影像對映到末端效應器速度。
在他們的方法中,人類教師透過操縱桿向機器人演示簡單的服務型任務,並在一個小時內進行資料收集,訓練和部署。
本文的貢獻是一種資料有效的實用方法,可以在很短的時間內教授機器人新行為。這些都表明機器人可以透過實際演示快速學習簡單的任務。此外,該技術可用於學習資料低效強化學習的快速策略。
原文:
基於強化學習的高速公路自動駕駛汽車行駛策略
研究人員首次在基於強化學習的實時自動駕駛策略中為在高速公路上行駛的車輛做出了貢獻。這一策略透過部署Double Deep Q-Network實現,並且能夠引導在高速公路上行駛的自動駕駛汽車。
此外,該策略還能夠透過巧妙設計的目標函式來考慮乘客的舒適度。最終,該策略使得汽車產生了一條無碰撞軌跡,自動駕駛汽車將以所需速度向前移動,同時最小化其縱向和橫向加速度。
自動駕駛工程師在考慮交通密度和安全等多個角度的情況下制定除了可行的路徑規劃策略,這是一個很大的成功。
這項工作是學者們嘗試針對無限制高速公路制定強化學習策略的第一次嘗試。併為軌跡路徑規劃問題提供了很多見解。該工作還使用了已建立的SUMO微觀交通模擬器研究新強化學習策略的泛化能力和穩定性。
再計算成本上,動作的產生需要的計算成本顯著降低,並能夠推廣到以前看不見的駕駛情況。遺憾的是,目前該策略還不能保證產生無碰撞的軌跡。
在自動駕駛汽車中實現安全感知軟體
到目前為止,還沒有關於安全感知AV(Autonomous Vehicles)計算系統和架構設計的明確指南。這促使了研究人員進行實地研究,包括各個地區的自動駕駛車隊,道路狀況和交通模式。根據研究,傳統的計算系統效能指標不能完全滿足AV計算系統設計的安全要求。 相反,他們建議使用“安全評分”作為衡量AV計算系統設計安全水平的主要指標。他們還提出了感知延遲模型,以幫助架構師估計給定架構和系統設計的安全分數,而無需在AV中對其進行物理測試。
本文的貢獻是提出了安全感知AV計算系統設計的安全評分和感知延遲模型。它詳細闡述了AV計算系統的詳細設計和工作負載,並討論了安全感知的AV系統設計含義。由於自動駕駛汽車在透過道路自由行駛之前還有很長的路要走,因此本文的工作只是安全感知視聽系統設計研究的起點。這是一個呼籲人工智慧研究人員和工程師隨著領域的進步繼續改進它的優秀工作。
利用領域自適應彌補合成和實際點雲資料的差異
研究人員提出了一種基於深度學習的生成對抗網路(GANs)領域自適應方法,透過3D 光學雷達感測器獲取實際點雲資料以協助車輛檢測。該框架基於迴圈一致的生成對抗網路(CycleGAN)架構。
在真實鳥瞰圖(BEV)點雲影像中的車輛檢測任務上,該框架取得了有競爭力的結果。 在真實鳥瞰點雲影像上進行測試時,該框架比其他基線方法提高了超過七個百分點 。
經過訓練的模型獲得了64.29%的準確率,從而顯示了這一領域自適應方法在真實鳥瞰點雲影像中的車輛檢測任務上的有效性。 該框架的實施可以發展目標檢測的最新技術。
透過實際照片創造個性化的頭部對話模型
研究人員提出了一種用於對抗生成模型元學習的框架,該框架能夠以深度生成器網路的形式訓練高度逼真的虛擬對話頭像。 該框架僅透過少量照片即可建立一個新的模型。
在32幅影像上訓練的模型達到了完美的真實感和個性化評分。 新演算法能夠基於個人修改生成器和判別器的引數,從而僅使用少量影像快速完成訓練。
本文提出的框架能夠學習高度逼真和個性化的對話頭像。透過在大規模影片資料集上執行長時間的元學習,該方法能夠將陌生人臉對話頭像模型的小樣本學習作為高容量生成器和判別器的對抗訓練問題。
該方法可用於增強和實現人機互動、自然語言處理和自動對話系統,能夠在影片序列中合成合理的對話。
它還具有在網真(telepresence)領域的實際應用,包括視訊會議和多人遊戲以及特效行業。
原文:
其他爆款論文
透過視覺,鐳射雷達和GPS / IMU定位的全新物體檢測和跟蹤系統 。
使用Range-Image U-Net實現3D鐳射雷達點雲的簡單準確語義分割。
透過研究性學習和競賽幫助學生逐步實施機器人專案。
一種用於將重疊的腦組織資料數字化分層的成像模型 。
一種自動生成突出顯示的大腦結構影像的軟體。
AI新聞
比GPU更快的新型可程式設計晶片可以解決最棘手的最佳化問題。
資料科學家的需求水漲船高。
公司希望利用人工智慧,但缺乏技能以協助執行人工智慧策略。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2645750/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 谷歌“學習機器人”:機器像人腦一樣思考谷歌機器人
- 【日報·精選】深度學習助力無人駕駛、谷歌或推出聊天機器人深度學習谷歌機器人
- 機器人運動學機器人
- 強化學習-學習筆記3 | 策略學習強化學習筆記
- 機器人學 —— 飛行機器人(Introduction)機器人
- 科學家教會機器人用嬰兒的方式來學習機器人
- Human vs AI,人類和機器的學習究竟誰更勝一籌?AI
- 機器人策略學習的Game Changer?伯克利提出Body Transformer機器人GAMORM
- ROS | ROS機器人開發案例(古月)學習ROS機器人
- 自動駕駛最強學習資料自動駕駛
- 自動聊天機器人專案班 [一門課搞定聊天機器人]機器人
- 最新最簡易的遷移學習方法,人員再識別新模型 | AI一週學術遷移學習模型AI
- 谷歌為機器人學習加快步伐 機器人危險不危險?谷歌機器人
- OpenAI公佈強化學習新演算法,可控制複雜機器人OpenAI強化學習演算法機器人
- 用深度學習網路搭建一個聊天機器人(下篇)深度學習機器人
- 用深度學習網路搭建一個聊天機器人(上篇)深度學習機器人
- 【強化學習】使用off-policy演算法機器人抓取任務基準;生成對抗網路 GAN 就是強化學習強化學習演算法機器人
- 【強化學習】強化學習/增強學習/再勵學習介紹強化學習
- 【強化學習】強化學習術語表(A-Z)強化學習
- 如何簡化機器人自動化的整合機器人
- 科學實驗室走向全自動化,機器人融合AI,加速科學發現,Science子刊觀點機器人AI
- 字尾自動機學習
- 工業自動化,機器人和無人駕駛產品-協作和服務機器人機器人
- 機器人開始學習功能 人類的福音還是毀滅的前奏!機器人
- pytorch&scikit-learn機器學1- 賦予計算機從資料中學習的能力PyTorch計算機
- 【強化學習篇】--強化學習案例詳解一強化學習
- 【機器人】東南大學段晉軍博士教你輕鬆學習工業機器人系統機器人
- 人的資料科學與機器資料科學資料科學
- 強化學習-簡介強化學習
- 技術學習的一些感慨-人之為學
- 深度學習:智慧對話機器人適用場景與技術解析深度學習機器人
- 日本Android“U”美女機器人 自主學習顏值頗高Android機器人
- 車聯網,深度學習,無人駕駛深度學習
- 機器是如何學習推理的?
- 學習靈巧的手部操作,強化學習賦能機械臂強化學習機械臂
- 機器人使機床自動化機器人
- 洋蔥數學楊臨風:AI人機互動學習開啟線上教育3.0時代AI
- 人人都能用的深度學習:當前三大自動化深度學習平臺簡介深度學習