FB嵌入式人工智慧平臺釋出,單目3D姿態估計新方法,全球人工智慧發展報告 | AI一週學術

大資料文摘發表於2019-04-09

FB嵌入式人工智慧平臺釋出,單目3D姿態估計新方法,全球人工智慧發展報告 | AI一週學術

大資料文摘專欄作品

作者:Christopher Dossman

編譯:笪潔瓊、conrad、雲舟

嗚啦啦啦啦啦啦啦大家好,本週的AI Scholar Weekly欄目又和大家見面啦!

AI Scholar Weekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每週AI學術的前沿資訊,文末還會不定期更新AI黑鏡系列小故事。

週一更新,做AI科研,每週從這一篇開始就夠啦!

本週關鍵詞: 嵌入式人工智慧、語義資料集、3D姿態估計、大型機器人網路

本週熱門學術研究

嵌入式人工智慧研究平臺Habitat

來自Facebook人工智慧研究中心、佐治亞理工學院、Facebook現實實驗室、西蒙弗雷澤大學、英特爾實驗室和加州大學伯克利分校的研究人員展示了最有趣的機器人研究進展之一——Habitat。

Habitat是一個新的嵌入式人工智慧研究平臺。可以把它想象成一個機器人的世界,在這個世界裡,機器人的訓練採用高效、逼真的3D模擬形式,之後它們就可以被轉移到現實世界中去。

Habitat包括:

1. 一個高效能的3D模擬器,具有可配置的代理、感測器和通用的3D處理功能,內建了對Matterport3D、SUNCG和Gibson資料集的支援。

2.  Habitat API——一個整合的高階庫,允許使用者在不同的3D場景資料集中使用不同的方法訓練和基準測試人形智慧代理。

3.  Habitat挑戰——以視覺導航為基準並以推進目標為導向的努力。

FB嵌入式人工智慧平臺釋出,單目3D姿態估計新方法,全球人工智慧發展報告 | AI一週學術

潛在應用及影響

Habitat是一個範例的轉變。它為人形智慧代理提供了一個在現實環境中行動和學習的環境,將加速對人形人工智慧的研究。

這並不是說資料表已經完全轉變了,但儘管資料集在計算機視覺和自然語言處理過程中起到了重要的推動作用,但功能豐富的模擬器可能很快就會開始發揮作用。當然,這還有很長的路要走,只有人工智慧研究社群的全面參與與投入才能取得成功。

Habitat平臺是開源的,詳細資訊:

原文:

語義KITTI資料集

最近,一組研究人員開發了一個新的大規模語義KITTI資料集,該資料集在點雲序列的點向註釋方面具有特殊的規模。

該資料集是基於KITTI基準的里程測量資料集,包含城市內部交通、居民區、公路場景和鄉村道路,但不影響原始的里程測量基準。

FB嵌入式人工智慧平臺釋出,單目3D姿態估計新方法,全球人工智慧發展報告 | AI一週學術

新資料集也是同類資料中最大的,包括23201個用於訓練、20351個用於測試的完整3D掃描。為了開發資料集,研究人員避免使用邊界框或KITTI資料集可用的註釋來確保標籤的準確性和一致性。

該資料集已在PointNet、PointNet++、切線卷積、SPLATNet、超點圖和SqueezeSeg等六種點雲語義分割體系結構上進行了評估和測試。測試結果表明,現有的點雲語義分割模型無法匹配資料集的大小和複雜度。

潛在用途及影響

語義KITTI資料集提供了一系列不同的基線實驗,用於使用單個掃描、多個掃描以及語義場景完成任務的語義分割。它還致力於推動計算機視覺和自動駕駛機器人應用的發展。

原文:

利用卷積變分自編碼器進行單目3D姿態估計

最近的研究試圖透過一個深層條件變分自動編碼器來解決2D到3D提升的固有困難。研究人員提出了一種基於深度學習的生成模型,以估計的2D姿態為條件,合成不同的3D姿態樣本。透過這樣做,他們解決了從2d到3d提升過程中遇到的模糊性。

FB嵌入式人工智慧平臺釋出,單目3D姿態估計新方法,全球人工智慧發展報告 | AI一週學術

這是首次將深度條件變分自編碼器(CVAE)應用於3D人體姿態估計。研究人員使用兩種技術來預測最終的3D姿勢,包括有序排列和甲骨文。從RGB影像中得到關節序數關係,並展示了它們對使用oracle報告的3D姿態樣本進行排序的用法。

該方法允許三維姿態建模,並提供了繪製不同的三維樣本的靈活性,從而在Human3.6M和Human-Eva基準資料集上產生了有競爭力的結果。

潛在用途及影響

研究人員是否終於解決了單目三維姿態估計的長期難題?這項研究讓我的思緒回到了2014年GANs發現的時代。這是CVAE首次應用於單眼3D姿態估計。

新框架在兩個基準資料集上獲得了具有競爭力的結果。此外,該模型可以在沒有配對3D監督的情況下進行訓練,仍然可以產生有競爭力的結果。我認為這個新模型是人工智慧研究社群願意深入研究的東西,能夠幫助推動3D姿態估計的進步。

請注意訓練和評估程式碼:

原文:

模仿學習的生成式前代模型

借鑑已有的生成模型,研究人員提出了新的模仿學習生成前代模型(GPRIL),該模型對多步生成前代分佈進行建模,實現狀態-動作分佈匹配。

新方法基於一個概念:即,使用專家演示和環境動態增強訓練資料集,這些資料集預先提供給人形人工智慧,並且只能透過互動進行觀察。狀態-動作對使得人形人工智慧能夠有效地模仿專家,並透過糾正行為和減少錯誤進行訓練。

FB嵌入式人工智慧平臺釋出,單目3D姿態估計新方法,全球人工智慧發展報告 | AI一週學術

透過這種方式,該方法使得人形人工智慧可以僅使用少數專家演示和與周圍環境的自監督互動來學習魯棒性的策略。GPRIL在兩個模擬機器人操作任務上達到或優於現有的模擬模型,並在真實機器人上顯示了相當高的樣本效率。

潛在用途及影響

GPRIL可以幫助我們解決真實世界中訓練人形人工智慧的樣本效率低下或計算可行性方面的挑戰。此外,它還有潛力使自主技術訓練過程更安全、快速。

原文:

高效的大型機器人網路規劃與協調

來自中國的研究人員進行研究時,發現大型機器人網路仍然存在著一些經常發生的問題。在由大量機器人組成的網路中,如果它們缺乏密度分佈平衡,就會導致交通擁擠、衝撞和停頓。

作為這些問題的解決方案,研究人員提出了一種用於倉儲和物流應用的分割槽任務規劃和行動協調方法。在任務規劃方面,對倉庫環境進行了劃分,並使用一個交通熱力圖實現了機器人的密度分佈。

然後,他們應用近鄰任務分配技術,將特定的任務分配給最近的自由機器人,並在拓撲圖中進行高階路徑規劃。所有行動都能保證交通流動的平衡,並使實時狀態呈現優異表現。

FB嵌入式人工智慧平臺釋出,單目3D姿態估計新方法,全球人工智慧發展報告 | AI一週學術

另一方面,該方法還透過在每個分割槽中的本地協作演算法和用於協調成對相鄰分割槽的通道預留方法來實現行動協調。在此基礎上,提出了一種線上迴圈規劃機制,提高了模型對機器人運動延遲和通訊故障的容忍度。最後,每個機器人對其規劃的道路路徑實施控制追蹤機制,以避免可能發生的碰撞。

潛在用途及影響

我非常喜歡這個研究成果。這個方法具有很大的潛力,可以消除擁有1000個機器人以上的倉庫中大型機器人網路的主要通訊和運動不確定性問題。我們正在尋找更有效、更高效、更穩定的未來倉庫型機器人應用。

原文:

其他爆款研究

用於探索和追蹤無人機|(uav)的學習模擬器。

你想知道如何為sim2real強化學習策略的遷移選擇領域隨機化引數嗎?

從2015年到2018年在速記加密和速記分析方面的深度學習總結。

無需選擇模型和超引數調優就可以獲得具有競爭力的效能的一種簡單遷移學習方法。

最先進的單目3D人類姿勢估計。

AI新聞

麻省理工學院使用較少的訓練資料來學習物件之間關係的人工智慧模型。

人工智慧的傳輸速度將比新晶片快1000倍。

在過去的幾年裡,全球的人工智慧研究和發展有了很大的變化。預計的發展增長就像人工智慧領域海洋中的一滴水。

報告原文:

FB嵌入式人工智慧平臺釋出,單目3D姿態估計新方法,全球人工智慧發展報告 | AI一週學術
專欄作者介紹

Christopher Dossman是Wonder Technologies的首席資料科學家,在北京生活5年。他是深度學習系統部署方面的專家,在開發新的AI產品方面擁有豐富的經驗。除了卓越的工程經驗,他還教授了1000名學生了解深度學習基礎。

LinkedIn:

https://

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2640813/,如需轉載,請註明出處,否則將追究法律責任。

相關文章