最大綜合教學視訊資料集釋出,道路標記線會擾亂自動駕駛穩定性 | AI一週學術

大資料文摘發表於2019-03-18

最大綜合教學視訊資料集釋出,道路標記線會擾亂自動駕駛穩定性 | AI一週學術

大資料文摘專欄作品

作者:Christopher Dossman

編譯:Jiaxu、雲舟

嗚啦啦啦啦啦啦啦大家好,本週的AI Scholar Weekly欄目又和大家見面啦!

AI Scholar Weekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每週AI學術的前沿資訊,文末還會不定期更新AI黑鏡系列小故事。

週一更新,做AI科研,每週從這一篇開始就夠啦!

本週關鍵詞:端到端自動駕駛,幻想文字冒險遊戲,教學視訊分析的開源資料集

AI狂想

AI領域正在向兩個不同的方向發展,一種是小微型計算,另一種則是巨型計算。

本週熱門學術研究

針對端到端自主駕駛模型的簡單對抗例項

在開發多功能建模框架和模擬基礎設施來研究端到端自動駕駛模型的對抗性範例的過程中,研究人員發現,一些十分簡單且易於設計的物理條件,會對自動駕駛模型產生一定的對抗性。例如道路上的標記線就能夠打破端到端駕駛模型的穩定。

這些範例的對抗性有在很多情況下並不會呈現很強的干擾性,比如直線行駛的時候,但在諸如車輛轉彎的其他情況下,則會體現出很強的干擾性。

儘管對於人類來說,區分和避免此類衝突是十分簡單的,但對於端到端監視模型而言,這些干擾將造成嚴重的交通違規問題。在測試和實驗中,研究人員使用了CARLA自動駕駛汽車模擬器,證明這些物理擾亂不僅存在,而且在特定的駕駛情況下甚至對於最先進的模型也有相當強的作用。

最大綜合教學視訊資料集釋出,道路標記線會擾亂自動駕駛穩定性 | AI一週學術

潛在應用及影響

智慧機器學習系統極易受到干擾的問題引發了廣泛的擔憂。這些研究成果及其理論框架無疑為以後的研究提供了有用的資訊,並揭示了端到端深度學習模型的缺陷,便於日後改進。此外,該研究也為人工智慧工程師們進一步探索更大範圍內深度學習模型可能遭受的攻擊提供了重要的見解。

原文: 

https://arxiv.org/abs/1903.05157

綜合教學視訊分析資料集(COIN資料集)

為了解決教學視訊資料集缺乏多樣性和規模的問題,研究人員最近推出了COIN資料集,該資料集是現在用於綜合教學視訊分析的最大的視訊資料集。

該資料集以分層結構組織,包括大約11827個視訊,廣泛涵蓋了日常生活10個以上領域的180個課題 。 COIN資料集中的所有視訊都進行了一系列專業註釋。 此外,研究人員還提出了一個簡單有效的方法,可用於捕獲不同描述階段的資料依賴性。這類方法還可同傳統方法相結合,以更好地提取教學視訊中的關鍵步驟。

最大綜合教學視訊資料集釋出,道路標記線會擾亂自動駕駛穩定性 | AI一週學術

潛在應用及影響

研究人員對於COIN資料集的建立目的十分明確 ——通過豐富的語義分類來建立綜合全面的教學視訊資料集,為教學視訊分析提供基準。通過COIN的建立,研究人員也希望推動AI社群未來對教學視訊分析的深入研究。

COIN資料集:

https://coin-dataset.github.io/

原文: 

https://arxiv.org/abs/1903.02874v1

不犧牲準確性的量化

通常情況下,量化會降低模型精度。 儘管如此,研究人員依舊致力於通過改進量化技術,從而減少量化過程中精確度的降低。在最近的一篇論文中,他們提出了一種可以有效地量化模型權重的聚焦量化技術。

論文中所提出的量化方法使用高斯混合表示來定位模型權重分佈中的高概率區域,並且以精細水平量化它們。 此外,這一量化技術僅使用-2的冪來提供有效的計算模式。

最大綜合教學視訊資料集釋出,道路標記線會擾亂自動駕駛穩定性 | AI一週學術

通過一系列整合修剪和編碼,他們已經設法在各種CNN上展示出高階壓縮比。 例如,它們在ResNet-50中達到18.08×的壓縮比,在模型精度方面的損失僅為可以忽略不計的0.24%,超過了當前的壓縮技術。

潛在應用及影響

與深度神經網路的量化計算整合的量化引數,具有極高的實現大量計算增益和優化效能的能力。 該論文所提出的聚焦量化可以使模型尺寸和計算成本降低,並轉化為高壓縮比,同時提高了當前和未來CNN的效率。

原文:

https://arxiv.org/abs/1903.03046v1

LIGHT:在幻想文字冒險遊戲中學習說話和行動

想象一下,如果有一款遊戲,多個計算機和人類都可以充當遊戲角色,這樣的遊戲會是什麼樣呢?研究人員最近推出了這樣一款幻想文字冒險遊戲,玩家可以在與多個玩家建立對話的同時,進行識、行動和表達等互動。

現有的文字冒險遊戲通常是單人的,並且玩家無法在遊戲中與人類進行對話,這就是為什麼我覺得這個遊戲聽起來很有趣和有冒險性。

在人與文字的互動遊戲中學習(LIGHT),是一款多玩家的幻想文字冒險遊戲,旨在幫助機構研究人類間多方面的動態協作對話。

該文字類的遊戲設定於一個內涵豐富的遊戲世界,其中包括超過660個位置,3460個物件和僅以自然語言定義的1750個字元。研究人員已經收集了大量的資料集(11k集),這些資料集涉及行為,表達和對話等角色驅動的人與人之間的相互作用,其目的是訓練模型以類似的方式吸引人類。

測試結果表明,在此條件下訓練、生成和檢索模型可以有效地利用遊戲世界的潛在條件或規則來調節他們的預測。

最大綜合教學視訊資料集釋出,道路標記線會擾亂自動駕駛穩定性 | AI一週學術


潛在應用及影響

LIGHT提供了一個可用於在許多不同的任務中共享,培訓和評估協作對話模型的統一平臺,使人們能夠以有趣的方式與機器進行互動。 該框架通過提供合適的研究平臺,允許研究機構進行多種協作和學習,從而研究和增強現有的協作對話系統。 研究人員希望這項工作能夠進一步促進和推動基礎語言學習的研究工作。

官網:

http://parl.ai/

原文:

https://arxiv.org/abs/1903.03094v1

利用機器學習實現自動機器人的自適應

研究人員提出了一種綜合學習和定量規劃的方法,其主要目標是在機器人系統等動態和不確定環境中執行的高度可配置系統中實現自適應。該技術使用配置更改作為實施適應的主要機制。

該方法的創新之處在於,它應用機器學習來發現帕累托最優配置,而無需探索所有配置,並將搜尋空間的限制應用於可控計劃的特定設定。通過這種方式,它可以將學習和定量計劃結合起來,以實現執行時的自適應。

此外,該方法有助於在定量規劃中整合來自多個模型的資訊。具體來說,研究人員探索了需要考慮時間和能量消耗的機器人操作。獨立的評估表明,該方法在不確定和動態環境中產生了高質量的適應過程。

最大綜合教學視訊資料集釋出,道路標記線會擾亂自動駕駛穩定性 | AI一週學術

潛在應用及效果

作為一種能夠有效實現機器人自適應的整合學習和定量規劃方法的新技術,該方法可用於許多其他網路物理系統。此外,它還可以作為線上介面擴充套件到執行時模型更新的介面中。

原文:

https://arxiv.org/abs/1903.03920

其他爆款論文

最近的研究表明,通過演示,你現在可以教機器人完成兩個不同的清潔任務。     

原文:

https://arxiv.org/abs/1903.05635

在允許可靠的攝像機姿態估計時,如何避免在拍攝的3D場景上洩露機密資訊?最近的一項研究提出了一種基於影像的隱私保護定位解決方案。

原文:

https://arxiv.org/abs/1903.05572

谷歌推出了一個新的開放原始碼庫,可以有效地訓練巨型神經網路。

網頁:

https://ai.googleblog.com/2019/03/introducing-gpipe-open-source-library.html

以下是基於例項和類別級別的6D物件姿態估計,用於擴增實境、機器人控制和導航等應用。

原文:

https://arxiv.org/abs/1903.04229

想知道如何在生物醫學文字中總結和發現有意義的概念嗎?

原文:

https://arxiv.org/abs/1903.02861v1

AI新聞

谷歌釋出了一種基於神經網路的端到端語音識別器,以支援最先進的語音識別。

更多資訊:

https://ai.googleblog.com/2019/03/an-all-neural-on-device-speech.html

研究人員的好訊息:Deep Mind開發了一個開源軟體庫來幫助他們部署TensorFlow模型。

更多資訊:

https://deepmind.com/blog/tf-replicator-distributed-machine-learning/

中國最終會在AI研究上超越美國嗎?現在中國關於AI的論文釋出數量已經超越了美國。

閱讀更多:

https://www.wired.com/story/china-catching-up-us-in-ai-research/amp

最大綜合教學視訊資料集釋出,道路標記線會擾亂自動駕駛穩定性 | AI一週學術
專欄作者介紹

Christopher Dossman是Wonder Technologies的首席資料科學家,在北京生活5年。他是深度學習系統部署方面的專家,在開發新的AI產品方面擁有豐富的經驗。除了卓越的工程經驗,他還教授了1000名學生了解深度學習基礎。

LinkedIn:

https://www.linkedin.com/in/christopherdossman/

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2638673/,如需轉載,請註明出處,否則將追究法律責任。

相關文章