自動駕駛行業的未來由資料標註來撐起丨曼孚科技

曼孚科技發表於2020-09-08
自動駕駛行業的未來由資料標註來撐起丨曼孚科技

自動駕駛經過最近十多年的發展,從技術、產業到政策監管都有了長足的進步。

尤其隨著環境感知、智慧決策、控制與執行系統等核心技術的快速發展與成熟,自動駕駛汽車已經從實驗室走向道路實地測試及商業化落地應用的階段。

以國內為例,目前已在廣州、長沙、上海、武漢、滄州、北京等多地展開自動駕駛計程車載人測試,開始嘗試將自動駕駛計程車作為出行服務提供給普通民眾,驗證運營模式以及商業模式。

不過,從自動駕駛商業化發展的趨勢來看,這僅僅是比較初級的商業化嘗試,目前自動駕駛計程車在車輛數量、封閉測試里程數量以及載客物件方面都有著十分嚴苛的要求,而造成這種現象的主要原因是相關技術的不成熟。

L3級別以上的自動駕駛系統主要由感知、定位、預測、決策和控制五部分構成,每一部分都不可或缺。其對於計算機視覺技術的需求度十分之高,系統需要對感測器採集的點雲影像資料進行處理,構建車輛行駛環境,為預測和決策做依據,這對於演算法的準確性和實時性有著極大考驗。

目前自動駕駛的視覺技術主要應用有監督的深度學習,是基於已知變數和因變數推導函式關係的演算法模型,需要大量的標註資料對模型進行訓練和調優。

換句話說,想要讓自動駕駛汽車更加“智慧”、自動駕駛演算法能夠更加從容應對複雜多變的道路環境,背後就需要有海量且高質量的真實道路資料做支撐。

自動駕駛行業的未來由資料標註來撐起丨曼孚科技

自動駕駛標註資料(來源:曼孚科技)

這些資料主要以車載攝像頭採集的2D影像資料和鐳射雷達採集的3D點雲資料為主,場景包括換道超車、透過路口、無紅綠燈控制的無保護左轉、右轉,以及一些複雜的長尾場景諸如闖紅燈車輛、橫穿馬路的行人、路邊違章停靠的車輛等等。

通常情況下,自動駕駛領域相關演算法訓練對於這些標註資料的需求是海量的。在一些世界級的自動駕駛比賽中,主辦方往往會提供近億張圖片以及數十萬張標註圖片供參賽團隊訓練使用,透過使用這些真實路況資料對演算法進行不斷最佳化,才能保障無人駕駛車輛正常可用。

除了數量要求很高以外,標註資料集的質量要求也很高。人工智慧行業的一個共識是,標註資料集的質量直接決定演算法模型的質量。通常情況下,自動駕駛企業對於標註資料集的準確率要求為高於95%,在某些情況下甚至要超過99%。

隨著國內自動駕駛行業的飛速發展,該領域的資料採集和標註需求已經成為資料服務供應商的主要專案之一,且自動駕駛演算法應用仍待最佳化,資料需求缺口仍在,市場遠未飽和。

據艾瑞諮詢相關統計資料顯示,2018年自動駕駛行業基礎資料服務規模為5.76億元,預計2025年將超24億元,行業資料總任務量超一億張。

如何解決海量高質量資料集的供給成為了當下制約自動駕駛行業進一步發展的關鍵問題之一,也是擺在一眾資料服務企業尤其是資料標註企業面前亟需解決的核心問題之一,從某種意義上來說,資料標註行業在某種程度上已經成為了制約自動駕駛商業化落地的絆腳石。

未來,提高資料交付能力與提高資料質量將成為資料標註行業的主要發展方向,從需求側確定需求,定製化打造適合自動駕駛行業的資料服務,將有效助力自動駕駛商業化落地程式,共建人工智慧商業應用場景新生態。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956378/viewspace-2718087/,如需轉載,請註明出處,否則將追究法律責任。

相關文章