自動駕駛車企引入資料驅動的端到端的開發流程
盤點車企在自動駕駛領域的佈局,除了特斯拉、理想、蔚來、小鵬等造車新勢力,傳統車企也愈加重視自動駕駛業務,紛紛成立獨立子公司專注於智慧駕駛的開發,如一汽集團成立人工智慧子公司一汽(南京)科技開發有限公司;長城汽車成立毫末智行;上汽集團籌建軟體中心上汽零束等。
自動駕駛行業專家們使用基於深度學習的開發流程——也就是資料驅動的端到端的開發流程來研發自動駕駛系統,基本按照如下思路:資料採集->資料儲存->資料預處理->資料探勘->資料標註->模型訓練->模擬測試->部署釋出。在這個環節中使用的工具鏈決定了整個系統開發的效率。
自動駕駛是2020至今AI基礎資料服務支出規模最大的細分行業,同時也是最具增長潛力的行業,主要資料採集需求包括車內駕駛艙以及車外道路環境感知等場景。資料處理包括對攝像頭資料、毫米波雷達資料、鐳射雷達點雲資料進行去噪清洗,去除地理位置、人臉、車牌等敏感資訊並且統一格式。資料處理完成後對資料進行標註,標註型別大致分為2D、3D目標物標註、聯合標註、車道線標註和語義分割等。
由於具體採集規範和標註質檢流程異常繁瑣,對自動駕駛車企來說資料採集標註的外包化和對高質低價的追求也趨於明顯。
IDC釋出的《中國人工智慧基礎資料服務市場追蹤報中》中提出標註質量、標註效率、知識經驗、資料安全、整體成本五個維度,是使用者對AI資料服務商最重要的能力要求。景聯文科技是AI基礎資料服務行業的頭部供應商,也是長三角地區最大的自動駕駛數採集標註公司,擁有10年專業資料採集經驗,成立至今已為【阿里巴巴】,【華為】,【美團】,【海康威視】等數百家AI頭部企業提供資料解決方案。
自動駕駛場景中應用較為廣泛的資料標註型別
在以深度學習為主的感知模型中,主流的深度學習訓練方法還是監督學習,用這種方法訓練,需要向模型“餵養”海量有“真值(Ground Truth)”的資料。模型訓練對標註資料的質量要求很高,資料質量直接決定了訓練出來的模型精度高低,標註質量又和標註成本密切相關,選擇小型標註團隊的廉價勞動力能否滿足開發者們的需求是一個問題,高質量的標註要求,必然導致人力成本上升,低價格則會影響標註質量,高質量和低價格是一個需要開發者平衡的矛盾。
景聯文科技位於杭州,作為行業內具備一定規模的平臺型廠商,為了提升標註服務的質量/價格比,大力最佳化標註平臺實現Al資料的全生命週期管理和供應鏈管理,專案協同,AI人機協同,自定義許可權的資料處理能力,全面支援影像、音訊等資料標註需求,支援多型別標註模板,標註結果支援多種格式線上匯出。支援全面標註、質檢、驗收和管理,開放甲方驗收通道,可按照甲方要求轉換格式校對資料。並研發自動化輔助標註功能,運用AI技術直接對2D影像資料進行場景分割、人臉和物體識別,自動完成標註後再由人工進行校隊,標註員只需要對AI標註的資料進行檢查調整即可提交進入稽核,資料精準度可達99.99%,提高標註效率有效降低成本。
自動駕駛場景中應用較為廣泛的資料處理標註型別除了2D影像標註,還有3D點雲連續幀標註和2D3D點雲融合標註。在傳統逐幀標註模式之下,無論採用手動複製物件的模式還是自動複製物件的模式,標註效率都很難有所提升,景聯文標註平臺在依據傳統標註模式優缺點的基礎上引入大量演算法輔助,研究出專門針對點雲連續幀標註的人機協同模式“自動關鍵幀”,在點雲自動關鍵幀標註模式下,使用者只要對該連續幀中“起始幀”和“結束幀”進行標註,平臺演算法就會自動生成並調整中間幀上同一屬性物件,無需逐幀複製。這種模型在保持資料準確率的基礎上,使得標註效率提升至10倍以上。
景聯文科技使用自研3D點雲標註平臺,完成國內知名高校的2D3D點雲融合標註專案,標註2D圖片21000張,合計標註35000個障礙物,涵蓋整個小區,包括停車區,道路等日常活動區域;標註點雲圖片共計5000幀,合計20000個點雲框,主要模擬居民小區內日常行車及停車環境,交付的資料合格率均達到99%。
自動駕駛場景資料標註專案常見問題和景聯文科技解決方案
隨著產業鏈的專業化分工愈加清晰,AI產業對訓練資料的擴充性需求和前瞻性需求均快速增長,並且隨著需求方對訓練資料質量的要求不斷提高,垂直場景的定製化訓練資料需求成為主流,需求方市場對訓練資料的要求逐漸向精細化轉型,除此之外自動駕駛領域標註專案還存在著其他難度。
自動駕駛領域標註專案資料量和單個資料檔案普遍較大,對資料精度的要求更高,因此對外包資料公司的標註團隊規模、自動駕駛專案執行經驗、伺服器、平臺的承載能力有著更高的要求。景聯文科技在全國擁有四個大型標註基地,為1000+資料標註師提供綜合標註技能培訓,透過專案輪轉形式使90%以上標註人員執行過自動駕駛場景標註專案,選擇大專以上學歷且對自動駕駛演算法需求有一定理解能力的標註師專門負責2D3D融合等高難度標註專案,同時對標註平臺伺服器、企業專線寬頻、辦公電腦配置進行全面升級,支援對大量資料同時進行標註操作並保證其載入速率。
同時針對自動駕駛標註專案易出現需求臨時變更的情況,景聯文科技為需求方配備多次執行過自動駕駛標註專案的專案經理和商務人員對接服務,支援24小時加班和值班隨時溝通可能存在的需求變更,平臺研發團隊隨時響應標註工具調整需求,在專案初期提前部署,提前開始,確保資料提前交付並確保標註準確率。
透過標註平臺實現標審分離,完善平臺風險管控機制,且設定了嚴格的資料隱私安全保障措施。其核心原則為資料絕不二次利用和簽訂資料採集授權協議;同時設定了資料隔離、私有化部署等安全流程和技術。
做全球AI行業客戶的資料參謀。
自動駕駛資料採集標註專案聯絡我們。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70025739/viewspace-2931797/,如需轉載,請註明出處,否則將追究法律責任。