專訪Uber焦加麟:即便有AI幫助,高精度地圖製作仍然少不了人力

AI科技大本營發表於2018-04-18

640?wx_fmt=png&wxfrom=5&wx_lazy=1



作者 | DavidZh

出品 | AI科技大本營(公眾號ID:rgznai100)


上週在 O'Reilly 和 Intel 人工智慧2018北京大會上,Uber 公司資深軟體工程師焦加麟做了關於人工智慧在高精度地圖製作中的應用分享,並接受了 AI 科技大本營(微信公號:rgznai100)的採訪。


焦加麟 2015 年加入 Uber,一直負責地圖相關的軟體工程工作。進入 Uber 之前,他在微軟 Bing 的美國總部從事開發工作。


640?wx_fmt=png



就目前自動駕駛的發展階段而言,從 L2 到 L3、從 L3 到 L4,隨著車輛對駕駛者注意力需要的減少,高精度地圖中的道路資料和語義對於實現高階別自動駕駛越來越重要。而在安全層面,高精地圖的資料量越豐富、更新越及時,意味著自動駕駛車也越安全。


高精度地圖的採集方式


作為自動駕駛的基礎服務之一,高精度地圖的採集和製作通常由地圖資料服務提供商來完成。這其中既包括像 TomTom、Google、Here 等做了很多年的傳統地圖提供商,也有一些近幾年才成立的初創公司,比如 Mapillary 和 lvl5。


從高精地圖的採集方式來看,目前主要分為鐳射雷達+攝像頭輔助和僅使用光學攝像頭兩種方法,但各有優缺點。


首先,鐳射雷達能夠快速獲得道路及周邊環境的三維點雲資料。這些資料中包含了景深資訊,能夠在後期資料處理時快速建立 3D 模型。而且鐳射雷達的工作條件基本不受時間影響,無論白天還是夜間都可以裝在到車上進行採集。


不過,需要指出的是,鐳射雷達並不能識別和理解交通標誌牌、交通訊號燈等內容,採集時要藉助普通的光學攝像頭來捕捉並提取這部分資訊。


但普通攝像頭要求外部環境光線充足,因此地圖採集工作只能在白天進行。另外,攝像頭拍下的照片不包含景深資訊,需要通過三角定位等計算方法來確定道路標識的具體位置。


據焦加麟介紹,前文中提到的 lvl5 就是灣區一家純靠計算機視覺方法來採集和製作高精度地圖的公司。


lvl5 採用了眾包的方式獲得路況原始資料。這家公司通過讓個人車主和司機安裝好自己開發的 Payver 應用,並在開車時執行它,來採集路面和周邊環境的 2D 影像。為了保證資料質量的統一性,Payver 只有 iOS 版本,而參與採集地圖資料的使用者也能獲得一定虛擬獎勵。在不到三個月的時間裡,這家公司就通過這種眾包參與的方式覆蓋了美國 90% 的高速公路。


一般而言,攝像頭每秒拍攝的內容越多,後期需要處理和融合的資料量就越大。焦加麟稱,目前主流的做法並不是直接錄製視訊(高位元速率意味著資料量龐大),而是按照每秒不超過 10 幀的頻率自動拍照。在採集車行進過程中,這個頻率既能保證從不同位置和角度獲得了道路及外部資訊,又能將原始資料規模控制在比較理想的範圍內。


除了 lvl5,被英特爾收購的 Mobileye 也在它的路書(RoadBook)中大量使用攝像頭來製作高精度地圖。


而 Google 旗下獨立於 Google Maps 的高精度地圖團隊,則採用了比較常見的鐳射雷達+攝像頭輔助的方法。


就目前而言,這兩種方法還沒有孰優孰劣之分。初創公司沒有歷史包袱,在採集和製作高精地圖時技術方案的可選範圍比較靈活。而 Google、Here 等公司有低解析度的母圖做基礎,需要疊加更多立體圖層和語義層。這就要考驗資料採回來之後,資料融合處理的水平了。


高精度地圖的資料處理


焦加麟在分享中講到,地圖生產流程主要涉及位姿(pose)修正、資料處理、位置檢測和語義生成四個環節。



640?wx_fmt=png



這些過程需要大量的軟體輔助和人工作業。目前在 Google 和 Uber 內部,都設有專門的地圖資料標記(labeling)團隊。經過手動標記的地圖資料連同語義資訊一起被輸送到迴圈訓練的機器學習或深度學習模型中。


這些演算法模型輸出的低可信度資料要再次經過手動標記,然後再次進行演算法處理。高可信度資料則被收錄為高精度地圖資料庫。



640?wx_fmt=png



對於個體而言,資料標記是一份相當枯燥的工作。而利用 SLAM 和計算機視覺的方法,已經將資料處理環節的人工作業量降低不少。


舉例來說,平面交叉路口的非直線路沿,在過去一般要手動描多個點才能將資料結構化和語義化。現在可以基於點雲資料利用啟發式規則提取出不規則路沿,其中主要考慮的引數是高度差和密度變化。


640?wx_fmt=png



而針對交通訊號燈,Google 的無人車團隊採用了離線 SLAM 優化和多重機器學習模型來確定訊號燈的具體位置。目前公開的資料顯示,大約有 95%-99% 的交通訊號燈是通過這種方法生成位置,且誤差不高於 15cm。


640?wx_fmt=png



除了這些,還有不少團隊採用了不同方案來確定標識牌位置和語義資訊。但最終的高精地圖質量控制和校驗環節還是主要由人來完成。


高精度地圖的另一個難點在於,更新的及時性。據 TomTom 估計,美國的公共道路每年大約有 15% 會發生某種改變。這就要求地圖服務商以更靈敏快速的方式更新地圖資料庫,其中也少不了大量使用人工作業。


總起來看,高精度地圖在製作層面已經用上了不少 AI 演算法的幫助,但目前最領先的自動駕駛團隊 Waymo 也只在美國鳳凰城等有限幾個城市擁有可以滿足 L4 級別的高精度地圖。


放大到全美或者全中國範圍來看,採集和製作高精度地圖還是一項非常浩大的工程。


題圖來源:TomTom


招聘

AI科技大本營現招聘AI記者和資深編譯,有意者請將簡歷投至:gulei@csdn.net,期待你的加入


AI科技大本營讀者群(計算機視覺、機器學習、深度學習、NLP、Python、AI硬體、AI+金融、AI+PM方向)正在招募中,和你志同道合的小夥伴也在這裡!關注AI科技大本營微信公眾號,後臺回覆:讀者群,新增營長請務必備註姓名,研究方向。

640?wx_fmt=gif
640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

AI科技大本營公眾號ID:rgznai100640?wx_fmt=jpeg


☟☟☟點選 | 閱讀原文 | 檢視更多精彩內容

相關文章