博主是《學習OpenCV4:基於Python的演算法實戰》和《深度學習計算機視覺實戰》兩本圖書的作者,目前從事自動駕駛感知融合演算法開發,分享內容包括深度學習、計算機視覺、OpenCV、自動駕駛、SLAM、C++/Python語言開發等方向的內容。
歡迎關注公眾號“計算機視覺與OpenCV”
歡迎新增我的微訊號study428加入學習交流群。
1、四元數在表示空間旋轉時的優勢是什麼?
(1)四元數解決了其他3維空間旋轉演算法會遇到的惱人的問題,比如使用尤拉角來表示旋轉操作時會遇到的萬向節鎖問題(Gimbal lock);
(2)計算效率比旋轉矩陣方法高,因為表達四元數只需要4個數,旋轉矩陣需要9個。
(3)其簡單的數學表達方式可以被用來規劃出高階連續姿態運動以及在多姿態間插值。
2、什麼是插值?
插值對應的英文是interpolation ,是數學上的一個常用術語。
維基百科的專業解釋:數學的數值分析領域中,插值是一種透過已知的、離散的資料點,在一定範圍內推求新資料點的過程或方法。求解科學和工程的問題時,通常有許多資料點藉由取樣、實驗等方法獲得,這些資料可能代表了有限個數值函式。而根據這些資料,我們往往希望得到一個連續的函式(也就是曲線);或者更密集的離散方程與已知資料互相吻合,這個過程叫做擬合。插值是曲線必須透過已知點的擬合。
插值方法有很多種,比如最簡單的最鄰近插值(nearest interpolation)、線性插值(linear interpolation);常用的雙線性插值(Bilinear interpolation),還有保護影像細節效果較好的雙三次插值(bicubic interpolation)、三次樣條插值(cubic Spline Interpolation)等。
在影像處理和計算機視覺領域,應用比較多的雙線性插值。雙線性插值的效果不是最好的,但相較最鄰近插值和線性插值的簡單粗暴,其獲得影像的效果還是更令人滿意的,而且雙線性插值的計算量和易於理解程度會優於雙三次插值和三次樣條插值等高階插值方法。因此雙線性插值還是最受廣大影像研究者喜愛的。
3、簡單介紹一下自動駕駛系統
自動駕駛控制系統通常被分為三部分:環境感知->決策規劃->控制執行。
自動駕駛涉及的關鍵技術包括了環境感知、感測器融合、智慧網聯V2X、高精度地圖、決策規劃等關鍵技術。
環境感知:自動駕駛的感測系統需要透過蒐集汽車周邊資訊,然後做出決策(轉向、變道、加速、減速)。環境感知透過各種感測器去搜集汽車周邊資訊,包括車輛本身狀態、道路、行人、交通訊號、交通標識、交通狀況、周圍車輛等。常用的感測器包括了攝像頭、鐳射雷達、毫米波雷達、組合導航等等。
目前行業內有兩種主流技術路線,一種是以特斯拉為代表的以攝像機為主導的多感測器融合方案;另一種是以谷歌、百度為代表的以鐳射雷達為主導,其他感測器為輔助的技術方案。無論哪種方案,都需要透過智慧控制演算法,根據駕駛員意圖、當前車速、外部環境等狀態計算規劃駕駛指令、規劃路徑,最後由線控底盤系統來執行駕駛指令、控制車輛執行。
感測器融合:每種感測器都有自身的優缺點,需要融合取長補短。
V2X:車用無線通訊技術(Vehicle to Everything ,V2X)是將車輛與一切事物相連線的新一代資訊通訊技術,其中V代表車輛,X代表任何與車互動資訊的物件,當前X主要包含車、人、交通路側基礎設施和網路。V2X互動的資訊模式包括:車與車之間(Vehicle to Vehicle,V2V)、車與路之間(Vehicleto Infrastructure ,V2I)、車與人之間(Vehicle to Pedestrian,V2P)、車與網路之間(Vehicle toNetwork,V2N)的互動。V2V技術允許車輛透過轉發自身及前方的實時資訊來預防事故的發生,從而減少駕駛時間,最終實現改善交通環境,減少交通擁堵的目的。
高精地圖:高精地圖擁有精準的車輛位置資訊和豐富的道路元素資料資訊,可以幫助汽車預知路面複雜資訊,如坡度、曲率、航向等。和傳統相比具有更高的實時性。由於道路路面經常發生變化,如道路整修、標識線磨損或重漆、交通標識改變等,這些改變都要及時反映在高精地圖上。高精地圖將更強調空間的三維模型以及精度,將精度從米級降到釐米級,必須非常精確的顯示路面上的每一個特徵和狀況。
規劃決策:決策是無人駕駛體現智慧性的核心的技術,相當於自動駕駛汽車的大腦,它透過綜合分析環境感知系統提供的資訊,及從高精度地圖路由定址的結果,對當前車輛進行規劃(速度規劃、朝向規劃、加速度規劃等),併產生相應的決策(跟車、換道、停車等)。規劃技術還需要考慮車輛的機械特性、動力學特性、運動學特性。常用的決策技術有專家控制、隱馬爾科夫模型、貝葉斯網路、模糊邏輯等。