大資料 + VR 全景技術重塑“二手車買車場景”

之家技術發表於2022-11-25

行內人都知道,二手車交易的核心問題在於車況資訊不透明。中國二手車交易市場制度尚不完善,長期以來缺少行業公認的車輛估值標準和車況檢測標準,二手車商提供的估值和車況資訊不夠透明。這導致使用者和車商交易雙方都陷入了迴圈困境:使用者對車商信任不足,購買意願低;二手車商缺少潛在客戶線索,為招攬客戶不惜採用虛假資訊,使得市場環境進一步惡化。為推動車況資訊的透明化,汽車之家二手車不斷完善最佳化“車史檔案”,使二手車出險記錄查得率達到 98%、維保記錄查得率達到 85%,同時還有天天拍車平臺開展線下檢測業務,獲取真實的車況資料完善檔案資料。

現階段,多方面的車輛資訊已實現了物理層面上的整合,但在語義內容的解析和資訊的視覺呈現上還有待深入研究。使用者需要親自閱讀碰撞、維保、電池報告來理解其中的內容,報告內容的豐富性、專業性與可讀性將對使用者的交易決策產生重要影響。例如使用者瀏覽 APP 時被汽車外觀、內飾的照片所吸引,卻可能因不瞭解汽車車體結構和車況排查標準而無法準確理解相應的碰撞、維保、電池報告中所包含的眾多內容,最終導致交易轉化失敗。

一、提出解決方案的第一步:明確目標

汽車之家二手車將利用數字能力和資料資源不斷推動車況資訊的透明化、標準化,使使用者更易瞭解車況資訊,提高使用者決策效率和線索轉化效率。具體來說,汽車之家二手車結合機器學習、自然語言處理和 VR 全景等技術重塑了二手車購買的業務場景,將二手車車源在估值、車史、VR 全景展示三個維度的資訊進行了整合與融合,以互動式視覺化的形式呈現給使用者,使使用者更快捷、直觀、詳盡瞭解二手車車源的車況和估值,降低使用者的資訊搜尋成本和資訊理解成本,促進使用者做出交易決策。

image.png
圖1. 傳統二手車買車場景和數字化二手車買車場景對比

如圖所示,傳統的二手車交易需要使用者在不充分了解車輛資訊的情況下去與二手車商預約線下看車,再根據看車人的經驗知識做出主觀的評斷。而數字化的二手車買車業務則是使用者直接透過 PC、APP 從雲端獲取標準化的車輛資訊,充分了解車輛資訊、初步評估後再決定是否線下看車,有效提高線下看車的效率。汽車之家二手車在為使用者創造數字化體驗的過程中,除了促進購車交易,也提高了買車新模式的商業增長。

二、制定解決方案:構建“買車新模式”

1、業務場景

image.png
圖2. 二手車買車業務架構

二手車買車業務流程架構如圖所示。結構化的資料來自從汽車之家二手車交易平臺中的二手車的車輛資料、交易記錄等資料。其中,二手車的車輛資料中包括省份、城市、車型、上牌時間、行駛里程、釋出時間、過戶次數等各種資料,二手車交易記錄中包括成交價格、交易型別、檢測車況等資料。這些結構化的資料按用於估值模型的訓練,預測車輛在當前及未來的價格趨勢。

半結構化的資料是指從第三方獲取的車輛出險記錄,4S 店維修保養記錄、天天拍線下檢測記錄以及電池資料記錄,這些記錄具有多種資料型別,需要轉化為統一的資料格式,解析其中的語義內容,抽取結構化的資訊。對於新能源車的電池資料經過加工解析生成電池線上檢測報告,綜合得出維保、碰撞、電池等多維度的車史報告。

全景資料是指透過 VR 外觀相機和 VR 內飾相機所拍攝的原始影像資料,原始影像資料經過 VR 拍攝元件生成 VR 圖片,再透過 APP、H5 端的 VR 播放元件進行展示。從非結構化資料中抽取出的結構化資訊除了形成車史報告,也可以與 VR 中影像進行跨模態的語義對齊,例如車史報告中如提到“左前門碰撞”,則可以在 VR 展示中提示出左前門的狀態異常。估值、車史和 VR 展示將共同呈現於使用者介面。

當使用者瀏覽透過 PC、APP 瀏覽二手車車源詳情時,可在使用者介面檢視車輛估值資訊,查詢車史報告,VR 全景看車,從價值、車況、外觀內飾三個角度來評估車輛是否符合需求,決定是否購買或留下購車線索。

2、技術難點

估值:車輛的資料十分複雜,通常包括了區域、車齡、里程數、車型、車系、外觀、內飾、車況等多達上百維的特徵資訊,並且這些特徵存在著資料的部分缺失或特徵間多重共線性的複雜關係,給二手車價格的預測模型帶來三大挑戰:模型預測的準確率,模型推理的計算效率,模型的可解釋性。雖然現有的機器學習技術如神經網路或梯度提升樹模型可以端到端地處理複雜特徵,但車輛特徵資料的複雜性使得此類方法不適合用於二手車價格的預測,已有的二手車估值模型準確率較低。為解決上述三個問題,本估值模型採用了分而治之的思路,將車源按照省份、城市和車型分組,再將分組後的車源資料中與時間相關的資料進行量化處理,根據相關性篩選特徵,訓練多元線性迴歸模型。

VR 全景:現有的 VR 外觀技術方案是採用單反相機+長焦鏡頭拍攝,在自帶轉盤的影棚內進行車輛外觀的 360° 拍攝;或採用單反相機+魚眼鏡頭拍攝,車內使用單反進行 4 面拍攝,然後採用人工後期處理的方式完成全景 360° 影像的生成。缺點在於單反+影棚+轉盤造價高,條件苛刻,拍攝車輛需要專人負責運輸,效率低,後期影像處理繁瑣,產出一輛車的外觀+內飾圖片過程長,對於人員專業度要求苛刻。而透過手機 APP 引導拍攝+後期人工處理的方法所得影像不夠精準,後期人工處理耗時長。二手車 VR 看車全新設計研發了基於模型、車輛輪廓識別、陀螺儀、磁場感測器綜合性的對被攝車輛和場地進行計算,給拍攝者提供便捷的定位拍攝方案。

車史檔案:維修保養記錄、碰撞記錄和電池充放電記錄的資料也同樣面臨著資料維度巨大、資料質量不一、缺乏規範化的問題。比如維保記錄和碰撞記錄,有著多種形式的資料來源,既有半結構化的記錄表單,也有記錄文件,甚至還有拍攝或掃描的文件影像,需要對這些資料來源進行加工處理,規範為統一格式的資料形式。在車況資訊的抽取過程中,需要根據領域專家知識明確需要抽取的資訊型別,建立車況評估和電池狀況評估的知識模型以及相應的標準化術語詞表,建立車況和電池的評分、評級模型。

3、實現方法

3.1 估值

image.png
圖3. 估值模型

對車輛進行估價,是二手車交易的重要環節,在交易過程中,需要根據車輛資訊對二手車進行評估定價,獲得較為準確估價區間。目前,我們基於汽車之家豐富的二手車車源資料研發了一種車輛估價模型,來滿足商家、使用者對二手車車源價格的評估。

我們的車輛估價模型主要使用的車源資料包括:地理區域、車型、行駛里程、上牌時間、釋出車輛時間等,首選我們需要車源資料中提取地理區域和車型,並按照地理區域、車型對車源資料中的其他維度資料進行分組,得到分組資料,再將分組後的車源資料中與時間相關的資料進行量化處理,處理後的各組車源資料作為訓練資料,訓練多元線性迴歸模型,模型定義如下:
image.png

image.png
表 1.不同理區域、不同車型對應估計模型的截距與迴歸係數

構建多個針對各個地理區域下的、不同車型的車輛估價模型,即每個省份對應多個車輛估價模型,每個省份、城市、車型下對應一個車輛估值模型。由於不同省份、車型的車輛價格存在一定的差異,因此針對不同地理區域、車型訓練不同的估值模型,可以有效減少預測誤差,使模型估計的準確性更高。得到針對各個地理區域下的、不同車型的截距與迴歸係數。

image.png
圖4. (左)- 根據資訊預測估值;(右)- 歷史成交和建議

因此,本估值模型本質上是一個整合模型,頂層是按省份、城市和車型進行的分類模型,底層是對應類別的多個預測模型。當利用訓練得到的車輛估價模型進行估價時,首先根據從客戶端獲取的地理區域、車型,選擇與地理區域、車型相對應的車輛估價模型,再將從客戶端獲取的上牌時間、使用者釋出車輛資訊時間、行駛里程輸入以選取的模型,模型輸出對應的高準確性的車輛估價。

3.2 VR 全景

在 VR 技術逐漸普及,可為使用者提供新穎的內容展現形式的背景下。因二手車一車一況,透過 VR 技術採集商家各輛車的內外影像資料,隨車輛資訊釋出以後,可為使用者提供更加直觀、真實的車輛狀況展示,線上車源 360° 展現,外觀、內飾無死角細節瀏覽,提升瀏覽體驗。提高使用者決策及線索轉化,提升到店轉化率 。同時也為商家提供了高質線索和使用者到店率。

image.png
圖5. VR 全景拍攝技術流程

拍攝方案:載入使用者選擇的對應年代款的車輛模型圖 30 張,一套 360° 外觀圖需要拍攝 30 張不同角度的照片,以車輛為圓心,12° 為一個點,進行站位點劃分,站位點與模型圖角度進行強關聯,每張圖對應到一個站位點。使用手機內建陀螺儀+電子羅盤,經過計算可為拍攝者提供精準的角度位置資訊,供拍攝者參考自身佔位是否與模型圖匹配;透過影像輪廓實時識別能力,為拍攝者提供精準的距離指引,免除人工丈量設定拍攝點位的繁瑣步驟;當拍攝者按下拍攝按鈕後,程式對拍攝的圖片進行分析識別,保留車輛輪廓內的車輛清晰圖片,對輪廓外的背景區域進行 20% 的高斯模糊圖層生成,並對邊緣進行羽化處理,拼合所有圖層,得到最終的一個角度的外觀圖。本外觀拍攝方案,簡化了人工影像處理步驟,透過智慧識別演算法,全自動生成預期的車輛清晰背景虛化的外觀圖片,極大的簡化了車輛外觀 360° 的拍攝流程,10 分鐘內即可完成外觀和內飾拍攝,並直接上傳平臺展示。

VR系統架構圖_副本.png
圖6. VR 全景多平臺一體化整合方案

適配多端拍看一體化技術方案(手機 App 拍攝 + App 雙端 VR 播放元件 + H5VR 播放元件):

  1. 自研手機 360°VR 外觀拍攝 App 元件;
  2. 自研整合化內飾 VR 拍攝元件, 支援多品牌 VR 相機連線拍攝.;
  3. 自研 App 原生外觀播放器控制元件;
  4. 基於 ThreeSixty 二次研發的外觀 H5 播放器;
  5. 基於 Kpano 的內飾 360°H5 內飾播放器。

3.3 車史檔案

image.png
圖7. 車史報告生成

image.png
圖8. (左)- 部分車史報告示例;(右)- 部分電池報告示例

車輛出險記錄,4S 店維修保養記錄和天天拍線下檢測記錄資料形式多樣,部分圖片資料需要先透過 OCR 轉換為統一的文件格式,再從文件中抽取結構化的資訊。首先建立車況評估和電池狀況評估的知識模型以及相應的標準化術語詞表,解決了哪些資訊需要被抽取,資訊彼此之間的關係是什麼,資訊該如何利用的問題。

具體來說,NLP 模型抽取出時間資訊,里程數、維修/理賠金額等數量資訊,實體資訊(汽車關鍵部位,如 A 柱、B 柱等)及相應的方位詞(如正前方、前方左側等)和動詞(如切割、鈑金、焊接等),並根據句法標註建立實體、方位詞和動詞之間的關係,構成形如“左-A 柱-焊接”的語義短語,這樣的語義短語是描述車輛碰撞維修歷史的最小語義單元。

由於原始記錄的不規範或 OCR 識別過程中的誤差,記錄文件對汽車關鍵部位的描述可能不夠準確或不夠完整,還需要依據預先建立的標準關鍵部位名詞詞表、動詞詞表、方位詞詞表進行規範化處理,得到標準化的關鍵部位名詞、動詞,以及相應的語義短語。

根據檢測部位和事件型別,將車況排查分為骨架排查、加強件排查、水泡排查、火燒排查、里程排查、外觀部件、變速箱/發動機排查、安全氣囊排查八大維度。其中外觀部件的排查資訊可以與 VR 影像建立語義上的對齊,進而在 VR 層面進行視覺上的呈現。根據標準化的關鍵部位名詞與動詞關係,制定了不同維度的車況評級規則,將抽取出的標準化語義短語對映為“ABCD”四個等級評級,最後綜合八個維度的評級和車輛的出險記錄、理賠金額、新車指導價格等資訊對車況做出綜合的評估,分為“優、良、中、差”四個等級。從抽取的語義短語、事件和數量資訊生成車輛的碰撞歷史明細、維修保養歷史明細和歷史裡程明細。

隨著新能源汽車市場的迅猛發展,汽車之家二手車也積累了數萬的新能源車源車主和對新能源車源有買車慾望的使用者。除了獲取車輛的維保、碰撞、里程車史,新能源車使用者還對電池效能和電池續航能力的評估有著強烈需求。為此,二手車聯合北理新源,利用新能源車電池大資料打造了新能源二手車智慧車況雲平臺,將電池資料進行加工處理和評級,在汽車之家、二手車之家等相關產品上一鍵生成新能源電池一站式線上檢測報告,實現電池效能實時評估和續航里程線上檢測。

電池檢測報告記錄了電池出廠資料,並對電池評估資料、充放電資料、行駛資料和異常情況資料進行綜合排查評估電池效能,計算出參考續航里程。綜合解析以上維度的資料,構建了電池狀況評分和評級模型,預測電池效能的評分並按照評分劃分為優、良、中、差四個等級。

三、寫在最後

汽車之家二手車針對二手車車輛資料和視覺展示進行了深度探究,建立了標準化的資料處理加工流程、方法模型以及視覺化展示形式。面對海量的複雜的車輛資料,以分治思想建立估值的整合模型,極大提高了估值的準確性,使使用者能夠準確瞭解當前車輛的價值;建立標準化的車史知識模型,透過演算法模型和規則方法將碰撞、維保、電池的資訊結構化,特別是新能源車電池線上檢測報告,在業內處於創新領導地位。

在視覺展示層面,創新地利用軟體技術解決了傳統 VR 技術過於依賴硬體和人力導致的成本偏高,時間偏長的問題,使商家能夠輕鬆地拍攝 360° 全景影像,提升購車使用者的瀏覽體驗。三個維度的資訊經過數字技術解析並整合融合,重塑了二手車買車的業務數字化場景。

二手車買車業務是汽車之家二手車非常關鍵的業務線,在使用者做出交易決策的過程中,可信且完善的車輛資訊以及資訊與使用者的互動起到至關重要的作用。汽車之家二手車的願景是持續推動業務的數字化轉型,打造二手車流通的全數字化系統,實現非標商品標準化,過程透明化,建立起一套賦能二手車行業數字化轉型的新模式。

相關文章