智慧座艙 自動化測試淺談之使用者場景下的語音互動系統測試

AI德风运發表於2024-04-25

智慧座艙 自動化測試淺談之使用者場景下的語音互動系統測試
隨著 w 界/x 米汽車入市,2024 年的汽車市場已開始進入了白熱化的競爭階段,智慧汽車銷量及佔比持續增長。
智慧座艙及智慧駕駛作為軟體部分的 2 大核心競爭力深刻的影響著使用者的購車決策,其中受限於技術、成本、道路條件、安全等因素,智慧駕駛方面發展相對緩慢,而智慧座艙做為各大廠商最容易發力,也是在購車前最容易被使用者感知的領域,未來很長一段時間將是汽車,尤其新能源汽車重要競爭與發展方向。
語音互動系統作為使用者使用場景中比重最高的主動觸發類功能,已深度融合到駕艙的各個模組,包括軟體 app 互動、車內/外硬體互動、家庭 IOT 場景互動、垂域/開放域大模型互動等。
在歷經智慧手機、智慧家居到如今的智慧駕艙,為了實現測試結果與使用者體驗之間的一致性,語音互動系統的自動化方案也在不斷迭代:

智慧駕艙自動化方案迭代說明:
當前車機的降噪方案均基於麥克風/麥克風陣列 + 聲源定位技術透過相應的增益與抑制技術等提高高噪場景下的語音識別效果。
主機廠(尤其是新勢力廠商)在結合使用者資料與實驗室資料對比並分析後,發現直接移植傳統電聲領域的聲場模擬方案無法完全滿足以聲源定位技術為核心的駕艙演算法(駕駛過程中車輛交匯,噪音快速的進入、消退與移動),造成實驗室資料在喚醒、誤喚醒、識別、連續對話等多領域的結果差異。

隨著實車動態場景下的自動化方案被更多的主機廠發現與認可,如何更好的實現自動化測試結果與使用者體驗的一致性?針對核心技術部分,以下思路與建議供行業同時參考:

1、人聲還原不等於播放人聲。
因噪音採用實際使用者場景的動態測試,自動化測試結果是否和使用者結果趨於一致,人聲還原至關重要,需考慮高中低不同頻率下的還原度,自動化需結合硬體與軟體,考慮到還原效能的差異(尤其是中高頻)硬體模擬嘴建議採用 BK/Grass 等頭部產品,每臺裝置需配備不同的 EQ 校準檔案,這部分軟體實現需要自研,各頻率還原度差異可透過 soundcheck 等軟體進行測試。

2、單一測試流程不等於使用者使用場景
產品業務流程設計上需要高度考慮使用者的實際使用場景,在音樂播放時進行喚醒、識別互動、在 TTS 播報進行時進行喚醒、識別互動、多個位置間的互動與互動等,不能用單一位置的重複測試去評估使用者的實際體驗效果。

3、其他需要考慮的點,包括連續、非連續識別、免喚醒、功能自動化實現、演算法效果快速驗證、誤喚醒方案、響應時間、LOG 獲取、語音互動系統的穩定性等。

4、如何自動化實現競品的對比測試
因無法獲取競品車輛的介面許可權,可以透過多模態的方式(單一方式或結合應用)實現自動化,如透過攝像頭影像識別、mic 識音、感測器 Sensor 等。

5、語言大模型和文生圖的主客觀測試是否能夠實現自動化
對於客觀測試(有預期或參考答案)的實現相對簡單,這裡不展開,但問題的多樣性和迭代週期需要深入考慮,主觀 MOS 測試實現同樣不難,自動化系統重點解決效率提升問題,可以參考眾測行業的方案。

德風運科技自動化產品:
產品服務於蔚來汽車、小米汽車、天津汽研等,詳細自動化產品能力,請聯絡北京德風運團隊。

語音互動系統:

大模型測試系統:

相關文章