長安汽車基於 Apache Doris 的車聯網資料分析平臺建設實踐
本文導讀 :隨著消費者更安全、更舒適、更便捷的駕駛體驗需求不斷增長,汽車智慧化已成必然趨勢。長安汽車智慧化研究院作為長安汽車集團有限責任公司旗下的研發機構,專注於汽車智慧化技術的創新與研究。為滿足各業務部門的資料分析需求,長安汽車基於 升級了車聯網資料分析平臺,支撐單日百億級別資料實時處理,並實現十億級別資料查詢秒級響應,為長安汽車在提升使用者用車體驗、實時預警車輛故障、保證車輛安全駕駛等方面帶來顯著成果,為其在智慧化方向的技術創新提供了有力支援。
作者|長安汽車智慧化研究院
智慧化是汽車工業程式中的一場革命,它旨在利用大資料、人工智慧、雲端計算、物聯網等前沿數字技術,對汽車裝置和系統的執行狀態進行全方位的感知、分析、決策和控制,從而提高汽車的安全性、舒適性、便捷性和節能性。
近些年來,長安汽車取得了令人矚目的銷量增長成績。1-8 月,長安汽車自主乘用車累計銷量超百萬輛、保持持續上升的發展勢頭,以深藍、阿維塔、啟源為代表的新能源系列品牌力和產品競爭力不斷提升,自主新能源車累計銷量約為 25.6 萬輛、同比增長 102.44%,成為銷量增長新動能。
在汽車銷量快速攀升的背後,車聯網資料更是呈現爆發式增長的態勢,其中最為核心的即車輛 CAN 匯流排資料。CAN 即 Controller Area Network,透過 CAN 匯流排可以對車輛上的各類電子控制系統進行統一通訊,在實際車輛執行過程中 ,CAN 匯流排資料是車輛安全性、可靠性和高效能的重要保證:
-
車輛系統監測和控制:CAN 匯流排資料可用於監測和控制系統中的各種裝置和元件。感測器透過 CAN 匯流排傳送其測量值,如溫度、壓力、位置等,以便其他裝置或控制器實時監測和採取相應的措施。同時,控制器可以透過 CAN 匯流排向執行器傳送控制指令,如調節閥門、驅動電機等,以實現對系統的控制。
-
車輛資訊實時反饋: CAN 總 線資料可用於提供實時反饋資訊。例如在車輛控制系統中,感測器透過 CAN 匯流排傳輸車速、轉向角度、制動狀態等資料,控制器可以根據這些資料進行實時決策和調整,以確保車輛的安全性和效能。
-
資料共享和協調: CAN 匯流排資料允許不同裝置之間進行資料共享和協調。 透過 CAN 匯流排,不同的控制器和裝置可以交換資訊,共享狀態和控制命令,有利於提高系統的整體效能和效率。
-
網路管理和故障診斷: CAN 匯流排資料用於網路管理和故障診斷。 透過 CAN 匯流排,可以進行裝置的自動識別、配置和監控,以便進行網路管理和故障排查,提高系統的可靠性和可維護性。
-
大規模資料實時寫入及處理 :為實現智慧化,汽車的車門、座椅、剎車燈裝置被設定了大量的感測器,每個感測器收集一種或者多種訊號資料,資料被匯聚後進一步加工處理。目前長安汽車需要支援至少 400 萬輛車的連結,車聯網資料每秒吞吐量已達百萬級 TPS ,每日新增資料規模高達數十 TB ,且還在持續增長中。如何對資料進行實時寫入成為了長安汽車首要面臨的挑戰。
-
準確及時的實時資料分析需求 :車聯網場景下資料分析通常要求實時性,快速獲取分析結果是實時監控、故障診斷、預警和實時決策等服務的重要保障。例如在智慧診斷中,車企需要近實時地收集相關訊號資料,並快速定位故障原因。透過分析車輛感測器資料、行駛記錄等,可以提前發現潛在故障,進行預防性維護,提高車輛的可靠性和安全性。
-
更加低廉的資料儲存和計算成本 :面對快速增長的的資料以及日益強烈的全量寫入和計算需求,導致資料儲存和計算成本不斷攀升。這就要求資料平臺具備低成本儲存和計算的能力,以降低使用成本;同時需具備彈性伸縮能力,以便使用者在業務高峰期快速擴容,提升海量資料計算場景的分析效率。
為給使用者提供更優質的駕車體驗、為業務部門提供更準確高效的資料支援,長安汽車開始對大資料平臺的建設進行探索和實踐。
-
資料時效性無法保證 :Hive 的匯入速度較慢,尤其在處理大規模資料時,匯入時間明顯增加;同時部分業務依賴 T+1 離線任務,無法滿足實時資料處理需求;此外, Hive 只支援分割槽覆蓋,不支援主鍵級別的資料更新,無法滿足特殊場景的資料更新需求。
-
資料查詢分析延遲較高 :對於 10 億級別以上大規模表查詢,Hive 查詢效能較慢。透過 SparkSQL 進行數倉分層運算時,啟動和任務執行時間較長,對查詢響應也會產生影響。此外,資料看板、BI 展示應用無法直接從 Hive 中查詢,需要將 Hive 中資料匯出到 MySQL 中,由 MySQL 提供服務,受限於 Hive 導數效能,當資料量較大時,匯出到 MySQL 耗時大幅增加,進而導致查詢響應時間變長。此外,透過 Java 後端查詢 MySQL 時,資料量過大也會影響資料的響應時間。
-
豐富的資料匯入方式 :Doris 提供了豐富的內建匯入方式,如 Broker Load 和 Stream Load 等,可以滿足實時和離線場景中資料匯入需求。
-
支援實時查詢分析 :Doris 大表 Join 能力突出,提供了多種分散式 Join 方式,使 Join SQL 編寫具備高度靈活性,極大提升資料分析的效率。此外, Doris 支援單節點上萬 QPS 的超高併發,可解決早期架構由於前端併發量過大導致查詢失敗的問題。
-
較低的使用成本 :Doris 相容 MySQL 協議,開發人員可以更高效便捷的使用 MySQL 編寫和執行查詢語句,有效提高開發效率。基於 Doris 極簡的架構,不僅讓部署運維更加簡單,也讓擴縮容操作變的更加方便彈性。同時,Doris 擁有良好的上下游生態,可為使用者提供靈活高效的資料管理和分析體驗。這些優勢和特性都極大的降低了 Doris 的使用成本。
-
便捷進行資料寫入和遷移 :Doris 支援豐富的資料匯入形式,可輕鬆從不同的資料來源中匯入資料。其次,Doris 支援透過 insert into select 快速匯入資料,無需進行繁重的資料遷移配置以及引入外部同步元件。
-
統一資料服務,秒級查詢響應 :透過 Doris Multi-Catalog 功能,實現資料服務的統一, 資料分析師可在 Doris 中 直接查詢 外部資料來源(如 MySQL、Iceberg、Hive 等 )資料,提高查詢效率,實現秒級別查詢響應。其次,Doris Join 能力優異,對於超過 1000 萬的結果表查詢也可實現秒級返回結果。
-
降低儲存和計算成本 :在早期架構中,使用 Flink 實時寫入資料並進行壓縮時需要消耗大量的計算資源。而引入 Apache Doris 後,藉助 Doris ZSTD 壓縮演算法(3-5 倍壓縮率提升),可有效降低計算和儲存所需的資源,還可以將壓縮處理流程放到 Doris 內部進行,無需消耗 Flink 計算資源。
REPLACE_IF_NOT_NULL
定義。具體如下:
-
面對 10 億級資料量的表,難以將其匯入 MySQL 進行實時查詢。如果直接查詢 Hive,則查詢反饋時間會非常長,難以滿足業務需求。 -
由於無法直接關聯 MySQL 的配置表,不得不定時將配置表匯入 Hive 數倉。這樣做雖然能夠滿足資料處理的需求,但卻丟失了 DTC 配置的實時性。
-
自動識別冷熱資料:將熱資料儲存在 Apache Doris 中,冷資料儲存在 Hive 中,透過這種方式實現更高效的資料訪問和管理。
-
擴大業務範圍: 對現有的 Doris 業務 SQL 程式碼進行最佳化,利用 Doris 的某些特性和功能,將適合這些特性的業務遷移到 Doris 中,從而提高資料處理和查詢的效率。
-
共建社群:積極嘗試使用 Doris 最新版本及新功能,在與社群保持同步的同時,不斷探索和應用新的技術,反哺社群、為社群發展做出貢獻。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70017904/viewspace-2995535/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 應用實踐 | 蜀海供應鏈基於 Apache Doris 的資料中臺建設Apache
- 如何基於 Apache Doris 構建簡易高效的使用者行為分析平臺?Apache
- 基於雲端計算的大資料平臺基礎設施建設實踐 排序大資料排序
- 愛奇藝大資料實時分析平臺的建設與實踐大資料
- 基於Apache Doris的湖倉分析Apache
- [平臺建設] HBase平臺建設實踐
- 基於Apache Hudi在Google雲構建資料湖平臺ApacheGo
- 車路協同雲控平臺建設實踐
- 實時分析全面賦能金融業務,馬上消費基於 Apache Doris 構建實時數倉的實踐Apache
- Uber基於Apache Hudi構建PB級資料湖實踐Apache
- Apache Doris 在同程數科數倉建設中的實踐Apache
- 將軍令:資料安全平臺建設實踐
- 從 ClickHouse 到 Apache Doris,騰訊音樂內容庫資料平臺架構演進實踐Apache架構
- 快手基於 Apache Flink 的實時數倉建設實踐Apache
- JuiceFS 在大搜車資料平臺的實踐UI
- 案例|政務大資料平臺資料安全建設實踐大資料
- 美團圖資料庫平臺建設及業務實踐資料庫
- 基於 Spark 的資料分析實踐Spark
- 平安人壽基於 Apache Doris 統一 OLAP 技術棧實踐Apache
- 美團酒旅起源資料治理平臺的建設與實踐
- vivo網際網路機器學習平臺的建設與實踐機器學習
- 位元組跳動基於Doris的湖倉分析探索實踐
- 基於Apache Ambari搭建Hadoop大資料平臺ApacheHadoop大資料
- 基石視覺化資料分析平臺設計實踐視覺化
- [Apache Doris] Apache Doris 後設資料設計及DDL操作原始碼閱讀Apache原始碼
- 貨拉拉自助資料分析平臺實踐
- 招商信諾人壽基於 Apache Doris 統一 OLAP 技術棧實踐Apache
- 伴魚基於 Flink 構建資料整合平臺的設計與實現
- 基於 Echarts 的資料視覺化在異構資料平臺的實踐Echarts視覺化
- 小米 A/B 實驗場景基於 Apache Doris 的查詢提速最佳化實踐Apache
- 百分點萬億級大資料平臺的建設實踐大資料
- 複雜查詢響應速度提升10+倍,度言軟體基於 Apache Doris 實時數倉建設實踐Apache
- BizWorks應⽤平臺基於KubeVela的實踐
- 高德 Serverless 平臺建設及實踐Server
- 高德Serverless平臺建設及實踐Server
- 基於容器的金融資料庫雲平臺DBaaS設計實踐分享資料庫
- 滴普科技劉波 FastData DataFacts建設資料智慧平臺的實踐AST
- KLOOK客路旅行基於Apache Hudi的資料湖實踐Apache