作者:徐果、冰羽、瑤靖
自動駕駛被認為是推動智慧汽車發展的里程碑式技術。數智化大潮下,大眾對汽車的定義和需求都發生了巨大變化,汽車的功能已不再是簡單的交通工具,而是逐漸演變為一個個“超級智慧終端”。
然而,成本和效率一直是制約自動駕駛大規模商用的重要因素。得益於 Kubernetes 和雲原生技術在邊緣場景的擴充和應用,自動駕駛企業能夠以更加高效率、低成本的方式處理資料、訓練演算法,將研發人員從硬體配備和日常運維管理等繁瑣事務中解脫出來,把更多精力投入自動駕駛核心演算法的研發及業務的增長中。
本文將透過介紹元戎啟行使用阿里雲邊緣容器服務 ACK@Edge 的實踐,分享在自動駕駛網約車場景下,如何將雲邊一體的雲原生能力快速覆蓋到眾多智慧車載裝置,有效降低自動駕駛車輛管理成本。
為什麼說“雲邊協同”是自動駕駛發展的加速器?
元戎啟行科技有限公司是一家專注於研發和應用 L4 級自動駕駛技術的科技公司,擁有自動駕駛乘用車“元啟行”和自動駕駛輕卡“元啟運”兩大產品,主要是為車企、Tier1、出行公司等提供定製化的自動駕駛解決方案。其中,Robotaxi 出行搭載元戎啟行自研 L4 級自動駕駛解決方案,透過自營車隊和合作運營的模式落地。元戎啟行 L4 級自動駕駛前裝方案車隊已投入運營,為乘客提供城市出行服務。
在業務快速增長的迫切需求下,車載裝置在高併發場景下的效能要求與計算資源受限的矛盾、車載環境雲邊網路不可靠與車載業務追求可靠性的矛盾、企業迅速響應需求變化的訴求與傳統運維手段低下的矛盾、雲端管控車載裝置以及車載裝置對安全性高要求的矛盾等,都會為元戎啟行進入高階自動駕駛量產過程中的成本和效率帶來挑戰。
面臨的挑戰
-
系統可擴充套件性差,車載應用環境依賴衝突:在自動駕駛領域,車載業務的傳統的交付模式大多數以 deb/rpm 包的方式部署,對車載執行環境的依賴性比較強,不同業務對系統庫的依賴版本可能會衝突;此外,由於演算法模組的數量不斷增多,單個模組又需要依賴更多的模組,因此不能快速搭建與復現 bug 發生時的執行系統環境,給研發除錯帶來許多困擾。這些都可能給車載線上業務、路上車輛的正常執行帶來隱患。
-
環境不一致導致研發運維效率低:實際業務中模擬與車上環境不一致,模擬環境一直保持容器環境執行,但是車上保留的則為 deb 的部署方式;此外,以 deb/rpm 包等傳統的部署方式需要較多的人工干預,容易造成車輛業務部署和執行時測試及研發迭代效率低的問題。
-
缺少全域性管控能力:對於路測車輛,許多研發人員需要在車端除錯需求,由於車載運維條件有限,影響除錯工作的效率;此外,線下運營的車輛越來越多,車載業務的升級、運維、監控等都面臨較大挑戰,需要一個從全域性視角對線下運營車輛業務的統一管理和部署的能力。
-
缺少雲端一體化交付能力:現階段雲原生在雲上已經成為事實標準,自動駕駛車企可以在雲上使用雲原生+ AI 的能力,進行大量的AI模型訓練和模擬業務的執行。但是當AI模型和模擬業務訓練好後, 如何將這些製品快速高效的交付到車端,也是車企所面臨的問題。若單獨開發一套平臺來專門維護車端應用,不僅帶來額外開發和維護成本,而且和雲端業務的 CI/CD 流程出現割裂,因此車企也希望透過雲原生的能力管理邊緣側的車載業務,進行雲端一體化交付。
-
車載網路安全問題:網路安全對於自動駕駛的重要性已經毋庸置疑,通常情況下車端應用始終要和雲端保持通訊,以監聽雲端下發的任務,而車端又是一個很容易和外部人員產生物理接觸的環境,尤其是網約車運營形式的自動駕駛場景。如果車端被惡意侵入,入侵者有可能透過這條鏈路侵入雲端,甚至進一步影響和雲端有連線的所有車輛,這就對車端應用提出了非常高的安全訴求,顯然,這會大大加重應用開發人員的負擔。
-
弱網/斷網環境下的車載業務自治能力:在以網約車運營形式的自動駕駛車輛,線上下執行時,由於車輛所處的位置的不同,很可能處於弱網或者斷網的情況,在這種情況下,如何能保證車載業務在極端重啟情況下穩定執行,這也是車企所急需要解決的問題。
-
車輛監控/日誌採集:大量的運營車輛在行駛過程中,需要監控車輛的硬體溫度、CPU、 記憶體等控制元件的使用率,時刻在雲端監控大屏上顯示,另外雲端需要車輛上系統和應用的關鍵日誌採集,用來日誌分析,當前並沒有通用且有效的方法去解決。
ACK@Edge 助力元戎啟行車雲一體化協同
ACK@Edge 雲邊端一體化應用優勢
自動駕駛場景是雲原生在雲邊協同場景下的很好用例:車載裝置可以作為雲邊協同的計算節點,統一接入到雲端,由雲端統一管控,同時使用雲原生的能力,能很好保證車載上業務之間的環境隔離問題,可以對於自動駕駛車載應用系統在雲上進行統一升級更新、資源排程、運維管控,實現雲端一體化交付。
阿里雲邊緣容器服務(簡稱 ACK@Edge)是一款提供標準 Kubernetes 叢集雲端託管,支援邊緣計算資源、業務快速接入、統一管理、統一運維的雲原生應用平臺,能夠幫助使用者輕鬆實現雲邊一體化協同。使用者利用 ACK@Edge 透過納管邊緣節點將雲上應用延伸到邊緣,聯動邊緣和雲端的資料,使得邊緣節點擁有云端相同能力。在雲端提供對邊緣裝置、邊緣應用的統一 Ops 能力,保證邊緣裝置及邊緣智慧應用少運維、高可用。
目前 ACK@Edge 已經全面升級為基於雲原生的雲邊一體和雲端一體架構,能夠適配更多的垂直領域的邊緣計算場景,另外在雲端協同場景,車載裝置、交通、橋樑等小終端裝置的輕量化接入,加速您容器化應用的分發、運維,降低您自建運維的成本。除自動駕駛外,已廣泛用於 CDN、IDC、IoT、智慧物流、工業大腦、新零售等諸多場景。
ACK@Edge 自動駕駛解決方案助力元戎啟行雲邊協同
基於 ACK@Edge 雲邊一體、雲端一體,Kubernetes 容器編排排程的能力,以及 ACK@Edge 在 Kubernetes 之上針對邊緣場景疊加的如輕量化、OTA,邊緣側 POD 離線啟停,邊緣自治、邊緣單元化、單元化部署、Tunnel 通道的能力,切實解決了元戎啟行智慧在自動駕駛領域的相關痛點,最終承載了元戎啟行自動駕駛線上運營車輛,為乘客提供城市智慧出行服務。
ACK@Edge 在原生 Kubernetes 的基礎上針對自動駕駛場景提供了獨有的增強型功能:
-
雲端運維,遠端除錯:ACK@Edge 提供的 Tunnel 通道, 可以讓業務人員快速檢視容器日誌和進入容器除錯。同時利用 tunnel 通道可以將車載裝置的監控資訊(硬體溫度,CPU/記憶體使用率等)統一收編到雲上,為元戎雲端平臺提供監控和告警服務。
-
邊緣自治:ACK@Edge 的邊緣自治能力,可以在運營車輛離線、或者車輛重啟這種極端情況下, 還能保證車載上的的業務能正常執行。期間,ACK@Edge 團隊與元戎系統團隊做了大量的斷網、重啟操作,最終在證明運營車輛上的業務能夠正常執行。
-
輕量化接入:ACK@Edge 在雲端場景下,提供輕量化接入的能力,邊側元件具有更少的資源佔用率。更少的資源佔用率可以為業務騰挪出更多的資源,提高了車載應用對攝像頭影片流的處理能力,進一步提高自動駕駛車輛的反應速度。
-
車載應用的 OTA:由於自動駕駛場景對於車輛執行安全要求非常苛刻,對車輛上的應用升級有著非常高的要求,原生的 Kubernetes workload 的升級回滾方式還是顯得比較暴力, 針對這些特殊場景,ACK@Edge 創新性的提出了針對於 POD 的 OTA,以及在離線場景下 POD 的啟停管理能力,此功能可以很好的滿足運營車輛的根據當時的情況按需升級,以及在極端情況下管理人員人工接入運維的需求。
方案亮點和效果
-
統一的交付標準:使用 containerd+ACK@edge 來交付應用,交付流程簡單,交付物標準,減少和車端裝置的耦合,且不會汙染車端環境。
-
裝置安全接入能力下沉,應用聚焦業務:Lite-kubelet(車端裝置上執行的agent) 支援一機一密認證訪問 MQTT,確保每臺車載裝置都用自己的裝置證書接入至 ACK@Edge 叢集,極大提高接入的安全性;且整個過程對業務層透明。
-
提供更豐富、靈活的裝置管理能力:透過 OTA(SoftwareOverTheAir)、邊緣側 Pod 離線啟停管理,提高了車載應用的釋出運維效率。
相比較傳統的雲原生工作負載節點管理方式,透過將元戎啟行運營車輛的車載裝置以輕量化方式接入 ACK@Edge,使裝置接入資源佔用降低 50 %,接入安全性大幅提升。基於邊緣側 Pod 的啟停、OTA 功能便捷化管理車載裝置,業務釋出運維效率提升 60% 以上。
自動駕駛的未來:雲原生+邊緣計算雙輪驅動
汽車產業的自動化已經成為了不可阻擋的潮流,加速落地將會成為下一階段的主題。相信雲原生與邊緣計算的結合能夠幫助更多汽車企業更好地吸收雲端計算、大資料和 AI 的成果優勢,透過有效降低自動駕駛車輛管理成本,推動解決自動駕駛量產工程難題。
未來,未來 ACK@Edge 會繼續深耕邊緣計算領域,擴充更多的業務場景,期望推出更多的面向於垂直領域的解決方案。同時,我們也已將 ACK@Edge 全部核心程式碼貢獻出來,成立了 OpenYurt 開源社群,並捐獻給 CNCF,吸引 VMware、中國電信、浙大實驗室、中國聯通、中國移動等公司和組織的眾多開發者參與。希望能有更多企業和開發者加入我們,透過持續凝聚社群實踐,推動雲原生邊緣計算標準形成。
點選此處,瞭解 ACK@Edge 更多詳情