端到端自動駕駛、多模態場景大腦、全新3D互動:商湯絕影大模型即將亮相北京車展

新闻助手發表於2024-04-19
  • 商湯絕影將帶來面向量產的真·端到端自動駕駛解決方案UniAD上車演示首秀
  • 商湯絕影打造敏銳洞察、深度思考、高效執行的多模態場景大腦
  • “Vision Pro”裸眼上車,商湯絕影將展示全球首創3D高精視線互動

時隔四年,2024北京國際汽車展覽會將於4月25日至5月4日重磅迴歸。作為行業首個提出感知決策一體化自動駕駛通用模型的公司,商湯絕影將帶來面向量產的真·端到端自動駕駛解決方案UniAD的上車演示首秀,同時還會展示以多模態場景大腦為核心的AI大模型座艙產品矩陣和全新座艙3D互動。

目前,通用人工智慧正在和智慧汽車產業深度融合,基於公司多年技術積累所打造的一系列原生態汽車垂類大模型,商湯絕影將在北京車展帶來眾多涵蓋智慧駕駛和智慧座艙的AI大模型產品和功能,為公眾展示靈活自適應、深度個性化、安全可信賴、有人文關懷的未來出行全新體驗。

行業首個感知決策一體化自動駕駛通用模型UniAD上車演示首秀

2022年底,商湯及其聯合實驗室提出了行業首個感知決策一體化自動駕駛通用模型UniAD,並於次年榮獲2023年國際計算機視覺與模式識別會議(CVPR)最佳論文,引領學術界和工業界的端到端自動駕駛潮流。

近期,特斯拉開始向使用者推送基於端到端演算法的FSD V12版本,引起行業的廣泛關注。在本屆北京車展上,商湯絕影也將帶來面向量產的感知決策一體化的真·端到端自動駕駛解決方案——UniAD,並首次面向公眾展示UniAD的實車道路演示成果。

隨著自動駕駛技術的不斷演進,基於規則的智駕方案需要多感測器融合感知且大量投入資源來應對無保護左轉、人車混行等複雜路況。而 商湯絕影UniAD方案僅憑攝像頭的視覺感知,無需高精地圖,透過資料學習和驅動就能夠應對城區的複雜環境。不僅如此,在傳統方案較難突破的無中線的鄉村道路上,UniAD同樣可以自如行駛,完成包括大角度左轉上橋、避讓佔道車輛及施工區域、繞行跑步行人等一系列高難度操作,真正做到“像人一樣開車”。

為了增強端到端自動駕駛方案可解釋性和互動能力,依託多模態大模型,商湯絕影已研發出新一代自動駕駛大模型DriveAGI,適用場景更寬、效能更高、門檻更低,體驗上做到可感知、可互動、可信賴。作為下一代自動駕駛技術,DriveAGI也將在車展期間進行前瞻預覽。

商湯絕影打造敏銳洞察、深度思考、高效執行的多模態場景大腦

近期備受關注的小米SU7開始將AI大模型帶進座艙。商湯絕影已打造出“多模態場景大腦”為核心的AI大模型座艙產品矩陣,透過多模態大模型、大語言模型、文生圖模型等能力組合,為智慧座艙注入強大的環境理解、邏輯思維和內容生成能力。

商湯絕影上車的AI大模型將能夠基於地理位置推薦符合使用者喜好的餐廳、介紹使用者感興趣的外部自然景物,並進行優質景點推薦。不僅如此,基於強大的多模態感知能力,搭載商湯絕影方案的車輛可以準確感知並識別車外的資訊,包括周圍車輛的車型、標誌性建築物等,以語音、圖片或者影片等方式為艙內人員提供更為準確和全面的內容,幫助使用者瞭解和掌握外部環境資訊。

以多模態場景大腦為核心,商湯絕影已經推進量產落地一系列全景感知、主動關懷且富有創造力的AI大模型座艙產品,如“旅醫”、“神筆”、“童伴”等創新功能,公眾將能夠在商湯絕影展臺上感受到深度個性化且有人文關懷的智慧出行新體驗。

Vision Pro“裸眼上車”,商湯絕影全球首創座艙3D視線互動即將亮相

2023年,Apple Vision Pro的橫空出世讓人們領略到了3D互動的魅力,商湯絕影透過深厚的技術研發實力和高效的創新迭代效率,將在車展上帶來兩大全新座艙3D互動演示:3D Gaze高精視線互動和3D動態手勢互動。

作為全球首創的能夠透過視線定位與螢幕圖示進行互動的智慧座艙技術,商湯絕影的3D Gaze高精視線互動將讓使用者透過眼神控制中控圖示。3D 動態手勢互動是行業領先的支援動態手勢和手部微動作識別的智慧座艙技術,能讓使用者透過手勢“隔空”進行各類座艙互動。

商湯絕影這兩大艙內3D互動功能相互配合,如同“Vision Pro”裸眼上車,為使用者打造更符合人類直覺的自然互動體驗。

AI大模型與汽車行業碰撞、融合之際,商湯絕影將充分發揮多年積累的領先技術優勢和產品創新能力,持續為智慧汽車產業注入AGI的新活力。4月25日起,歡迎蒞臨商湯絕影展位,共同探索AGI時代智慧汽車的未來出行方式。

相關文章