高通的自研架構晶片,正在整合生成式AI世界

机器之心發表於2024-11-19

生成式 AI 的驅動力,就在這塊「至尊」晶片上?


身處 2024 年末的我們,已經能感覺到大模型就在身邊。

新一代的旗艦手機上,動態桌布、AI 畫圖、語音通話總結等功能一字排開,常用功能也有了新技術加持。

圖片
智慧手機現在獲得了與現實世界互動的能力。你可以拍照直接問手機「看到了什麼」,它既能向你進行介紹,也可以對畫面進行影像增強圖片
AI 領域最前沿的智慧體也被塞進了手機,它可以像人類一樣點選螢幕操縱不同的 App。你可以拿起手機用自然語言給出指令:「點三杯瑞幸的美式咖啡,大杯。」過一會兒 AI 就自動把外賣的店鋪、商品和口味選好了,只等你來付款。圖片
在新一代大模型和晶片的加持下,很多 AI 手機的體驗有了質的升級,新引入的能力包括但不限於端側 AI 智慧體、多模態大模型應用、影片 AI 消除、超級 AI 助手等等。

值得注意的是,這些生成式 AI 的背後,都是高通的「驍龍 8 至尊版」在提供動力。作為業界最新的旗艦 SoC,它不負眾望,在部分效能上對同行實現了「降維打擊」。不僅有顛覆性的效能提升,還有跨時代的體驗升級。

驍龍 8 至尊版:桌面級效能,移動端的能效

今年的驍龍究竟透過什麼引發了端側 AI 的質變?

說到「驍龍 8 至尊版」,就不得不從今年如火如荼的 AI PC 領域說起。

今年 6 月,微軟釋出了專為 AI 設計的「Windows 11 + PC」。它是迄今為止速度最快、最智慧的 Windows 個人電腦。憑藉其中搭載的驍龍 X 系列 PC 平臺,能夠實現超過 40 TOPS(每秒萬億次操作)的 AI 算力,與此同時電池續航時間長達一整天。圖片
這種新型別的 PC 結合先進的端側大模型技術,擁有一系列獨特的 AI 能力,不僅可以感知、理解世界的多模態資訊,還能與人進行自然的交流,並執行復雜任務。

微軟官方表示:在很長一段時間裡,這是「獨佔」的能力。Windows 11 中的部分生成式 AI,只有在搭載 Oryon CPU 的驍龍晶片上才能正常執行。

沒過幾個月,這種級別的能力就進入到了手機上。在上個月的驍龍峰會上,高通正式推出驍龍 8 至尊版(Snapdragon 8 Elite)移動平臺,它是目前全球速度最快的移動端系統級晶片。
圖片
與上一代驍龍 8 Gen3 相比,驍龍 8 至尊版在 CPU 單核、多核效能直接提升 45%,GPU 效能提升 40%,NPU 輸出的速度達到了 70+Tokens 每秒,與此同時整體 SoC 功耗還降低了 40%。

在效能提升的背後,驍龍 8 至尊版從裡到外,有了脫胎換骨的改變:

首先是 CPU,它成功地把高通自研架構的桌面級能力帶到了手機上,採用第二代定製高通 Oryon CPU,由兩個主頻為 4.32 GHz 的「超級核心」和六個頻率 3.53 GHz 的效能核心組成,取消了以往的能效核,既提供更好的效能,又提升了功耗效率。

GPU 方面,高通對 Adreno GPU 架構進行了重新設計,為每個切片分配了專用記憶體,效能提升了 40%,功耗降低 40%,光線追蹤效能也提升了 35%。

AI 能力方面,在驍龍 8 至尊版上,全新架構的 Hexagon NPU 效能提升 45%,能效提升 45%,這得益於所有加速器核心的吞吐量提升。此外,結合全面提升的 CPU 和 GPU,該晶片能夠跨所有核心動態管理 AI 負載,相比上一代,基礎大語言模型 token 生成速率提升了 100%。

在這些新技術的加持下,搭載驍龍新平臺的智慧手機不僅可以滿幀跑 3A 遊戲大作,還可以執行一系列終端側多模態生成式 AI 應用,帶來改變人們使用習慣的體驗,包括強大的 AI 影像功能、下一代遊戲 AI、超級智慧助手等。

重構的不止硬體:大模型最佳化「呼朋喚友」

除了晶片本身,高通在做的另一件事是軟硬體的整合。驍龍 8 至尊版的釋出幾乎被辦成了一場生成式 AI 技術的 Demo 大會。

這塊移動晶片的釋出,獲得了各路科技公司大佬的祝福。在釋出時,OpenAI CEO 山姆・奧特曼、微軟 CEO 薩提亞・納德拉、Meta CEO 馬克・祖克伯等人紛紛連線進行了背書。圖片
這三位分別闡述了生成式 AI 在 PC、擴增實境裝置、大模型應用等方向的願景。此時此刻,他們都把目光聚焦在了端側 AI 上。

正如奧特曼所說,雲端和端側的生成式 AI 形態是互相成就的關係:伺服器擅長訓練大模型,而利用端側裝置的算力則可以保護個人隱私,同時提升服務的可靠性。

由於大語言模型相當耗費算力,此前生成式 AI 的技術落地大多是在雲端,將更多能力部署在端側則是未來的必然趨勢。除了微軟、Meta 等矽谷巨頭,很多國內廠商也同高通在新一代硬體上展開了合作。

致力於對標 OpenAI 的智譜就與高通共同宣佈,已圍繞驍龍 8 至尊版,對最新一代端側視覺大模型 GLM-4V 進行了深度適配和推理最佳化。在端側部署後,手機等裝置現在已可以支援豐富的多模態互動方式,讓人們獲得更加情境化、個性化的終端側智慧體驗。

國內大廠騰訊的混元大模型,也在高通的幫助下完成了端側部署,在驍龍 8 至尊版移動平臺上,混元大模型 7B 和 3B 版本展示了最佳化後的執行表現。

結合高通完善的 AI 軟體棧,包括高通 AI 模型增效工具包(AIMET)等,驍龍 8 至尊版可以為大語言模型提供從底層硬體到框架的全面最佳化。透過使用基於硬體的 INT4 量化技術,驍龍大幅提升了混元大模型在終端側的執行效率,端側推理可以做到首個 token 生成時延僅有 150ms,解碼速率超過了 30 token/s。

此前,騰訊混元大模型已為騰訊自家的大量 App 提供了底層支援,包括微信輸入法、騰訊手機管家、QQ、騰訊影片、QQ 瀏覽器、企業微信、騰訊會議等,覆蓋超過 700 個業務場景。

在經過高通技術棧的深度最佳化後,很多亟待落地的大模型已經達到了端側可用的程度。

比如,騰訊手機管家的簡訊智慧識別功能,基於混元端側模型現在已經跑通,具備了更強的語義理解能力,可以更準確地理解簡訊意圖,簡訊召回率提高了將近 200%,識別準確率提升 20%。由於簡訊經常會涉及使用者的個人資訊,端側 AI 還可以在保證出色效能的同時,有效保護使用者的個人資訊隱私安全。

經過高通與合作伙伴們的整合,端側大模型從晶片到應用的最佳化路徑得以打通。或許在未來的某一天,你會發現天天在用的 App 在某次更新後,就多出了生成式 AI 功能。

端側 AI 堆疊,合縱連橫

推出了至尊版晶片的高通,其想要擴充的版圖還不止 PC 和移動端。

高通 CEO 安蒙在驍龍峰會上表示:「高通一直是推動無線通訊產業發展程序的公司,也是最專注於無線技術的公司。但我們也積極迎接變化,高通不僅僅是一家專注無線連線的公司,更將成為連線的計算公司以適應新時代的人工智慧處理。更令人振奮的是,驍龍現在不僅引領著移動行業的創新,還在推動著其他行業的進步。」

上個月與驍龍 8 至尊版一同釋出的晶片,還有驍龍座艙至尊版(Snapdragon CocKpit Elite)和驍龍 Ride 至尊版(Snapdragon Ride Elite)平臺,它們專為汽車定製,分別面向智慧座艙和自動駕駛。
圖片
其中,驍龍座艙至尊版使用的 Oryon CPU 圍繞車用平臺進行了多方面的提升。它的 CPU 算力較上一代提升了三倍,AI 效能也有飛躍式增長,達到了前代產品的 12 倍。此外它也透過軟體虛擬化和多作業系統等機制,支援實現了車機任務的靈活的集中式處理,滿足了汽車安全標準。

現在,車廠能夠在同一塊 SoC 上無縫執行數字座艙和智慧駕駛等功能,真正實現了近年來一直在追求的硬體架構統一。

驍龍座艙至尊版平臺和 Snapdragon Ride 至尊版平臺將於 2025 年出樣。理想汽車已經官方宣佈,將率先搭載高通最新發布的驍龍至尊版汽車平臺。圖片
在驍龍峰會上,理想展示了自家智慧座艙的一系列功能,從語音助手、旅行助手到智慧問答。

驍龍至尊版汽車平臺是驍龍「數字底盤」解決方案組合中的最新產品,除了高算力的晶片,高通還提供智慧駕駛和 AI 軟體棧體系,提供端到端的智慧駕駛系統,具備視覺感知、感測器融合、路徑規劃、定位和整車控制等先進特性。

在採用 Oryon CPU 的驍龍 8 至尊版釋出之後,再加上高通自研的 Adreno GPU、Spectra ISP 和 Hexagon NPU 等,高通補齊了自研 SoC 的最後一塊拼圖,也統一了 PC、手機、汽車三條產品線的晶片架構。

自研晶片架構的意義,在於能夠根據不同產品線的需求,對 CPU 進行微架構層面的調優和定製。與此同時,高通 AI 軟體棧(AI Stack)也在不同產品線的 AI 部署中作用顯著。

至此,從晶片、大模型到 App 的縱向,以及從手機、PC 到汽車的橫向,高通已經做到了 AI 能力的全鏈路打通

正如大模型公司不斷透過新技術最佳化降低大模型使用門檻,高通的佈局正在幫助眾多 OEM 廠商和應用公司,把越來越多的生成式 AI 技術,從不可能變為可能。

生成式 AI 可能會「無處不在」

大模型的落地推動到現在,人們已經越來越重視起端側能力的體驗。

從 AI 技術領域裡,研究「小模型」(SLM)的趨勢開始,在科技公司的努力下,端側模型從文字到影像,再到多模態的一步步逐步落地。如今,高通端側晶片的 AI 能力,完整的開發平臺以及統一的生態體系,已經為生成式 AI 的大規模應用鋪平了道路。

不過,高通的「至尊版」晶片只是起點。經由全鏈路的技術推動,我們還將見證不久的未來,很多事物改頭換面。

其實在最近的釋出活動中,我們已經看到了端倪。在《永劫無間》手遊的測試版本中,驍龍 8 至尊版除了利用 CPU、GPU 能力帶來高幀且穩定的遊戲體驗,還在端側跑起了 18 億引數的大語言模型。配合高通 AI 軟體棧從硬體到軟體的全棧最佳化,網易在手遊的端側直接打造出了 AI 隊友功能。圖片
現在,玩家們在遊戲裡擁有了可以語音互動的 AI 隊友,他們在戰鬥過程中不僅能夠聽玩家指令行事,還會在你不會的時候進行提示。

如果說在手遊這樣高能耗的應用上,我們已能用得起大模型的智慧體,那麼在日常的應用上,AI 智慧體就更可以為我們架起橋樑,讓很多功能實現高度的自動化,甚至消除 App 之間的壁壘。再延伸到 AI PC、汽車甚至機器人,高通的技術棧,或許還能把不同的硬體連成一體。

正如奧特曼所說,高通在所有邊緣端裝置上都擁有強大的技術,能夠應用 AI 模型彙集全球幾十億使用者。現在僅僅是生成式 AI 的開始,未來將會出現什麼?是發揮想象力的時候了。

相關文章