Open main menu
IT人
高通的自研架構晶片,正在整合生成式AI世界
机器之心
發表於
2024-11-19
架構
晶片
AI
生成式 AI 的驅動力,就在這塊「至尊」晶片上?
身處 2024 年末的我們,已經能感覺到大模型就在身邊。
新一代的旗艦手機上,動態桌布、AI 畫圖、語音通話總結等功能一字排開,常用功能也有了新技術加持。
智慧手機現在獲得了與現實世界互動的能力。你可以拍照直接問手機「看到了什麼」,它既能向你進行介紹,也可以對畫面進行
影像增強
。
AI 領域最前沿的智慧體也被塞進了手機,它可以像人類一樣點選螢幕操縱不同的 App。你可以拿起手機用自然語言給出指令:「點三杯瑞幸的美式咖啡,大杯。」過一會兒 AI 就自動把外賣的店鋪、商品和口味選好了,只等你來付款。
在新一代大模型和晶片的加持下,很多 AI 手機的體驗有了質的升級,新引入的能力包括但不限於端側 AI 智慧體、多模態大模型應用、影片 AI 消除、超級 AI 助手等等。
值得注意的是,這些生成式 AI 的背後,都是高通的「驍龍 8 至尊版」在提供動力。作為業界最新的旗艦 SoC,它不負眾望,在部分效能上對同行實現了「
降維
打擊」。不僅有顛覆性的效能提升,還有跨時代的體驗升級。
驍龍 8 至尊版:桌面級效能,移動端的能效
今年的驍龍究竟透過什麼引發了端側 AI 的質變?
說到「驍龍 8 至尊版」,就不得不從今年如火如荼的 AI PC 領域說起。
今年 6 月,微軟釋出了專為 AI 設計的「Windows 11 + PC」。它是迄今為止速度最快、最智慧的 Windows 個人電腦。憑藉其中搭載的驍龍 X 系列 PC 平臺,能夠實現超過 40 TOPS(每秒萬億次操作)的 AI 算力,與此同時電池續航時間長達一整天。
這種新型別的 PC 結合先進的端側大模型技術,擁有一系列獨特的 AI 能力,不僅可以
感知
、理解世界的多模態資訊,還能與人進行自然的交流,並執行復雜任務。
微軟官方表示:在很長一段時間裡,這是「獨佔」的能力。Windows 11 中的部分生成式 AI,只有在搭載 Oryon CPU 的驍龍晶片上才能正常執行。
沒過幾個月,這種級別的能力就進入到了手機上。
在上個月的驍龍峰會上,高通正式推出驍龍 8 至尊版(Snapdragon 8 Elite)移動平臺,它是目前全球速度最快的移動端系統級晶片。
與上一代驍龍 8 Gen3 相比,驍龍 8 至尊版在 CPU 單核、多核效能直接提升 45%,GPU 效能提升 40%,NPU 輸出的速度達到了 70+Tokens 每秒,與此同時整體 SoC 功耗還降低了 40%。
在效能提升的背後,驍龍 8 至尊版從裡到外,有了脫胎換骨的改變:
首先是 CPU
,它成功地把高通自研架構的桌面級能力帶到了手機上,採用第二代定製高通 Oryon CPU,由兩個主頻為 4.32 GHz 的「超級核心」和六個頻率 3.53 GHz 的效能核心組成,取消了以往的能效核,既提供更好的效能,又提升了功耗效率。
GPU 方面
,高通對 Adreno GPU 架構進行了重新設計,為每個切片分配了專用記憶體,效能提升了 40%,功耗降低 40%,
光線追蹤
效能也提升了 35%。
AI 能力方面
,在驍龍 8 至尊版上,全新架構的 Hexagon NPU 效能提升 45%,能效提升 45%,這得益於所有加速器核心的吞吐量提升。此外,結合全面提升的 CPU 和 GPU,該晶片能夠跨所有核心動態管理 AI 負載,相比上一代,基礎大
語言模型
token 生成速率提升了 100%。
在這些新技術的加持下,搭載驍龍新平臺的智慧手機不僅可以滿幀跑 3A 遊戲大作,還可以執行一系列終端側多模態生成式 AI 應用,帶來改變人們使用習慣的體驗,包括強大的 AI 影像功能、下一代遊戲 AI、超級智慧助手等。
重構
的不止硬體:大
模型最佳化
「呼朋喚友」
除了晶片本身,高通在做的另一件事是軟硬體的整合。驍龍 8 至尊版的釋出幾乎被辦成了一場生成式 AI 技術的 Demo 大會。
這塊移動晶片的釋出,獲得了各路科技公司大佬的祝福。在釋出時,OpenAI CEO 山姆・奧特曼、微軟 CEO 薩提亞・納德拉、Meta CEO 馬克・祖克伯等人紛紛連線進行了背書。
這三位分別闡述了生成式 AI 在 PC、
擴增實境
裝置、大模型應用等方向的願景。
此時此刻,他們都把目光聚焦在了端側 AI 上。
正如奧特曼所說,雲端和端側的生成式 AI 形態是互相成就的關係:伺服器擅長訓練大模型,而利用端側裝置的算力則可以保護個人隱私,同時提升服務的可靠性。
由於大
語言模型
相當耗費算力,此前生成式 AI 的技術落地大多是在雲端,將更多能力部署在端側則是未來的必然趨勢。除了微軟、Meta 等矽谷巨頭,很多國內廠商也同高通在新一代硬體上展開了合作。
致力於對標 OpenAI 的智譜就與高通共同宣佈,已圍繞驍龍 8 至尊版,對最新一代
端側視覺大模型 GLM-4V
進行了深度適配和推理最佳化。在端側部署後,手機等裝置現在已可以支援豐富的多模態互動方式,讓人們獲得更加情境化、個性化的終端側智慧體驗。
國內大廠
騰訊
的混元大模型,也在高通的幫助下完成了端側部署,在驍龍 8 至尊版移動平臺上,
混元大模型 7B 和 3B 版本
展示了最佳化後的執行表現。
結合高通完善的 AI 軟體棧,包括高通 AI 模型增效工具包(AIMET)等,驍龍 8 至尊版可以為大
語言模型
提供從底層硬體到框架的全面最佳化。透過使用基於硬體的 INT4
量化
技術,驍龍大幅提升了混元大模型在終端側的執行效率,端側推理可以做到首個 token 生成時延僅有 150ms,解碼速率超過了 30 token/s。
此前,
騰訊
混元大模型已為
騰訊
自家的大量 App 提供了底層支援,包括微信輸入法、
騰訊
手機管家、QQ、
騰訊
影片、QQ 瀏覽器、企業微信、
騰訊
會議等,覆蓋超過 700 個業務場景。
在經過高通技術棧的深度最佳化後,很多亟待落地的大模型已經達到了端側可用的程度。
比如,
騰訊
手機管家的簡訊智慧識別功能,基於混元端側模型現在已經跑通,具備了更強的語義理解能力,可以更準確地理解簡訊意圖,簡訊召回率提高了將近 200%,識別
準確率
提升 20%。由於簡訊經常會涉及使用者的個人資訊,端側 AI 還可以在保證出色效能的同時,有效保護使用者的個人資訊隱私安全。
經過高通與合作伙伴們的整合,端側大模型從晶片到應用的最佳化路徑得以打通。或許在未來的某一天,你會發現天天在用的 App 在某次更新後,就多出了生成式 AI 功能。
端側 AI 堆疊,合縱連橫
推出了至尊版晶片的高通,其想要擴充的版圖還不止 PC 和移動端。
高通 CEO 安蒙在驍龍峰會上表示:「高通一直是推動無線通訊產業發展程序的公司,也是最專注於無線技術的公司。但我們也積極迎接變化,高通不僅僅是一家專注無線連線的公司,更將成為連線的計算公司以適應新時代的
人工智慧
處理。更令人振奮的是,驍龍現在不僅引領著移動行業的創新,還在推動著其他行業的進步。」
上個月與驍龍 8 至尊版一同釋出的晶片,還有驍龍座艙至尊版(Snapdragon CocKpit Elite)和驍龍 Ride 至尊版(Snapdragon Ride Elite)平臺,它們專為汽車定製,分別面向智慧座艙和自動駕駛。
其中,驍龍座艙至尊版使用的 Oryon CPU 圍繞車用平臺進行了多方面的提升。它的 CPU 算力較上一代提升了三倍,AI 效能也有飛躍式增長,達到了前代產品的 12 倍。此外它也透過軟體虛擬化和多
作業系統
等機制,支援實現了車機任務的靈活的集中式處理,滿足了汽車安全標準。
現在,車廠能夠在同一塊 SoC 上無縫執行數字座艙和智慧駕駛等功能,真正實現了近年來一直在追求的硬體架構統一。
驍龍座艙至尊版平臺和 Snapdragon Ride 至尊版平臺將於 2025 年出樣。理想汽車已經官方宣佈,將率先搭載高通最新發布的驍龍至尊版汽車平臺。
在驍龍峰會上,理想展示了自家智慧座艙的一系列功能,從語音助手、旅行助手到智慧問答。
驍龍至尊版汽車平臺是驍龍「數字底盤」解決方案組合中的最新產品,除了高算力的晶片,高通還提供智慧駕駛和 AI 軟體棧體系,提供端到端的智慧駕駛系統,具備視覺
感知
、感測器融合、
路徑規劃
、定位和整車控制等先進特性。
在採用 Oryon CPU 的驍龍 8 至尊版釋出之後,再加上高通自研的 Adreno GPU、Spectra ISP 和 Hexagon NPU 等,高通補齊了自研 SoC 的最後一塊拼圖,也統一了 PC、手機、汽車三條產品線的晶片架構。
自研晶片架構的意義,在於能夠根據不同產品線的需求,對 CPU 進行微架構層面的調優和定製。與此同時,高通 AI 軟體棧(AI Stack)也在不同產品線的 AI 部署中作用顯著。
至此,
從晶片、大模型到 App 的縱向,以及從手機、PC 到汽車的橫向,高通已經做到了 AI 能力的全鏈路打通
。
正如大模型公司不斷透過新技術最佳化降低大模型使用門檻,高通的佈局正在幫助眾多 OEM 廠商和應用公司,把越來越多的生成式 AI 技術,從不可能變為可能。
生成式 AI 可能會「無處不在」
大模型的落地推動到現在,人們已經越來越重視起端側能力的體驗。
從 AI 技術領域裡,研究「小模型」(SLM)的趨勢開始,在科技公司的努力下,端側模型從文字到影像,再到多模態的一步步逐步落地。如今,高通端側晶片的 AI 能力,完整的開發平臺以及統一的生態體系,已經為生成式 AI 的大規模應用鋪平了道路。
不過,高通的「至尊版」晶片只是起點。經由全鏈路的技術推動,我們還將見證不久的未來,很多事物改頭換面。
其實在最近的釋出活動中,我們已經看到了端倪。在《永劫無間》手遊的測試版本中,驍龍 8 至尊版除了利用 CPU、GPU 能力帶來高幀且穩定的遊戲體驗,還在端側跑起了 18 億
引數
的大
語言模型
。配合高通 AI 軟體棧從硬體到軟體的全棧最佳化,
網易
在手遊的端側直接打造出了 AI 隊友功能。
現在,玩家們在遊戲裡擁有了可以語音互動的 AI 隊友,他們在戰鬥過程中不僅能夠聽玩家指令行事,還會在你不會的時候進行提示。
如果說在手遊這樣高能耗的應用上,我們已能用得起大模型的智慧體,那麼在日常的應用上,AI 智慧體就更可以為我們架起橋樑,讓很多功能實現高度的自動化,甚至消除 App 之間的壁壘。再延伸到 AI PC、汽車甚至機器人,高通的技術棧,或許還能把不同的硬體連成一體。
正如奧特曼所說,高通在所有邊緣端裝置上都擁有強大的技術,能夠應用 AI 模型彙集全球幾十億使用者。現在僅僅是生成式 AI 的開始,未來將會出現什麼?是發揮想象力的時候了。
相關文章
整合spring cloud雲架構 -高可用的分散式配置中心
2019-03-18
Spring
Cloud
架構
分散式
晶片巨頭高通的AI軟實力
2020-09-29
晶片
AI
【AI晶片】中國AI晶片爆發,架構創新迫在眉睫
2018-05-03
AI晶片
架構
Gartner:45%的高管正在試用生成式人工智慧
2023-11-08
人工智慧
特斯拉自研AI晶片,要和英偉達說再見?
2018-08-03
AI晶片
更美影像生成、直出分鐘級影片,國產自研DiT架構的越級之旅
2024-07-08
架構
又一AI晶片浮出杭州西溪:阿里之後,Rokid自研晶片也曝光了
2018-04-20
AI晶片
阿里
[分散式][高併發]高併發架構
2019-03-19
分散式
架構
【AI晶片】應用和架構創新雙輪驅動AI晶片發展報告;AI的豐富應用與晶片發展
2018-04-10
AI晶片
架構
Salesforce:3/4的營銷人員正在或計劃使用生成式AI
2023-12-11
Salesforce
AI
阿里巴巴釋出第一顆自研晶片,全球最強 AI 晶片含光 800
2019-09-25
阿里
晶片
AI
Spring Cloud微服務分散式雲架構 - 整合企業架構的技術點
2019-11-14
Spring
Cloud
微服務
分散式
架構
如何用 Spring AI + Ollama 構建生成式 AI 應用
2024-11-04
Spring
AI
(二)spring cloud微服務分散式雲架構 - 整合企業架構的技術點
2018-11-22
Spring
Cloud
微服務
分散式
架構
(二)spring cloud微服務分散式雲架構-整合企業架構的技術點
2019-03-08
Spring
Cloud
微服務
分散式
架構
Minstrel自動生成結構化提示,讓AI為AI寫提示詞的多代理提示生成框架
2024-09-30
AI
框架
Google、高通都在研究的晶片架構,是他們對抗ARM的武器
2018-03-30
Go
晶片
架構
架構師眼中的高併發架構
2019-03-29
架構
分散式塊儲存 ZBS 的自主研發之旅 | 架構篇
2022-08-24
分散式
架構
生成式 AI 時代,手機正在進行一次全棧革新?
2024-03-05
AI
全棧
Android 高通Camx架構學習 - 第1章
2021-09-11
Android
架構
基於MFS高可用的分散式儲存架構
2019-08-25
分散式
架構
Mojang可能正在研發至少兩款《我的世界》衍生遊戲
2021-09-26
遊戲
分散式架構基石-TCP通訊協議
2018-10-15
分散式
架構
TCP
協議
分散式架構-可靠通訊-服務安全
2023-03-10
分散式
架構
不犧牲演算法,不挑剔晶片,這個來自中科院的團隊正在加速國產AI晶片破局
2024-04-09
演算法
AI晶片
蘋果內部員工自揭其短:生成式AI研發竟已落後兩年多
2024-10-21
蘋果
AI
網路晶片架構的新改變
2018-10-15
晶片
架構
架構師眼裡的高併發架構
2018-07-27
架構
高通釋出獨立AI晶片,搶食推理加速器市場
2019-04-10
AI晶片
手機晶片誰是AI之王?高通、聯發科均超華為
2019-02-12
晶片
AI
WAIC上,高通這一波生成式AI創新,讓我們看到了未來
2024-07-08
AI
40億美元投資Anthropic 亞馬遜雲科技夯實生成式AI三層架構
2024-04-17
亞馬遜
AI
架構
高通晶片平臺進9008埠
2024-04-10
晶片
DSW:面向AI研發的整合開發平臺
2020-05-18
AI
springboot整合mybatis自動生成框架
2024-05-09
Spring Boot
MyBatis
框架
即夢AI首發,位元組自研影片生成模型Seaweed開放使用
2024-11-08
AI
模型
高可用架構
2024-09-14
架構