生成式 AI 時代,手機正在進行一次全棧革新?

机器之心發表於2024-03-05
手機行業的第三次重大變革開始了。

最近一段時間,AI 與大模型技術突飛猛進。春節剛過,前沿方向上就迎來了新一輪突破。

圖片

OpenAI 的 Sora 一下子把 AI 影片生成的進度條拉快了半年。

在大模型的應用領域,技術落地應用的速度也在加快。目前各家大廠的新一代旗艦手機已經悉數登場,它們絕大多數都搭載了大模型,能實現很多前所未有的功能。

圖片

圖片來自高通驍龍 8Gen3 宣傳片:https://www.youtube.com/watch?v=0CqtpjlL25w

為什麼大家都選擇在 2024 年入局 AI ?

答案似乎很明確。隨著大模型逐步成熟、晶片端側算力的增強,手機廠商有了明確的判斷:2024 年將是 AI 手機的元年。

不過面對一致的目標,各家打法不盡相同:很多手機開始引入雲端大模型應用,也有一些實現了小尺寸模型的端側跑通。在這其中,已經落地多個 AI 功能的 OPPO Find X7 系列正在獲得越來越多的認可。

它做到了很多個「第一」:Find X7 是全球首個端側應用 70 億引數語言模型的手機。

它還是第一個支援 AI 通話摘要的手機,讓使用者可以在通話結束後讓 AI 一鍵生成摘要,並自動生成待辦事項和提醒:

圖片

有了手機端 AI 大模型的加持,智慧助手也不再是個「擺設」,OPPO 的小布助手實現了跨越式的體驗提升。

現在的小布能夠更好地理解自然語言,還可以回答各種刁鑽的問題。它擁有超過 100 種能力,包括文字生成圖片、圖片解釋、AI 文章摘要等,能在辦公效率、生活服務、學習教育等不同維度為使用者提供幫助。

比如你可以問小布為什麼餅乾上有很多小孔,並要求它以「四歲孩子能理解的方式」回答:

圖片

OPPO 還帶來了全新的 AIGC 消除功能。以往需要電腦專業軟體複雜操作的改圖任務,現在在手機上只需要簡單一圈 AI 就能幫你完成主體消除、實景重繪。在這個過程中,大模型還能進行一定程度的「創作」,腦補出背景,得到一張沒有人潮的風景照:

圖片

Find X7 的大模型能力不僅支援超過 120 類主體的識別與分割,還可以實現髮絲級的分割、多達 6 個的多主體分離。這就是手機端生成式 AI 時代的拍照新體驗。

手機作為最常見的消費電子產品,一直是各種 AI 技術優先落地的方向,AI 美顏、AI 助手等功能早已是智慧手機的標配。而隨著大模型的興起,手機作為人類「外延器官」瞭解使用者的優勢,再加上生成式 AI 前所未有的突破,又帶來了更智慧、個性化的體驗和更多樣的玩法。

AI 手機或許將是繼功能機、智慧機之後,手機行業的第三個重大變革階段。而在這場變革中,OPPO 提前為我們展示了大模型技術突破後,手機的全新形態。

端側 70 億引數大模型

為什麼 OPPO 做到了?

OPPO Find X7 能夠實現的很多新能力,得益於端側執行的 70 億引數大模型。

在這代旗艦機上,首次搭載了OPPO 自主訓練的 AndesGPT 70 億引數大模型。透過端雲協同的部署,它實現了領先不止一代的 AI 體驗。相比 10 億引數模型,該模型能展現出更高「智商」的理解能力,可以更準確地理解對話內容並生成重點明確、細節豐富的摘要內容。

相比於同平臺的其他模型,AndesGPT 70 億引數版可以在 2000 字首字生成時帶來 20 倍的更快響應,最高對 1.4 萬字進行內容摘要,是其他模型的 3.5 倍,對話體驗也更接近人類對話的速度與資訊量。

圖片

我們知道,當前的大模型軍備競賽中,各家科技公司都在搶購 GPU,畢竟跑大模型很耗費算力。要在算力與記憶體有限的手機上執行大模型並不是件簡單的事,OPPO 是如何做到的?

這是因為在新一代手機上,OPPO 實現了面向大模型,從軟體、硬體到雲平臺的全面最佳化。

首先,OPPO 與平臺廠商進行緊密協作,基於對晶片的理解,和一直以來對於使用者需求的洞察和理解,根據大模型和演算法深度定製了 SoC 晶片,提升了高負載條件下晶片的執行排程,進而最佳化了大模型的執行效率。

圖片

對於使用者需求的洞察和理解是 OPPO 的核心競爭力,通話智慧摘要就是個好例子:通話錄音是業內早已出現的功能,但將傳統的通話錄音與端側大模型結合,就帶來了顛覆傳統應用的全新 AI 體驗。

大模型部署在端側,除了需要計算資源的極致最佳化,另一個瓶頸在於儲存。

在正常情況下,70 億引數的大模型需要佔用 28GB 記憶體。為了真正實現端側部署,OPPO 用 INT4 量化的方式對模型進行了大幅度壓縮,讓原本佔用 28GB 記憶體的模型現在只需要 3.9GB,既降低了資源需求,也幾乎不影響 AI 模型的輸出效果。

「大模型在端側效能消耗比較大,要透過平行計算的運算元最佳化、對記憶體管理的最佳化等來降低損耗和系統資源佔用。續航方面要根據用機情況來看,我們端側大模型的功耗控制在使用者可以接受的範圍內」OPPO AI 中心產品總監張峻表示。

OPPO 還是第一家真正意義上把端側 70 億引數大模型同時部署在高通和 MTK 兩個不同平臺的手機廠商,對使用者「一視同仁」的同時,也驗證了自身對 AI 最佳化部署的能力。目前,端側視覺模型的手機端部署也被列在了他們的日程表上。

對於生成式 AI 能力來說,有時端側模型無法處理的複雜任務,需要把資料傳到雲端,利用伺服器端 AI 加速器的力量;而很多包含個人資訊和偏好的資訊,需要在手機端側預先處理,以保證隱私。

大模型的端雲協同,是目前行業的共識。

在這一方面,OPPO 在釋出 AndesGPT 大模型時,提出了透過三級大模型部署策略實現的端雲聯合部署,滿足了多場景高效適配。

圖片

在端雲協同的架構下,OPPO AI 手機的算力供給不再侷限於本地,同時使用者資訊也能保證不被洩露 —— 使用者資料僅在端側計算,雲端更強大的計算能力則面向複雜任務處理,既提高了大模型計算時的整體效能和效率,也保證了安全。

AI 技術能力之外,OPPO 還有一個大戰略。

加碼 AI 戰略

人工智慧投入無上限

其實,OPPO 已在 AI 領域深耕多年:早在2020年,OPPO就已經開始探索大語言模型的訓練、應用與落地,首個自研大模型 OBERT一度躍居中文大規模知識圖譜問答KgCLUE排行榜的首位;2023 年,OPPO 自主訓練的安第斯大模型(AndesGPT)在 Super CLUE 知識與百科能力排行榜上僅次於 GPT 4,領先於所有競品。

此外,Find X7 上在端側應用的 70 億大模型,AI 算力跑分也在安卓榜單上名列第一。

OPPO 創始人兼 CEO 陳明永判斷,2024 年將是 AI 手機元年,五年內 AI 對手機行業的影響將不可忽視。

2 月 20 日,OPPO 召開 AI 戰略釋出會,分享了他們在 AI 戰略上詳細的規劃

圖片

OPPO 對真正的 AI 手機下了定義,認為其需要具備以下四大特徵:

  • 能高效利用計算資源,滿足生成式 AI 的計算需要;

  • 能敏銳感知真實世界,瞭解使用者與環境的複雜資訊;

  • 有強大的自我學習能力;

  • 具備更充沛的創作能力,為使用者提供持續的靈感與知識支援。

為了適應這些能力需求,手機行業需要進行全面的技術革新與生態重構:在硬體架構上,高效能的 AI 算力底座、模型庫的管理最佳化以及智慧仿生感知能力將成為 AI 手機的新的標準。AI 手機的 OS 系統透過內嵌智慧體,將能高效地處理複雜任務,並可以主動創作。

另一方面,未來的 AI 手機將支援更敏銳、更準確的自然語義理解,擁有更強大的自學習能力,可提供更符合直覺的多模態互動。由此看來,傳統的應用生態將會在 AI 手機時代轉向智慧體生態,各類服務應用都會與 AI 能力無縫連線,實現真正的智慧化服務。

圖片

為此,OPPO 已經做足了準備。在雲端算力上,OPPO 擁有能夠支援千億級 AI 模型訓練的 OPPO AI 濱海灣資料中心,支援兩毫秒的骨幹網路連結超低時延,以及 100% 的純綠色能源。

未來,OPPO 將在算力上持續投入,部署 AndesGPT Titan、Turbo、Tiny 三個級別的模型以對應不同應用場景。

圖片

在 Agent 能力上,OPPO 正式釋出了 1+N 智慧體生態戰略。其中的「1」代表 OPPO AI 超級智慧體,它基於知識圖譜、文件資料以及搜尋引擎,能精準理解使用者意圖,給出準確結果,充分呼叫其他多種工具;「N」則代表基於 OPPO AI Pro 智慧體開發平臺所賦能的全新智慧體生態。

相比大模型智慧助手,智慧體是更加快捷和主動的 AI 助手,可以根據你的設定,以最有效的方式完成各種目標,滿足情感陪伴、求知探索、娛樂閒聊等多樣的場景需求。同時,構建智慧體的方法非常簡便,無需程式設計程式碼基礎,人們只需和大模型進行自然語言對話,提供必要的說明和知識即可。

智慧體也可以與大模型以外的其他服務相連線,訪問更多資訊和手機功能,以通用化的能力滿足使用者的各類需求。

更重要的是,OPPO 的 1+N 也意味著聯合更多合作伙伴與開發者。隨著智慧體佈局的展開,人們就能共同打造出面向 AI 手機生態的服務體系。

就像智慧手機上的 APP 應用市場。不過這次,由 AI 連線的服務能力更強,與你的連線更緊密。

OPPO 還在繼續加碼 AI。戰略釋出會上,OPPO 正式宣佈成立 AI 中心,旨在整合研發資源,針對 AI 進行能力建設與研發。劉作虎表示,AI 中心的成立將匯聚整個公司的力量,已把 AI 作為手機下一個時代最重要的戰略,對於投入不設上限。

大模型加持的手機

還會如何進化?

這還只是個開始。畢竟大模型是一個「改變世界」的技術,所有領域的應用都要用 AI 重做一遍。

最近,在人工智慧上,很多人都有大動作:蘋果停止了自己持續多年的造車專案,並將探索重點也轉向生成式 AI;谷歌在釋出原生多模態大模型 Gemini 時宣佈,未來大模型會整合至安卓系統中;而高通在 MWC 大會上推出的新一代 AI Hub,已支援超過 75 種主流 AI 模型在端側的加速。現在,從手機廠商到科技公司,再到晶片公司,英雄所見略同。

我們可以預見,隨著技術的進步與行業生態的構建,未來我們還會看到更加智慧化的拍照、更快捷的人機互動、更加個性化的內容生成和更高效的任務處理。

使用生成式 AI,過去複雜的工作將會變得更簡單。人們可以無需開啟專業軟體,僅發出口頭指令就能讓 AI 自動完成複雜的工作,大幅提升工作效率。

部署在端側的生成式 AI,也可以讓智慧手機更加了解使用者的習慣和所處位置。利用情境資訊,數字助手將會更加個性化,帶來更令人滿意的答案,提供更主動的服務。

更進一步,隨著 AI 生成能力逐步進入多模態領域,下一代 AI 渲染工具將能利用文字、語音、影像或影片等各種型別的提示生成 3D 物體和場景,最終創造出全新的沉浸式內容體驗。

一句話,AI 手機將會為我們帶來一場革命。

圖片

隨著 OPPO 等手機廠商對 AI 技術的不斷推動,我們與想象之間的距離已經近了。

相關文章