國內銷量持續領跑,榮耀告訴你切入AI手機的正確姿勢

机器之心發表於2024-04-25

該有人給出個標準了。

「AI 手機」到底是什麼?這個問題至今還沒有結論。

ChatGPT 出現後,科技界迎來技術爆發。自去年底開始,新一代的旗艦手機紛紛引入大模型,它們有的實現了大模型端側落地,有的推進端雲一體,配置了多種 AI 能力,有的引入了第三方 AI 應用。雖然都叫 AI 手機,但發力點各不相同。

有人說,如果一臺手機的 AI 算力大幅提升,能夠感知真實世界,並用大模型進行理解和創作,那它就是 AI 手機。

這種定義下的裝置,就是手機的下一個形態嗎?

最近,全世界似乎都在等蘋果 6 月 WWDC 大會來給 AI 手機進行「定調」。

國內銷量持續領跑,榮耀告訴你切入AI手機的正確姿勢

據說在這次大會上,蘋果將隨 iOS 18 的大版本更新推出一系列全新生成式 AI 能力,覆蓋智慧搜尋、AI 助理、運動健康以及生產力應用。

但在蘋果 AI 解決方案全面揭秘之前,我們在國內手機廠商中似乎已經看到了 AI 手機未來該有的樣子。

手機上有大模型,就是 AI 手機嗎?

最近手機廠商推出的旗艦智慧手機,透過引入或者內建 AI 大模型,已經為使用者帶來了一系列的 AI 智慧新體驗。比如,我們已經能夠在智慧手機上體驗到新一代 AI 助理、影像生成、文件摘要、語音翻譯、AI 影像處理等等。

但很多時候,這些功能實際上不用手機接入大模型或內建大模型,第三方 APP 聯網的雲端 AI 也能完成,甚至比手機廠商做的還要智慧。

所以,直擊靈魂的問題來了:把大模型接入端側的意義是什麼?接入或者內建大模型,並打造一系列的 AI 應用就是 AI 手機未來的樣子嗎?

關於這個問題,蘋果在最近披露的一篇技術論文中,給出了一種可能的答案。

在《ReALM: Reference Resolution As Language Model》這篇論文中,蘋果提到了一個可以在端側執行的大模型 ReALM,其在運作過程中,可以清晰識別螢幕中的各種元素,包括按鈕、圖示、文字框等等。識別之後,它會對這些元素進行文字轉換,記錄每個元素的確切位置和它們的關係,並將螢幕上的元素和位置資訊,轉換成詳細的文字描述,輸入語言模型,讓其學會解析使用者的指令。

圖片

不難想象,在無數次觀察螢幕上的各種使用者操作後,大模型將會越來越精確的分析並總結出使用者使用手機時的既定行為模式,並可以藉助一些 Agent 技術,為使用者提供自動化、個性化的操作。

比如,每天下班,你都會連線投影儀,投屏自己喜歡的電視劇,ReALM 在學習行為習慣後或許能自動幫你連線裝置,並投屏好昨天未看完的電視劇,你只需要點選播放即可。

事實上,這種充滿想象,甚至一度讓人聯想到電影中「賈維斯」的 AI 手機方向,已經有國產手機廠商早於蘋果落地,並仍在不斷進化中 —— 今年年初,榮耀釋出了 AI 使能的全場景作業系統 MagicOS 8.0,依靠平臺級 AI 以及自研端側 AI 大模型帶來了行業首個基於意圖識別人機互動,改變了人去適應機器的傳統互動模式,讓手機能夠學習人,瞭解人,並能主動為人提供服務。

而這種區別於行業普遍做法的 AI 手機路徑,也得到了當前市場的驗證。

4 月 25 日,國際資料公司(IDC)釋出的最新手機季度跟蹤報告顯示,榮耀以 17.1% 的市場份額拿下第一。據 IDC 中國區副總裁王吉平介紹,此次榮耀登頂,AI 成為關鍵增長引擎。

其中,榮耀全新旗艦 Magic6 系列得益於 AI 功能的增加,以及影像,螢幕等全方位的升級,首銷第一季度出貨量超過上一代產品前二季度出貨量之和;在搭載平臺級 AI 的榮耀 Magic V2 以及其他摺疊屏家族產品的推動下,去年以來,榮耀摺疊屏手機份額同比漲幅最高達到 675.4%。

AI 手機的未來 ——AI 智慧體

在榮耀看來,當前行業以大模型賦能應用或者打造 AI 應用的路徑更像是手機 AI,而不是 AI 手機。

榮耀 CEO 趙明在近期談話中更是直言:「手機 AI 不等於 AI 手機。AI 手機意味著用 AI 來重構和使能手機應用和作業系統,以及消費者體驗和業務邏輯的方方面面,AI 是根基,AI 在手機上是無處不在的,這才能叫 AI 手機。」

圖片

今年 3 月,榮耀提出 AI 使能的全場景戰略,進一步明確了在 AI 領域的戰略方向,定義了智慧終端的 AI 四層架構

圖片

榮耀 AI 四層架構。

其中:

  • 第一層是用 AI 使能跨系統、跨裝置的融合,讓不同的作業系統用 AI 來做決策實現手機、平板、PC 等裝置之間的無縫連線和資料共享;

  • 第二層是用 AI 來重構單終端的作業系統,讓終端越用越懂你、越用越好用,比如在 MagicOS 8.0 上,基於平臺級 AI 能力帶來了基於意圖識別人機互動體驗;

  • 第三層是 AI 在端側的應用,比如摳圖、拍照渲染、總結文件等應用級 AI;

  • 第四層是 AI 的端雲協同,是在保障使用者隱私安全的前提下,實現 AIGC 和網路大模型等網路側 AI 在手機上的呈現。比如榮耀此前與百度雲達成戰略合作,以千帆大模型助力 YOYO 助手打造更專業的使用者服務,帶來了文字創作、知識問答等智慧功能。

據趙明介紹當下手機廠商 AI 的發力點集中於這三四層面,而四層 AI 全部發力的只有榮耀,並且榮耀的重點在一二層。

AI 在端側的應用是一條探索之路,沒有前人的經驗可供參考。

在不同的路徑中,一些廠商選擇以點帶面的方式切入,透過在手機中加入很多獨立的生成式 AI 能力,解決了多類場景中的問題,如智慧翻譯、修圖、高階搜尋、內容生成等等。

這種方法快速引入了新技術,能夠高效地解決問題,提升部分操作的效率,但適用的場景具有侷限性,仍處於「我們告訴手機要怎麼做」的階段。

此時,大模型智慧體(Agent)走入了人們的視線。

知名 AI 學者吳恩達(Andrew Ng)最近表示,很多人都已經歷過「ChatGPT 時刻」,即嘗試 AI 的時候發現體驗大大超出預期。也許你很快還會經歷類似的「AI 智慧體時刻」。

圖片

圖片來源:https://twitter.com/AndrewYNg/status/1779606380665803144

吳恩達認為,AI 智慧體工作流今年將有巨大進展,其智慧程度可能會超過下一代基礎模型。

榮耀正在做的,就是在手機中利用智慧體驅動大模型能力,這就與「手機 AI」的友商形成了對比。

如果我們對手機發出的指令,接收方是智慧體驅動的 AI,它能像人類助理一樣圍繞場景理解意圖並分解、編排任務,端到端地完成較為複雜的工作,如安排你的出行、規劃旅行、組織聚會等。

更重要的是,智慧體並不針對某類問題或者單個場景,而是利用了作業系統級的資源,能夠感知場景變化,學習使用者習慣,主動思考,決策呼叫系統所有能力。這樣以來,大模型就能承接複雜任務,互動的體驗也獲得了升級。

圖片

圖片來源:《The Rise and Potential of Large Language Model Based Agents: A Survey》

以智慧體為工具,利用 AI 重構作業系統,從內而外地重新構建手機的人機互動體驗,相比單獨引入能力,可以獲得無限的可能性。這是榮耀一直在做的事,並且已經深耕了 8 年之久。

2016 年,榮耀第一次在智慧手機端引入 AI 概念。智慧手機在 AI 技術加持下,能實現相應的需求感知和機器決策,這是榮耀 AI 能力的 1.0 階段。

2022 年,榮耀推出的平臺級 AI 使能的全場景作業系統 MagicOS 7.0,能基於地理圍欄和使用者習慣等資訊,主動提供場景建議引導及服務;2024 年 1 月 10 日釋出的 MagicOS 8.0 包含的「任意門」功能,立足於使用者意圖識別,帶來跨應用和跨裝置的智慧流轉。

在傳統的手機系統中,OS 核心主要負責管理硬體資源,而平臺級 AI 這一「新核心」則負責「管理」與人相關的因子,如個人知識庫、位置與狀態、習慣與畫像等,幫助 OS 精準識別使用者意圖,高效排程系統服務,能夠帶來「猜你所想,懂你所需」的智慧體驗。

此外透過以 AI 重構作業系統,榮耀還創新地推出了基於意圖識別的「新生態」正規化,以 YOYO 智慧助理為載體,充分協同端雲大模型的能力,帶來了更多「意圖直達」體驗:端側平臺級 AI 大模型作為中控,理解使用者意圖,拆解編排任務,高效安全地連線雲側大模型,分發、融合、排程原子化服務,完成複雜任務閉環。在這個過程中,端側大模型透過端側防護網濾掉個人隱私,並確保個人資訊不上雲,保護了隱私安全。

更進一步,在應用層面上,榮耀的 MagicOS 不僅連線自身能力,也覆蓋大量第三方服務。榮耀希望在 MagicOS 上把雲側通用大模型,以及面向各行業垂直領域的大模型融入成為一體,為每個使用者提供更好的服務分發和任務閉環體驗。

未來,榮耀希望能夠打造一款可以持續的成長和進化的手機,當你用它越多它就越能懂你,越能夠幫助你。

結語

在 AI 時代,當有人重構端側,真的讓手機懂你,AI 就會從幾年前的應用和服務變成主導作業系統的基礎,讓手機變成使用者的一個分身。當我們從這個邏輯去發展手機和 AI 的時候,AI 手機才會從一個概念落地成為實體。

在 AI 大模型能力持續提升,端側算力和最佳化推動技術不斷落地的今天,更為貼合使用者使用需求的架構,不僅能讓手機獲得差異化競爭優勢,而且還會逐漸形成新的生態鏈,引領生成式 AI 顛覆性創新。

這或許才是 AI 手機不斷髮展的方向。

榮耀 AI 手機走出的路,帶來了更多想象力,未來正在顯現更多的可能性。

相關文章