OPPO的航船:小布生命體將駛向怎樣的科技彼岸?

naojiti發表於2022-09-01

智慧助手走進人類生活已達十年之久。在某彈幕網站,我很喜歡看使用者“調戲”各種智慧助手,問它們一些奇葩的問題,讓它們替自己接電話,每次都能讓人忍俊不禁。同時,看著大家吐槽智慧助手依然“人工智障”,也難免有一絲遺憾。

數字技術不斷進步,智慧助手及其產業是否還有新的機會,能否迎來向前進一步的發展契機?在今年的OPPO開發者大會上,我們看到小布助手呈現出的更多可能性。

基於“端雲一體的數智大腦”Andeverse的技術能力,小布助手在元空間釋出會上,打造出了一個虛實共生的數字平行世界,重磅釋出4.0年度版本,整合小布空間等多個創新產品功能,讓使用者得以提前領略虛實融合的數字體驗。

(OPPO數智工程事業部總裁劉海鋒的數智人亮相小布元空間釋出會)

從中,我們能讀到OPPO在人工智慧、虛擬數智人等領域的技術突破,同時,也可以把握移動生態和移動互動在新背景下的脈動,當使用者們開始熟悉並喜愛智慧助手,依賴其完成更多生活體驗,小布如同一艘航船,正在成為更多人前往數智新世界的載具。

小布從來沒有停止過進化,也代表了智慧助手的持續探索,與我們每個人有著千絲萬縷的聯絡。讓我們從小布的進化路線圖出發,一窺數智人的彼岸風景。

渡海:不斷上升的海平面

首先需要明確一下,為什麼智慧助手的進化,是理解數智未來的一個重要參照點。回顧機器智慧的歷史,早在上個世紀,機器人專家漢斯·莫拉維克就繪製了“人類能力地形圖”,中低地代表著“算數”和“死記硬背”,丘陵代表著“定理證明”和“下象棋”,高聳的山巒代表著“運動”“手眼協調”和“社互動動”。隨著人類對機器智慧的不斷推進,海平面也在逐漸上升,低處的人類能力開始不再獨特,逐漸地,一些更高階的能力也可以由智慧生命來完成。比如隨著預訓練技術的發展成熟,機器對話在某些場景下甚至達到了類人的水平。

技術不斷擴充著人工智慧的能力,智慧助手的智慧程度近年來也取得了很大的發展,也意味著智慧生命體將在我們的生活中扮演越來越重要的角色,熟悉並掌握數智生活已經不再是一種選擇,而是一種必備的生活技能。因此漢斯·莫拉維克提出:我們應該建造一艘方舟,儘快適應航海生活!

智慧助手作為連線物理世界和數字世界的互動入口,很適合成為那艘普羅大眾都可以搭乘的數智航船。

造舟:AI支撐下的小布身心靈進化

渡過時代之海,我們首先要看看小布助手4.0這艘航船究竟是怎樣建成的,有怎樣的能力。

小布4.0版本全新升級的5大能力,從主動式智慧到情感化互動,再到數智多模態、智慧新體驗和多裝置協同。從技術角度出發,我們可以將其歸納為三個方面,構成了小布助手4.0這一生命體的核心。

靈魂:漢斯·莫拉維克認為,社互動動、情感互動等是人類最高階的能力之一,也是“人類能力地形圖”中尚未被淹沒的山巔。而小布作為OPPO AI應用的集中體現,4.0全新版本正在不斷抵達這些山峰,表現出更加智慧的一面。

智慧是一種抽象的、虛無縹緲的東西,機器要展現出類人般的智慧,理論上要從三個角度完成進化:一是記憶,人類能夠把很多長期狀態的資訊編入大腦的演算法內,在未來某一天來呼叫它,而穩定的長期記憶是機器智慧的一大挑戰,表現在智慧助手上,就是難以在多輪對話中流暢而自然地交流;二是計算,人腦的平行計算能力非常強大,擅長解決複雜的任務,如分析、決策。在演算法和算力的快速發展下,AI也開始在決策智慧上展現出類人的能力,讓智慧助手得以從“命令式被動響應”進化為“貼心式主動服務”;三是學習,IBM的深藍計算機在1997年戰勝國際象棋冠軍加里·卡斯帕羅夫時,最大的優勢是記憶能力和計算能力,到了2016年AlphaGo擊敗李世石,深度學習讓機器實力有了實質性的飛躍。擁有學習能力之後,智慧助手能夠自我進化與迭代,解決互動程式化、類人感低的問題。

具體到小布助手4.0版本中,我們已經可以看到在記憶、計算、學習這三個層面,小布正在帶來真實可感的體驗變革。

記憶方面,適當的記憶決定了智慧助手的互動體驗是否自然順暢。對於人類來說,根據之前的資訊來作出即時反應,幾乎是一種本能,根本不需要特別調動記憶模組,但這麼簡單的事對於AI智慧體來說卻是很困難的。在長短期記憶神經網路(LSTM)出現之前,傳統神經網路沒有記憶功能,無法處理較長序列資料,簡單來說就是記不住長距離資料的資訊,表現在智慧助手身上,使用者跟它說完“吃完晚飯跟我聊會兒天”,它還會問一句“吃了沒”,妥妥地煞風景。要避免使用者說“前門樓子”AI說“胯骨軸子”這種前言不搭後語的情況,就需要智慧助手很好地理解上下文,以此來生成更自然、情感化的表達,這就離不開強大的記憶能力。所以,研究人員特別為小布研發了記憶能力,讓AI在聊天過程中能夠理解一些更長距離的關鍵資料,不至於學過就忘,從而生成有趣、有用的聊天內容,使用者不必反覆強調一些說過的內容,人機交流也就更加輕鬆愉快。有了記憶,智慧助手才有了可持續成長的人格化基礎。

計算方面,在端側算力的支援下,小布助手得以搭載更強大的演算法應用,基於自研的情感識別演算法,讓小布助手具備智趣單輪、技能引導、話題多輪、情緒感知等基礎能力,再引入較為前沿的預訓練技術,透過1億~10億引數級別的大模型來提升語言理解的泛化能力,緩解因“意圖理解不到位”而造成的“智障”問題。同時,注重AI與知識計算的結合,構建了精品知識圖譜,規模達到億級別的實體和百億級別的關係,讓小布具備足夠的知識儲備,能夠解答使用者各種各樣的疑問,在知識問答方面帶來了2%~4%的效果提升。一番技術打磨之下,小布助手對於口語化表達的理解、使用者意圖的分析、有溫度的情感化互動,就得到了有效的提升。

不止於此,小布助手還能夠準確判斷使用者需求、結合上下文場景,進而主動提供服務。將數字服務的各個“斷點”串聯起來,讓服務呈現連貫性,使用者感受到的是符合行為慣性的絲滑與順暢,比如感知到使用者的出行需求後,小布會在使用者出行前就提供行李準備、酒店預訂、交通情況、防疫政策等基礎提醒,提前為旅程做好充分的準備。

學習方面,小布更智慧的一面還體現在持續學習和發展進化的能力上。對內,小布會根據使用者的行為反饋不斷學習進化,變得越來越“懂你”:如果發現使用者的需求沒有被滿足,會反覆修改自己的話術進行重試;收到使用者的表揚,也會根據口碑滿意度體系來進一步最佳化,持續提升自己。對外,小布會持續學習多場景、跨終端帶來的資料資源,不斷擴充套件自身的能力邊界和服務場景。比如透過場景理解,支援一句話多指令,讓查天氣、定鬧鐘、打電話等常規服務更加便捷高效,只需對小布說一句“開啟健康碼”指令,能省去手動操作的一系列繁瑣流程。另外,小布可以支援手機、手錶、電視、Pad等OPPO自有裝置控制,以及小布生態的第三方品牌,跨端、跨裝置執行指令,打破了資料壁壘,既讓使用者享受到全場景服務無縫切換的絲滑;又能夠透過多終端資料協同反哺演算法,為小布助手的自主學習提供多維度的資料養分,進一步提升小布的智慧水平和服務能力。

沿著記憶、計算、學習的路線圖,小布正一步步向“人類能力地形圖”的山巔攀爬。

身體:很長一段時間以來,智慧助手都如同科幻電影《HER》中的女主角一樣,只有語音而沒有形體,近年來隨著數智技術的進步,一些智慧助手開始整合語音互動、自然語言理解、影像識別等AI能力,外觀形象變得更加鮮活,比如微軟小冰、OPPO小布、騰訊雲小微等……今年的小布也在技術支撐下進一步迭代。

一方面,小布4.0進行了互動層面的全新升級,支援使用者透過手機螢幕的多點觸控,與數智人實時互動,如可以戳戳小布的肚子、摸摸小布的頭和屁股,小布數智人都可以給出相應的反饋。小布4.0版本推出的小布數智人3D聊天功能,則更進一步,透過3D場景、AI驅動的數智人和故事設定,支援多模態互動的同時,還能創造出真實自然的聊天場景,識別使用者情緒,讓使用者獲得以聊天互動為主、兼具遊戲娛樂的沉浸式聊天新體驗。

另一方面,小布空間為數智人提供了互動的場域,更具沉浸感和互動趣味。儘管XR裝置尚未普及應用,但OPPO已經基於小布助手APP打造了虛實融合的元空間概念產品,讓使用者可以在手機介面下體驗虛實融合的魅力。小布空間支援使用者在其中建立自身形象,3D視覺效果和真實角色設定讓數字生活更具沉浸感和真實感,運用“第二分身”與數智人和真人在廣場社互動動,解鎖更多創新玩法,比如一起去展廳觀看會議直播,足不出戶完成線上參會等,提前體驗“模擬人生”。

物理學家邁克斯·泰格馬克提出,1.0版的生命,其硬體和軟體都是靠進化獲得的,無法改變。而以人工智慧為代表的生命3.0階段,生命不僅可以自行設計軟體(文化),還可以自行設計硬體(身體),從碳基走向矽基。顯然,小布數智人所表現出的“身體”形象的可設計、可塑造,正是智慧生命向3.0階段發展的必然過程,也讓我們提前感受到了與矽基生命互動的樂趣。

OPPO“科技為人”的理念,推動了小布助手身心靈向更智慧的方向發展迭代,成為秀外慧中的智慧生命。有了堅實的身心基礎,也就有了進一步探索虛實融合未來的底氣。

啟航:數智世界的技術彼岸

夯實智慧助手的能力只是第一步,此次創新的第二個價值點在於:數智人的世界探尋。

客觀而坦率地說,移動網際網路發展了十多年,使用者對於人機互動的新鮮感也極大下降,大家渴望新體驗,而新體驗必將建立起移動終端市場的新秩序。而當下,技術指向已經十分明顯,那就是一個被反覆提及的名詞——虛實融合。

此次OPPO開發者大會,可以很清晰地看到OPPO對技術路徑和產業方向的判斷,小布元空間釋出會打造一個現實世界與虛擬世界相互交織、自然融合的交流共享空間,小布4.0集感知和互動為一體的視覺效果。

沿著小布助手和數智人的航線,究竟會駛向一個怎樣的技術彼岸?從OPPO的舉措,我們可以看到三個正在被釋放出的紅利。

1.技術紅利。數智人的應用場景不斷擴充,但技術門檻依然高企,一個具備高互動性的數智人,需要領先的AI演算法來對唇形、表情、動作等進行生成和驅動,比如NLP演算法生成的語句要跟口型精密匹配,才能讓使用者有跟真人對話的既視感。要讓互動不枯燥,有新鮮感,不能來來回回就是幾個固定動作,就需要GAN生成演算法等參與構建並驅動數智人的動作。數智人要進入銀行、醫院、學校、高鐵站等各種場景提供服務,不可能所有企業都要靠自己來研發基礎能力,透過小布數智人平臺和OPPO開放生態合作,避免在底層技術上反覆造輪子,能夠降低技術門檻,加速數智人的產業化程式。

2.產業紅利。隨著多模態人機互動被廣泛接受,對數智人的產業需求也越來越多,但個性化外形和技能呈現,需要美術設計、3D建模、骨骼繫結、貼圖捏臉等一系列操作,高企的製作門檻阻礙了數智人的規模化落地。目前,小布也在數智人平臺沉澱了相應的能力,提供個性化、高表現力、多場景的數智人服務,減少落地應用門檻,助力數智人深入到B端市場的更多場景。

3.生態紅利。豐富繁榮的數智人應用與服務,離不開個人開發者和企業開發者的創新智慧,讓開發者的創意和精力快速轉化為商業回報,OPPO在AIoT領域的全面佈局和生態建設提供了豐沃的成果轉化土壤,前面提到小布助手支援手機、手錶、電視、Pad等OPPO自有裝置控制,也支援第三方品牌,覆蓋全品類硬體,這意味著相關應用和服務能夠在多端部署、覆蓋OPPO生態內的使用者,開發者藉助OPPO收穫商業價值,又進一步吸引更多人共建虛實融合的數智世界,OPPO創新生態也就進入了良性迴圈。

不難看出,隨著小布助手的潛力不斷釋放,未來不僅僅會在OPPO萬物互融的生態體系中,扮演互動入口的重要角色,還將在整個移動生態內擴散智慧生命體的價值,成為更多企業和使用者與數字世界的交接點。萬物互融、虛實融合的大趨勢下,小布的存在價值正前所未有地顯現出來。

未來生命研究所的邁克斯·泰格馬克認為:有人工智慧相伴的生命未來是我們這個時代最重要的對話。小布助手正帶著我們參與到與AI生命溫暖而有趣的對話中,有理由相信,生於這個人工智慧極大的發展時代的人們,都應該與智慧助手共同成就更好的彼此。

一段精彩的旅程正等待著我們揚帆出海,不妨從一句“小布小布”開始吧。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2912960/,如需轉載,請註明出處,否則將追究法律責任。

相關文章