真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

人工智慧洞察站發表於2023-03-24
明敏 發自 凹非寺
量子位 | 公眾號 QbitAI

AR苦內容久矣。

過去一段時間來,AR廠商們都爭相推出消費級AR眼鏡,在重量、續航、功能上卷出新花樣,但也逃不脫被人們詬病:

除了看片還能幹啥?

當下的消費級AR到底是不是真·AR?

對於使用者來說,AR眼鏡的作用,如果只是將一臺投影儀縮小到鏡片大小架在眼前,很難長期滿足消費者不斷湧現的新需求。

一直和手機借內容生態?

似乎也不可取,畢竟AR最大的想象力就在於如何成為一個新型獨立終端。更何況手機內容都侷限在2D,和擴增實境基本定義裡反覆提及的3D也有本質性區別。

所以應該怎麼辦?

賣空自家6萬臺AR眼鏡庫存的行業頭部玩家,最近頂著元宇宙退潮交出了自家答卷:

透過一個AR應用,他們讓普通人在10分鐘內建造屬於自己的AR數字空間。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

而且還是必須要用手在物理空間裡創作的那種,AI這回沒話說了吧?真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

當然這是開玩笑,其背後真正的目的在於,能夠讓更多開發者、創作者,能夠來AR空間內發揮自己的想象力,壯大AR內容生態,並進一步達到推動AR向大眾層面滲透。

所以這款應用到底是什麼?僅憑它就能實現如此宏大的目標嗎?背後又揭示了AR行業的哪些暗湧?

靈境是什麼?

Rokid創始人兼CEO 祝銘明表示,靈境是AR行業一個劃時代的產品,可以讓每一個人都參與到AR數字內容的創作中。

官方定義,靈境是一款AR空間創作工具,能做的事就是在3D空間內創作AR內容,而且門檻很低,人人可用。

具體操作步驟分為5步:

  • 手機掃描空間

  • 雲端空間重建

  • 線上場景佈局

  • 多端一鍵釋出

  • AR終端體驗

也就是說,透過普通手機攝像頭,靈境就能獲取到空間資訊,然後在雲端進行重建。之後就可以按照自己的想法完成創作了。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

創作好的AR內容可以直接釋出在平臺上,一個空間內可以有多個人釋出自己的創作。最後只需戴上AR眼鏡就能體驗。

整個過程下來,一個10平米左右的空間,只需10分鐘就能搞定。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

據介紹,靈境的內容渲染也是基於Rokid自己的3D渲染引擎,這樣可以極大降低整個內容創作、落地的時間和人力成本。

要知道,目前AR內容創作的落地過程,基本上都還是一個長鏈條流程。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

需要有一定的產品資源、開發資源和內容創作資源,然後再由專業團隊打包資源到現場測試,最後進行驗收。常被使用的創作工具如Unity、UnrealEngine,在使用上也有門檻,要求使用者具備一定的開發基礎能力。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

而且靈境還強調一大特點:協同合作

不僅實現了多端一致,即在手機、PC、AR眼鏡上都能看到創作內容空間;也實現了讓多人參與到同一空間內的AR創作。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

這個定位明顯更偏向於大眾化,行業內使用者和普通消費者都能上手體驗,與此同時也會提出一些新的要求,如高併發需求、終端算力、內容創作效果等。

那麼問題來了——

靈境是如何實現的?

這背後其實是一整套技術棧的全方位升級,包括硬體、系統、雲服務、演算法等。

首先來看硬體方面,這一次配合靈境的釋出,Rokid將AR眼鏡從傳統“雙魚眼+RGB三攝方案”升級為“單攝RGB輕量化SLAM”。

單目方案的好處很直接:結構簡單、硬體設計複雜度降低、主機板面積小、成本功耗比大幅降低,使用者側能直接感受到佩戴舒適度和續航能力上的提升。

在落地應用上,據悉靈境搭載的硬體也是只有一個攝像頭的。

因為把相機數量壓縮到最後一個,單目方案可以帶來更低功耗更簡結構,更低成本等諸多優勢,舒適的佩戴和更普惠的價格,符合靈境的“讓AR更普惠”的需求。

但單目方案也確實有短板,比如它無法得到絕對的尺度資訊,所以需要透過初始化恢復尺度資訊,而初始化的好壞直接影響演算法最終的精度。單目計算絕對尺度準確性不夠高,尺度收斂也有不確定性,這些對單目SLAM演算法開發帶來很大的挑戰,會直接影響到AR體驗。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

不過Rokid表示,目前行業內已經出現了相應的解決方案。

演算法上,在IMU的輔助下,單目的靜態初始化和動態初始化已經有了很多方案,初始化完畢以後基本上獲得比較精確的絕對尺度先驗。再結合比如基於濾波的演算法,可以在後期使用過程中對各種SLAM引數持續最佳化,進一步提升演算法的定位精度,同時基於深度學習的技術在SLAM演算法上也有很多技術探索。

由此,也能感受到Rokid的理念是:AR產品不僅僅只是堆疊感測器,而是軟體、硬體、演算法和場景作為整體,給使用者提供更舒適的AR綜合體驗。

軟體方面的提升,主要體現在3D點雲和SLAM方面。

並利用端雲協同的方式平衡了算力、功耗和高併發幾個方面的要求。

Rokid應用平臺中心部門負責人Watson介紹說:

基於3D點雲的視覺定位技術和裝置端的SLAM技術(Simultaneous localization and mapping,同步定位和地圖構建),可以類比自動駕駛中的道路高精地圖和車輛空間感知。

在AR場景下,也有一些開發者拿點雲作全域性的粗定位,拿SLAM做區域性精定位,兩個松耦合在一起。

Rokid這次將這個松耦合,做了更深度的融合。實現了端上只做定位和跟蹤,雲上空間建圖。

這種端雲協同協作計算的方式,可以提升一些場景下的定位精度,如弱紋理、環境有變化的場景,同時也能降低移動端的計算功率。原理上主要利用了RTC(Real time communication,實時通訊)在弱網對抗/低時延傳輸和影片影像壓縮上具備的優勢。

緊耦合的實現,依靠了Rokid全新升級的底層作業系統YodaOS-Master

具體變化體現在XR系統、XR雲服務和XR硬體三個層面。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

系統全方位升級後,Rokid可以搭建一個更加完整閉環的OS生態,以此更好連線開發者和消費者。

深扒完靈境的技術棧後不難發現,Rokid此次釋出是有備而來。

最核心的目的十分明確:降低AR內容創作門檻,壯大AR內容創作隊伍。

僅需一部手機即可體驗,耗時縮短到10分鐘,這確實是每個人幾乎都能滿足的條件,還有機會感受到所謂“真正的AR”到底是什麼形態。想一想,確實能吸引一波好奇者了。

由此也讓人開始好奇,為什麼要在此刻正式推出靈境?又為什麼要主打降門檻?

答案還是要從市場需求、AR行業發展及行業玩家經驗驗證幾個維度看起。

為什麼要做靈境?

最直接的影響因素還是來自於市場需求

Rokid副總裁、數字文化事業部負責人陳希表示,目前在文博文旅領域,對AR內容的需求非常突出,她給出了一個很驚人的資料來說明:

今年春節期間在文博場景體驗過Rokid AR的人數達到了4萬人

全國範圍內,如廣東省博物館、西安博物院、陝西自然博物館、蘇州博物館、良渚古城遺址公園等都陸續推出了AR導覽。

AR會在文博領域快速滲透的原因也很好理解,它能極大程度上豐富3D空間內的內容豐富度,並將文化知識以更加直觀、豐富、多樣的方式呈現到參觀者面前。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

而全國登記在冊的博物館數量就超過了6000家,隨著越來越多博物館提出需求,過去長鏈條的內容生產模式,難以快速響應。更何況這種以方案落地的模式,對人力物力成本的要求也很高。

因此,市場上亟需一個能高效易上手的生產力工具,能夠加速AR內容的創作,並降低成本。

另一邊,在工業方面類似的情況。

Rokid副總裁、產品技術中心負責人江濤介紹說,和文博場景有些相似,在工業生產一線上,也希望能夠在3D空間裡儘可能展示更多資訊。

這樣一線人員進行操作時,不用再專門走到一些儀表前檢視資料、核對情況,而是直接在工作現場就能看到所需資訊。

用江濤的話來說,從工業元宇宙的大概念出發,完成數字化轉型是做完了工業元宇宙的基建,將整合分析好的資料再重新反饋到現場,才真正走完了一整個閉環。

由於工業場景天然對降本增效提出更高要求,因此工業場景內AR的需求和市場可能會更大。

在很多工廠中,許多條真實的AR生產線已經被搭起來了:

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

此外,在教育領域,用上AR輔助教學也逐漸普及開來。

比如基於AR的安防教育,就不再只是書面、影片形式的灌輸了。小朋友們可以在模擬的火災場景裡學習如何逃生,記憶點會更加深刻,教育的效果自然也會更好。

而在這一場景內,學校老師往往是需要基於課程要求,持續更新AR內容的,一個基於手機就能用的低門檻內容生產工具,也確實符合真實需求。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

如上是市場方面帶來的直接需求。

更深層的影響因素,是AR現階段進化的要求。

一直以來,AR原生內容生態匱乏都常常被人吐槽,成為很多人不願意體驗AR裝置的一大原因。

和手機借生態?雖然內容豐富度短期上來了,但是展現的內容更多侷限在2D層面,真正的AR內容沒有被展現出來,還會讓人覺得AR眼鏡的終途就是手機配件?

由此,對於AR行業而言,幾乎所有人都意識到豐富內容生態是當下發展的重中之重。如蘋果在最早期探索AR時,也是率先發布了AR Kit開發平臺,把APP Store的打法繼續用在AR領域。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

畢竟只有內容豐富了,使用者才會被吸引過來,AR才有機會向前更進一步。那麼眼下的問題就變成了如何豐富AR原生內容。

僅憑AR廠商一己之力顯然效率不夠高,過去多年來探索出的AR互動場景還是非常有限。

號召更多開發者和創作者加入,正在逐漸成為行業內的共識,並且要把使用門檻和成本都打下來。

由此也就不難理解,作為行業內的資深玩家,Rokid選擇推出靈境這樣一個AR空間引擎。

但,為什麼是現在?

Rokid給出的回答是:自身在文博領域的經驗積累,驗證了市場對於AR的真實需求。

陳希回憶起最初和良渚古城遺址公園的合作時,各種場景還歷歷在目。

她記得當Rokid和園方提出,可以利用AR來對文物遺址進行修復時,園方立刻表示很感興趣。整個專案從最初提出到落地,前後經歷了3個月左右,最終在2020年國慶期間和大眾見面。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

最開始,Rokid一天提供了200副AR眼鏡的租賃,結果一個小時左右裝置就全被租出了。並且對AR好奇的人群,很多都是老人和小孩,這也出乎了Rokid的預料。

而有了真實場景的應用,其實能從第一線積累到非常寶貴的開發經驗。比如在設想里人們都會按照導覽順序參觀,但實際不是如此,Rokid就要保證亂序參觀也不會影響AR效果的展現。以及針對博物館室內燈光條件不好的情況,技術團隊也專門做了最佳化……最終這些最佳化和迭代,一併體現在了靈境的設計裡。

陳希也感慨說,不可否認當下還不是所有人都願意花上千元去購買一個專門的裝置來體驗AR,但是如果只花50塊錢透過租借,是很多人都願意嘗試的

那麼等到未來,應用場景足夠多時,價值就會慢慢體現,那個時候可能就到了AR真正走向C端的時刻。

由此也就不難理解,為什麼靈境會在此刻推出。

因為它能透過一個小槓桿,撬動龐大的開發者和創作者群體,發動數以百計、數以千計的人,共同探索廣闊的AR內容和應用場景。

並以此助推AR更快速走向大眾群體,成長為真正意義上的下一代移動計算終端裝置。

靈境會帶來什麼?

作為一款AR原生內容生產力工具,靈境的出現向行業內外傳遞了一個訊號:

是時候發展AR的內容生態了。

並且不再是和手機或其他終端借生態,而是從AR自身出發,能夠展示“什麼叫真正的AR”。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

一方面,參考目前移動計算終端的絕對霸主智慧手機,它正是在出現了爆款內容應用後,才快速吸引了大量使用者。

另一方面,AR原生內容和手機等終端內容有本質性區別,它需要是3D的

如果一直和手機借生態,那最終大眾對於AR的理解,可能只是手機的虛擬大屏,這會限制整個技術和產業發展的想象力,也會影響AR的獨立發展。

由此,開發AR原生內容是當下必須做的事。

儘管目前在算力、硬體等條件的制約下,AR內容還無法一下達到大家的最終期待。但誠如Windows最初,不也是隻有掃雷、蜘蛛紙牌這樣的簡單應用嗎?

我們需要給予技術足夠的耐心,等待變化發生。

更何況,端雲一體的思路,確實為解決當下算力問題提供了新解法。

如果再從AR行業外的角度來看,靈境的出現也為廣大開發者和創作者提供了一個新的機遇。畢竟每一代移動計算終端的崛起,都會伴隨一大批非常優秀的內容應用和軟體湧現。

總之,在AR向前推進的這條路上。還會不斷有新的行業角色、技術力量加入進來,共同推動AR駛向我們的終極想象:真正意義上面向大眾的擴增實境。

你覺得呢?

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70027828/viewspace-2941456/,如需轉載,請註明出處,否則將追究法律責任。

相關文章