AR屬不屬於人工智慧？看完本文你就懂了

技術小能手發表於2018-05-29

原文網址 : https://flycode.co/archives/189029

AR/VR常作為孿生兄弟被相提並論，被普遍認為為應用層新技術或者說是“智慧可穿戴裝置”，相比人工智慧相對的“演算法”標籤，顯得不夠有深度有內涵高大上，那AR和人工智慧之間到底是什麼關係?AR屬不屬於當下我們認知中的人工智慧?

2018年3月，上海市經濟和資訊化委員會公示了2018年第一批本市人工智慧創新發展專項擬支援專案。“一共有19家創新企業入圍，亮風臺作為AR公司也入圍此次支援專案”亮風臺工作人員告訴青亭網，這不是AR企業第一次被劃歸到人工智慧，但這種歸類方式也並不常見。據瞭解此專項由經信委與市財政局聯合開展，擬支援金額超過1億。

簡單梳理下AR的核心技術

AR(Augmented Reality)，是在現實世界中疊加虛擬資訊，也即給現實做“增強”，這種增強可以是來自視覺、聽覺乃至觸覺，主要的目的均是在感官上讓現實的世界和虛擬的世界融合在一起。

其中，對現實世界的認知主要體現在視覺上，這需要通過攝像機來幫助獲取資訊，以影像和視訊的形式反饋。通過視訊分析，實現對三維世界環境的感知理解，比如場景的3D結構，裡面有什麼物體，在空間中的什麼地方。而3D互動理解的目的是告知系統要“增強”的內容。

這其中有幾個關鍵點：

首先是3D環境理解。要理解看到的東西，主要依靠物體/場景的識別和定位技術。識別主要是用來觸發AR響應，而定位則是知道在什麼地方疊加AR內容。定位根據精度的不同也可以分為粗定位和細定位，粗定位就是給出一個大致的方位，比如區域和趨勢。而細定位可能需要精確到點，比如3D座標系下的XYZ座標、物體的角度。根據應用環境的不同，兩種維度的定位在AR中都有應用需求。在AR領域，常見的檢測和識別任務有人臉檢測、行人檢測、車輛檢測、手勢識別、生物識別、情感識別、自然場景識別等。

在感知現實3D世界並和虛擬內容融合後，需要以一定方式將這種虛實融合資訊呈現出來，這裡面需要的就是AR中的第二個關鍵技術：顯示技術，目前大多數的AR系統採用透視式頭盔顯示器，這其中又分為視訊透視和光學透視，其他的代表有光場技術(主要因Magic Leap而顯名)、全息投影(在科幻影視劇作品中常出現)等。

AR中的第三個關鍵技術在於人機互動，用以讓人和疊加後的虛擬資訊互動，AR追求在觸控按鍵之外自然的人機互動方式，比如語音、手勢、姿態、人臉等，用的比較多的語音跟手勢。

人工智慧和AR的技術關聯

在人工智慧領域有幾個概念常被提及，如深度學習(DL)、機器學習(ML)，在學術領域包括人工智慧(AI)在內幾大領域均有自己的研究界限，而在普遍意義上，我們常說的是泛意的人工智慧，涵括所有“讓機器像人一樣”的技術的應用方向。

從這張圖也可以簡單一窺三者的關係，深度學習是實現機器學習的一種技術方式，而機器學習是為了讓機器變得智慧，去達到人工智慧。可以說人工智慧是最終目標，而機器學習是為了實現這個目標延伸出的一個技術方向。在這其中，還有另一個重要概念為計算機視覺(CV)，主要來研究如何讓機器像人去“看”，是目前人工智慧概念中的一個重要分支，這也是因為人類獲取資訊最主要的方式之一就是視覺，目前計算機視覺已經在商業市場發揮價值，比如人臉識別;自動駕駛中讀取交通訊號和注意行人以導航;工業機器人用來檢測問題控制過程;三維環境的重建影像的處理等等。這些概念既有區分也有一定範圍的重疊。

其中，2006年開始，Hinton引發的深度學習熱潮開始蔓延，在一定程度上帶動了AI的又一次崛起，十年中，在包括語音識別、計算機視覺、自然語言處理在內的多個領域取得重大突破，並嚮應用領域延伸，正發展的如火如荼。

在AR的核心技術中，3D環境理解、3D互動理解和計算機視覺、深度學習都有著緊密的聯絡。3D環境理解在學術界裡主要對應的是計算機視覺領域，而近年來深度學習在計算機視覺中得到廣泛應用。互動方面，更趨自然的互動方式如手勢和語音在硬體終端的使用，得益於近幾年深度學習在相關領域的突破。也可以說，深度學習在AR中應用主要在視覺關鍵技術。

目前，AR最常見的形式是2D圖片掃描識別，如騰訊QQ-AR火炬活動、支付寶五福等多數AR營銷中所見，用手機掃描識別圖出現疊加的內容，但主要的研發方向還在3D物體識別和3D場景建模。

現實的物體是以3D形態存在的，有不同的角度和空間方位。所以一個自然的擴充套件就是從2D圖片識別到3D物體識別，識別物體的類別和姿態，深度學習可以用在這裡。以水果識別為例，識別不同類別的水果，並且給出定位區域，即整合了物體識別與檢測的功能。

3D場景建模，從識別3D物體擴大到更大更復雜的3D區域。比如識別場景裡面有哪些東西、它們的空間位置和相互關係等等，這就是3D場景建模，是AR比較核心的技術。這其中涉及目前熱門的SLAM(實時定位與地圖構建)。通過掃描某個場景，然後在上面疊加虛擬戰場等三維虛擬內容。如果只是基於普通2D影像識別就需要有特定的圖片，而在圖片不可見時會識別失敗。而在SLAM技術裡面，即使特定平面不存在，但是空間定位依然非常精確，就是因為有周圍3D環境的幫助。

這裡想探討下深度學習和SLAM技術的融合，計算機視覺大體上可以分兩個流派，一種基於學習的思路，例如特徵提取-特徵分析-分類，目前深度學習技術在這一路線上取得了主導性的地位。另外一種路線是基於幾何的視覺，從線條、邊緣、3D形狀推出物體的空間結構資訊，代表性的技術就是SFM/SLAM。基於學習的方向上深度學習基本上一統天下，但是在基於幾何視覺的領域，目前相關的進展還很少。從學術界而言，深度學習技術的研究進展可以說日新月異，而SLAM技術最新十年的進展相對較少。在國際視覺頂級會議ICCV 2015年度組織的SLAM技術專題討論會上，基於近年深度學習在視覺其它領域的快速發展，有與會專家曾提出SLAM中採用深度學習的可能性，但是目前還沒有成熟的思路。總體而言，短期內將深度學習和SLAM融合是一個值得研究的方向，長遠來看聯合語義和幾何資訊是一個非常有價值的趨勢。因此，SLAM+DL值得期待。

在互動方式方面，主要的包括語音識別和手勢識別，語音識別在目前已經取得了較大進展，國內如百度、科大訊飛、雲知聲等都是其中的佼佼者，AR公司更想突破的是手勢識別的成熟商業化。

“亮風臺展示過的一款基於深度學習的手勢識別系統，主要定義了上下左右、順時針、逆時針六種手勢”亮風臺工作人員告訴青亭網，先實現人手的檢測和定位，然後通過識別相應的手勢軌跡來實現對人手勢的識別。雖然人臉識別等其他人工智慧熱門領域在AR中也有使用，但不是AR公司重要的研發方向。

以上不難看出，AR的底層技術或者說基礎部分是計算機視覺以及關聯領域的融合，而當下熱門的深度學習和AR的結合，也是演算法工程師們的努力方向。這也是AR為計算機視覺與人機互動的交叉學科，AR的基礎是人工智慧和計算機視覺等說法的依據。

在去年今日頭條釋出的《人工智慧影響力報告》中也簡單統計了人工智慧科學家的分佈情況，這其中包括人臉識別、語音識別、機器人、AR、晶片等領域的公司與大型研發機構，高階研發人員的分佈也說明了AI領域的細分方向。

那AR究竟是不是人工智慧?

對AR從業者來說，理想的狀態是用更智慧的AR終端去取代智慧手機，所以對於使用者來說接觸使用AR首先受影響的是內容，其次是終端，AR產業鏈可以粗略劃分為技術提供商、智慧終端研發公司，以及AR內容提供商。在這其中，AR裝置提供商不可避免關注硬體技術，如底層的晶片、電池、光學鏡片等，以及硬體本身的效能優化，而內容提供商更傾向於在現有技術基礎上優化內容及表現。所以我們可以說AR技術提供商，或者說在底層演算法研發上有一定成績的AR公司是人工智慧公司。

對公司來說，特別是創企會把底層技術轉化為成熟的產品或服務，這可能是如無人機、AR智慧終端、機器人等，也可能是行業解決方案，以達到商業目的，並且這已經成為在沸騰聲音之後，媒體、企業以及大眾對AI企業的期待和要求。近期，人工智慧產業發展聯盟(AIIA)出版的圖書《人工智慧浪潮：科技改變生活的100個前沿AI應用》將對外發布，以及涵括了目前巨頭公司以及創企在商業化上的前沿成果，也直接反映了AI目前的主要商業化方向。

作為技術驅動的商業領域，無論是AR還是人工智慧的其他多數方向，技術距離完全成熟還有很長的路程要走，在整個產業鏈逐漸繁榮，關注商業化實現的同時，也需要有更多公司機構去不斷擴充技術邊界，建立核心競爭力，讓行業爆發更大的價值與潛力，如此，AI時代中國彎道超車當可期。

原文釋出時間為：2018-05-29

本文來自雲棲社群合作伙伴“企業網D1Net”，瞭解相關資訊可以關注“企業網D1Net”。

看完這場直播，SASE你就懂了
2021-11-15
HTML 屬性你都懂了嗎
2019-10-09
HTML
Sql Or NoSql，看完這一篇你就懂了
2019-08-12
SQL
什麼是“護網行動”？看完你就懂了
2021-04-01
雲原生技術是什麼？看完這篇文章你就懂了
2021-03-12
資料安全“掃盲篇”，看完就懂了
2023-05-04
Python屬不屬於組合語言？Python課程
2021-04-16
Python組合語言
為什麼嫁人就要嫁Linux運維工程師，看完你就懂了…
2018-09-11
Linux運維工程師
運維到底是幹什麼的？看完這篇你就懂了
2021-03-04
運維
列“ReservedWord”不屬於表 ReservedWords
2018-07-13
自定義ItemDecoration分割線的高度、顏色、偏移，看完這個你就懂了
2019-05-28
static_cast和dynamic_cast的區別,看完這篇你就懂了!
2020-12-26
AST
人工智慧屬於什麼專業？
2019-08-19
人工智慧
資料中臺還不清楚？看完Smartbi的這篇介紹你就懂了！
2022-01-21
影響視訊推薦量的因素有哪些？這篇看完你就懂了
2022-06-29
Linux零拷貝技術，看完這篇文章就懂了
2019-07-31
Linux
銀行IT系統必經的松耦合，看完就懂了
2020-08-24
執行緒池的基本原理，看完就懂了
2019-07-08
執行緒
資料分析報告沒有頭緒？看完Smartbi這篇介紹你就懂了！
2022-02-14
BI如何能夠在銀行行業站足立腳的？看完這篇你就懂了！
2021-12-24
行業
李飛飛專訪：AI不屬於某些小眾群體，AI屬於每個人
2019-03-18
AI
成為優秀的資料分析師，需要具備哪些技能？看完這篇你就懂了！
2022-01-11
0基礎如何開始學習Python?看完這篇就懂了!
2021-11-30
Python
如何 DIY 一臺屬於你自己的電腦
2018-04-12
? 領取屬於你的3D GitHub Story
2021-03-05
3DGithub
共享WiFi專案到底怎麼做比較好？看完這篇文章就懂了！
2023-04-03
WiFi
遊戲代理坑爹路：千億遊戲市場，一毛也不屬於你
2021-03-26
遊戲
大家公司測試不屬於研發體系嗎？
2024-04-20
90行JS程式碼構建屬於你的React
2019-11-14
JSReact
寫一個屬於你的前端腳手架工具
2019-03-03
前端
教育培訓系統是怎麼樣執行的?看完這個就懂了!
2023-03-02
如何給bug定優先順序和嚴重程度？看完這裡就懂了
2020-12-16
屬於 Unity 的 Flutter——UIWidgets
2019-03-31
UnityFlutterUI
以色列證券管理局稱比特幣不屬於證券
2018-04-01
比特幣
割裂？不，融合——回顧屬於不同玩家群體的2020
2021-01-19
前端工程師可以分成 4 種，你屬於哪一種？
2022-12-29
前端工程師
從零開始，打造屬於你的 ChatGPT 機器人！
2023-02-11
ChatGPT機器人
MySQL索引-B+樹（看完你就明白了）
2020-11-04
MySql索引

AR屬不屬於人工智慧？看完本文你就懂了

相關文章