AR實踐：基於ARKit實現電影中的全息視訊會議

聲網Agora發表於2018-03-14

原文網址 : https://flycode.co/archives/48826

作者簡介：龔宇華，聲網Agora.io 首席iOS研發工程師，負責iOS端移動應用產品設計和技術架構。

去年中旬，蘋果在 WWDC2017 推出了 ARKit。通過它，開發者可以更加快速地在 iOS 平臺開發 AR 應用，利用鏡頭將虛擬照進現實。最近蘋果還增強了 iOS 系統對 ARKit的支援，並將加大對 AR 應用的推廣力度。

在本篇中，我們將會把 ARKit 融入視訊會議場景中。本文將會介紹視訊中兩種場景的實現：

將 ARKit 融入直播中
將直播連麥的對方畫面渲染到 AR 場景中

我們將一起在直播場景中利用 ARKit 實現平面檢測，還將應用到 Agora SDK 2.1 的新功能“自定義視訊源與渲染器”。如果你在此之前還未了解過 ARKit 的基本類及其原理，可以先閱讀《上篇：ARKit 基礎知識》。

不多說，先上效果圖。儘管距離電影中看到的全息視訊會議效果還有距離，但大家可以試著對後期效果優化無限接近電影場景（文末有原始碼）。我們在這裡僅分享利用 AR 在視訊會議中的實現技巧。

準備工作1：基礎的AR功能

我們首先使用ARKit建立一個簡單的識別平面的應用做為開發基礎。

在Xcode中使用 Augmented Reality App 模版建立一個新專案，其中 Content Technology 選擇 SceneKit.

啟動平面檢測

在 ViewController 中設定 ARConfiguration 為平面檢測。

override func viewDidLoad() {
	super.viewDidLoad()
    
	sceneView.delegate = self
	sceneView.session.delegate = self

	sceneView.showsStatistics = true
}

override func viewWillAppear(_ animated: Bool) {
	super.viewWillAppear(animated)
	
	let configuration = ARWorldTrackingConfiguration()
	configuration.planeDetection = .horizontal
	sceneView.session.run(configuration)
}
複製程式碼

顯示識別出的平面

實現 ARSCNViewDelegate 的回撥方法 renderer:didAddNode:forAnchor: ，在識別出的平面上新增一個紅色的面。

func renderer(_ renderer: SCNSceneRenderer, didAdd node: SCNNode, for anchor: ARAnchor) {
	guard let planeAnchor = anchor as? ARPlaneAnchor else {
	    return
	}
	    
	// 建立紅色平面模型
	let plane = SCNBox(width: CGFloat(planeAnchor.extent.x),
	                   height: CGFloat(planeAnchor.extent.y),
	                   length: CGFloat(planeAnchor.extent.z),
	                   chamferRadius: 0)
	plane.firstMaterial?.diffuse.contents = UIColor.red
	    
	// 用模型生成 Node 物件並新增到識別出的平面上
	let planeNode = SCNNode(geometry: plane)
	node.addChildNode(planeNode)
	    
	// 漸隱消失
	planeNode.runAction(SCNAction.fadeOut(duration: 1))
}
複製程式碼

這樣就完成了一個最簡單的AR應用，當識別出環境中的平面時，會在上面新增一個紅色的矩形，並漸隱消失。

準備工作2：基礎的直播功能

接下來我們需要使用 Agora SDK 在應用中新增直播功能。

首先在官網下載最新的 SDK 包並新增到我們的 Demo 中。接著在 ViewController 中新增 AgoraRtcEngineKit 的例項，並且進行直播相關的設定。

let agoraKit: AgoraRtcEngineKit = {
	let engine = AgoraRtcEngineKit.sharedEngine(withAppId: <#Your AppId#>, delegate: nil)
	engine.setChannelProfile(.liveBroadcasting)
	engine.setClientRole(.broadcaster)
	engine.enableVideo()
	return engine
}()
複製程式碼

最後在 viewDidLoad 方法中加入頻道。

agoraKit.delegate = self
agoraKit.joinChannel(byToken: nil, channelId: "agoraar", info: nil, uid: 0, joinSuccess: nil)
複製程式碼

至此，所有的準備工作都已經完成，我們有了一個可以識別平面的AR應用，同時又可以進行音視訊通話，接下來要做的就是把這兩個功能結合起來。

將 ARKit 的畫面直播出去

因為 ARKit 已經佔用了裝置攝像頭，我們無法自己啟動 AVCaptureSession 進行採集。幸好 ARFrame 的 capturedImage 介面提供了攝像頭採集到的資料可以供我們直接使用。

新增自定義視訊源

為了傳送視訊資料，我們需要構造一個實現了 AgoraVideoSourceProtocol 協議的類 ARVideoSource 。其中 bufferType 返回 AgoraVideoBufferTypePixelBuffer 型別。

class ARVideoSource: NSObject, AgoraVideoSourceProtocol {
	var consumer: AgoraVideoFrameConsumer?
	    
	func shouldInitialize() -> Bool { return true }
	    
	func shouldStart() { }
	    
	func shouldStop() { }
	    
	func shouldDispose() { }
	    
	func bufferType() -> AgoraVideoBufferType {
	    return .pixelBuffer
	}
}
複製程式碼

給這個 ARVideoSource 類新增一個傳送視訊幀的方法：

func sendBuffer(_ buffer: CVPixelBuffer, timestamp: TimeInterval) {
	let time = CMTime(seconds: timestamp, preferredTimescale: 10000)
	consumer?.consumePixelBuffer(buffer, withTimestamp: time, rotation: .rotationNone)
}
複製程式碼

接著在 ViewController 中例項化一個 ARVideoSource, 並在 viewDidLoad 中通過 setVideoSource 介面設定給 Agora SDK

let videoSource = ARVideoSource()

override func viewDidLoad() {
	……
	agoraKit.setVideoSource(videoSource)
	……
}
複製程式碼

這樣在我們需要的時候，只要呼叫 videoSource 的 sendBuffer:timestamp: 方法，就可以把視訊幀傳給 Agora SDK 了。

傳送攝像頭資料

我們可以通過 ARSession 的回撥拿到每一幀 ARFrame ，從中讀出攝像頭的資料，並使用 videoSource 傳送出去。

在 viewDidLoad 中設定 ARSession 的回撥

sceneView.session.delegate = self
複製程式碼

實現 ARSessionDelegate 回撥，讀取每一幀的攝像頭資料，並傳給 Agora SDK 。

extension ViewController: ARSessionDelegate {
	func session(_ session: ARSession, didUpdate frame: ARFrame) {
	    videoSource.sendBuffer(frame.capturedImage, timestamp: frame.timestamp)
	}
}
複製程式碼

傳送 ARSCNView 資料

ARFrame 的 capturedImage 是攝像頭採集到的原始資料，如果我們想傳送的是已經新增好虛擬物體的畫面，那就只能自己獲取 ARSCNView 的資料了。這裡提供一種簡單的思路：設定一個定時器，定時去將 SCNView 轉為 UIImage，接著轉換為CVPixelBuffer，然後提供給 videoSource。下面只提供了示例邏輯程式碼。

func startCaptureView() {
    // 0.1秒間隔的定時器
    timer.schedule(deadline: .now(), repeating: .milliseconds(100))
    
    timer.setEventHandler { [unowned self] in
        // 將 sceneView 資料變成 UIImage
        let sceneImage: UIImage = self.image(ofView: self.sceneView)
        
        // 轉化為 CVPixelBuffer 後提供給 Agora SDK
        self.videoSourceQueue.async { [unowned self] in
            let buffer: CVPixelBuffer = self.pixelBuffer(ofImage: sceneImage)
            self.videoSource.sendBuffer(buffer, timestamp: Double(mach_absolute_time()))
        }
    }
    
    timer.resume()
}
複製程式碼

將直播連麥的對方畫面渲染到 AR 場景中

我們可以先在 AR 場景中新增一個 SCNNode, 接著通過 Metal 把連麥對方的視訊資料渲染到 SCNNode 上。這樣即可實現在 AR 環境中顯示連麥端的畫面。

新增虛擬螢幕

首先我們需要建立用來渲染遠端視訊的虛擬螢幕，並通過使用者的點選新增到 AR 場景中。

在 Storyboard 中給 ARSCNView 新增一個 UITapGestureRecognizer，當使用者點選螢幕後，通過 ARSCNView 的 hitTest 方法得到在平面上的位置，並把一個虛擬螢幕放在點選的位置上。

@IBAction func doSceneViewTapped(_ recognizer: UITapGestureRecognizer) {
	let location = recognizer.location(in: sceneView)
	
	guard let result = sceneView.hitTest(location, types: .existingPlane).first else {
		return
	}
	
	let scene = SCNScene(named: "art.scnassets/displayer.scn")!
	let rootNode = scene.rootNode
	rootNode.simdTransform = result.worldTransform
	sceneView.scene.rootNode.addChildNode(rootNode)
	    
	let displayer = rootNode.childNode(withName: "displayer", recursively: false)!
	let screen = displayer.childNode(withName: "screen", recursively: false)!
	    
	unusedScreenNodes.append(screen)
}
複製程式碼

使用者通過點選可以新增多個螢幕，並被存在 unusedScreenNodes 陣列中待用。

新增自定義視訊渲染器

為了從 Agora SDK 獲取到遠端的視訊資料，我們需要構造一個實現了 AgoraVideoSinkProtocol 協議的型別 ARVideoRenderer。

class ARVideoRenderer: NSObject {
	var renderNode: SCNNode?
}

extension ARVideoRenderer: AgoraVideoSinkProtocol {
	func shouldInitialize() -> Bool { return true }
	    
	func shouldStart() { }
	    
	func shouldStop() { }
	    
	func shouldDispose() { }
	    
	func bufferType() -> AgoraVideoBufferType {
	    return .rawData
	}
	
	func pixelFormat() -> AgoraVideoPixelFormat {
		return .I420
	}
	
	func renderRawData(_ rawData: UnsafeMutableRawPointer, size: CGSize, rotation: AgoraVideoRotation) {
		……
	}
}
複製程式碼

通過 renderRawData:size:rotation: 方法可以拿到遠端的視訊資料，然後就可以使用 Metal 渲染到 SCNNode 上。具體的 Metal 渲染程式碼可以參考文末的完整版 Demo.

將自定義渲染器設定給 Agora SDK

通過實現 AgoraRtcEngineDelegate 協議的 rtcEngine:didJoinedOfUid:elapsed: 回撥，可以得到連麥者加入頻道的事件。在回撥中建立 ARVideoRenderer 的例項，把前面使用者通過點選螢幕建立的虛擬螢幕 Node 設定給 ARVideoRenderer，最後通過 setRemoteVideoRenderer:forUserId: 介面把自定義渲染器設定給 Agora SDK。

func rtcEngine(_ engine: AgoraRtcEngineKit, didJoinedOfUid uid: UInt, elapsed: Int) {
	guard !unusedScreenNodes.isEmpty else {
	    return
	}
	    
	let screenNode = unusedScreenNodes.removeFirst()
	let renderer = ARVideoRenderer()
	renderer.renderNode = screenNode
	    
	agoraKit.setRemoteVideoRenderer(renderer, forUserId: uid)
}
複製程式碼

這樣當連麥端加入頻道後，就會在虛擬螢幕上顯示對方的視訊，得到一個虛擬會議室的效果，正如我們在文章開頭所看到的。

總結

用最新 2.1 版 Agora SDK 的自定義視訊源和自定義視訊渲染器介面，可以輕鬆地把 AR 和直播場景結合起來。Demo 基於 Agora SDK 以及 SD-RTN™ 執行，可以支援17人的同時視訊連麥。可以預見，AR 技術會為實時視訊連麥帶來全新的體驗。

完整 Demo 請見聲網Agora 開發者社群Github

基於 Electron 做視訊會議的兩種實現方式
2018-07-18
視訊會議的實現方式有哪些？
2021-07-16
基於ARKit的iOS無限屏實現，還原錘子釋出會效果
2019-03-03
iOS
實現基於內容的電影推薦系統—程式碼實現
2024-04-07
基於 IJKPlayer-concat 協議的視訊無縫拼接技術實現
2018-03-28
協議
如何在 Web 實現支援虛擬背景的視訊會議
2023-04-05
Web
基於Flutter實現的仿開眼視訊App
2019-08-23
FlutterAPP
如何實現在服務端錄製視訊會議？
2024-10-28
服務端
視訊採集：iOS平臺基於AVCaptureDevice的實現
2018-12-24
iOSAPTdev
STOMP協議——基於Websocket實現
2019-04-27
協議Web
如何基於Django中的WebSockets和非同步檢視來實現實時通訊功能
2024-04-22
DjangoWeb非同步
揭祕2022冬奧黑科技，阿里雲視訊雲「Cloud ME」如何實現全息會面？
2022-02-26
阿里Cloud
Golang《基於 MIME 協議的郵件資訊解析》部分實現
2022-01-12
Golang協議
Python 基於 TCP 傳輸協議的網路通訊實現
2022-02-22
PythonTCP協議
基於 WebRTC 和 WebVR 實現 VR 視訊通話
2018-09-12
WebVR
基於環信實現實時視訊語音通話功能
2018-07-10
雲上視訊業務基於邊緣容器的技術實踐
2021-01-12
基於 Agora SDK 實現 iOS 端的多人視訊互動
2022-05-14
GoiOS
如何基於 Agora Android SDK 在應用中實現視訊通話？
2022-02-28
GoAndroid
基於Netty實現自定義訊息通訊協議（協議設計及解析應用實戰）
2021-11-15
Netty協議
SpringBoot 實戰 (十六) | 整合 WebSocket 基於 STOMP 協議實現廣播訊息
2019-03-04
Spring BootWeb協議
基於Elasticsearch實現搜尋建議
2018-07-27
Elasticsearch
基於聲網 Flutter SDK 實現多人視訊通話
2023-03-07
Flutter
基於vue2.0的weex實踐（前端視角）
2019-03-03
Vue前端
騰訊會議大規模使用Kubernetes的技術實踐
2020-09-27
[ARKit]9-3D/AR 中的 simd 型別
2018-06-21
3D型別
短視訊系統，實現介面陰影效果
2021-12-06
基於 Agora SDK 實現 Windows 端的多人視訊互動（基於3.6.2版本）
2022-05-19
GoWindows
史丹佛大學：研究發現女性受視訊會議影響更大
2021-04-14
基於github的CICD實踐
2021-07-19
Github
Java上機實踐四實驗二家中的電視
2020-10-07
Java
Python實踐：基於Matplotlib實現某產品全年銷量資料視覺化
2024-03-18
Python視覺化
Knative 實戰：基於 Kafka 實現訊息推送
2022-12-06
Kafka
藏書館App基於Rainbond實現雲原生DevOps的實踐
2021-11-01
APPAIdev
基於 Flink CDC 的現代資料棧實踐
2023-04-18
基於 Session 實現簡訊登入
2024-07-23
Session
golang中基於kevent的IO多路複用實踐
2024-06-02
Golang
基於OpenSSL的HTTPS通訊C++實現
2018-10-30
HTTPC++