淺談 WebRTC 的 Audio 在進入 Encoder 之前的處理流程

VideoCloudTech發表於2020-12-25

原文網址 : http://blog.itpub.net/69985788/viewspace-2745383/

在 WebRTC 中，Audio 資料在被送入編碼器之前，有 2 大部分需要特別關注，一是資料採集，二是 Audio Processing。
file

作者：方來，技術專家，從事 voip 應用開發。

資料採集

資料採集主要由 Audio Device 模組進行處理，而且是平臺和配置相關。例如：

Mac 電腦，使用的是 CoreAudio API，一般情況下使用預設內建的音效卡引數 fs=48kHz，stero。
Windows 電腦，WebRTC 中用的是 WASAPI。根據音效卡引數不同，取樣率等引數可選的比較多，例如有的電腦 builtInAEC 開啟後，fs=16kHz，Mono，如果把音效卡的 Audio Enhancement 關閉，則輸出 fs=48kHz，stero。
Android 一般使用 java 層的 AudioRecord 框架。
iOS 一般使用 AudioUnit 框架。

另外，資料採集部分，還涉及到 USB 耳機，3.5mm 耳機，藍芽耳機等外設，這些裝置對音訊鏈路上後續的 Audio Processing 也是有影響的，比如增加了 Audio 採集的delay，有 Speech Enhancement 處理的耳機會修改音訊頻譜，有的耳機外設使用不當可能會導致音訊鏈路沒有聲音。

Audio Processing

Audio Processing 主要包括 AEC，AGC，NS 等等：

AEC----Acoustic Echo Cancellation，即迴音消除。
AGC----Automatic Gain Control，即自動增益，用來調整輸入訊號的音量大小。
NS----Noise Suppression，即噪音抑制。

從 Audio Devices 輸出的資料依次經過 AEC，NS，AGC 等音訊處理模組。

1.AEC

AEC 演算法選擇

在 WebRTC 中，AEC 有 4 個可選的演算法：

builtInAEC，一般情況下 Windows，Android 系統，builtInAEC 預設會開啟。
AECM，移動端的迴音消除演算法，適用於 Android和 iOS。
AEC 演算法，適用於 Windows/Mac Desktop 的迴音消除演算法。當然 AEC 也可以用在移動端，某些情況下，回聲洩露的效能比 AECM 好。不過最新的 WebRTC 已經把老的 AEC 的 code 移除了。
AEC3 演算法，Google 對老的 AEC 演算法的改版，目前 AEC3 已經全面替代老的 AEC 演算法。

一般情況下這 4 種 AEC 演算法只能選擇一種，否則會做多次 AEC，對聲音的損傷也會增加。在不得已的情況下，可能會用到 2 個 AEC，例如 Windows 電腦，buildInAEC 關不掉且效果差的情況下，就必須開啟 AEC3，這時是用到 2 個 AEC。

aec_dump

在一次通話中，使用 StartAecDump 開啟 aec_dump 功能，aec_dump 將錄製 3 個檔案，一個是未進入 Audio Processing 模組的 input.wav，一個是 Speaker Render 的輸出檔案 reverse.wav，一個是經過 Audio Processing 處理過的 ref_out.wav。

正常情況下，input.wav - reverse.wav = ref_out.wav。

通過這 3 個檔案可以分析迴音消除演算法是否有問題。

2.AGC

WebRTC 的 AGC 有 2 種演算法：

Legacy AGC
AGC2

下面簡單展示一下 Legacy AGC 的效能。

原始語音

AGC 後的語音，Legacy AGC 本身沒有降噪功能，噪音和語音同時放大的。

3.NS

目前 WebRTC 的 Noise Suppression 模組，能夠過濾掉比較平穩的背景噪音，例如 white nosise，空調聲等。但是 NS 模組對音量非常大的背景噪音，還有 babble noise 都是失效的，這也是我們客戶端在 Microphone 功放的情況下的“嘈雜不清”的因素之一（當然導致嘈雜還有其他的原因，例如 AEC 的效能等等)。

file
夾雜 white noise 的錄音

file
white noise 被過濾掉

4.其他增強演算法

High Pass Filter，用來過濾低頻噪音，比如我們可以把 100Hz 甚至 200Hz 以下的低頻噪音過濾掉。
Typing Detector，可以過濾掉鍵盤打字的聲音。
Residual Echo Detector，殘留迴音探測。

優化點

採集（當然也包括播放）容易出現沒有聲音問題，所以必須對採集（音效卡驅動）端進行音效卡適配優化。
AEC 區分平臺：
A. Windows 平臺，一般 Windows 的音效卡皮膚裡面有一個“Audio Enhancement”，這個裡面有的含有 builtInAEC，預設是開啟的，通過 Windows API 關閉這個 Audio Enhancement 的幾乎不可行。有的 builtInAEC 效果比較差，這時 AEC3 必須開啟。通常情況下，builtInAEC 和 AEC3 同時開啟，以便最大程度減少回聲。
B. Mac 電腦，預設沒有 buildInAEC，通常就直接使用 AEC3。
在 AEC 演算法中增加“near talk”，“far talk”，“double talk”， “no talk”狀態，結合這幾種狀態，採取不同的操作，例如在只有 far talk 的時候，不做 AGC，能夠起到減少近端噪音的作用。

「視訊雲技術」你最值得關注的音視訊技術公眾號，每週推送來自阿里雲一線的實踐技術文章，在這裡與音視訊領域一流工程師交流切磋。

淺談前端錯誤處理
2018-11-14
前端
二、淺談 JSON 處理技巧
2024-06-22
JSON
git進入vim模式的處理
2024-04-24
Git模式
淺談H5音訊處理（更多談談錄音方向的內容）
2018-08-19
H5音訊
淺談zip格式處理邏輯漏洞
2020-08-19
淺析Node是如何進行錯誤處理的
2020-04-03
Golang 學習——error 錯誤處理淺談
2020-05-10
GolangError
淺談Android打包流程
2019-05-24
Android
淺入深出Vue：事件處理
2019-07-03
Vue事件
上手 WebRTC DTLS 遇到很多 BUG？淺談 DTLS Fragment
2021-05-26
WebTLSFragment
談談RxSwift中的錯誤處理
2019-03-04
Swift
【SQL】Oracle SQL處理的流程
2021-09-07
SQLOracle
【前端打包部署】談一談我在SPA專案打包=>部署的處理
2019-01-23
前端
C#基礎之前處理器，異常處理
2024-12-01
C#
WebRTC ICE 狀態與提名處理
2021-01-13
Web
淺談混合應用的演進
2018-06-08
淺談網站效能之前端效能優化
2019-02-16
網站前端優化
[轉發]淺談我在職場中與人相處的技巧
2019-05-28
【前端打包部署】談一談我在SPA專案打包=>部署的處理（上）
2019-01-23
前端
大資料處理的基本流程
2019-06-11
大資料
淺談GPU 及 “App渲染流程”
2020-03-30
GPUAPP
webrtc PeerConnectionFactory 的初始化流程分析
2020-12-25
Web
python socketserver處理客戶端的流程
2021-09-11
PythonServer客戶端
深入理解nodejs的HTTP處理流程
2021-02-03
NodeJSHTTP
如何優雅的在Golang中進行錯誤處理
2019-07-26
Golang
淺談 istio 配置下發（下篇，istio 處理來自 k8s 的配置）
2024-10-27
K8S
WebRTC 之ICE淺談 | 內有乾貨免費下載
2019-03-28
Web
淺談儲存器的進化歷程
2018-06-27
淺析機器視覺在醫療影像處理中的應用
2020-12-19
視覺
iOS 淺談GPU及“App渲染流程”
2020-03-29
iOSGPUAPP
效能測試工作流程淺談
2022-05-12
非同步流程處理
2019-03-01
非同步
淺談使用VPS建網站的幾大好處
2018-09-12
網站
淺談Linux的五大便捷之處
2022-09-08
Linux
重構Vue專案的通用處理流程
2019-02-11
Vue
python異常處理的流程是什麼？
2021-09-11
Python
Spark Task 的執行流程④ - task 結果的處理
2021-09-09
Spark
Acitivity在singleTask載入模式下的資料傳遞處理
2018-08-21
模式