[C#] NAudio 庫的各種常用使用方式: 播放錄製轉碼音訊視覺化

SlimeNull發表於2021-05-06

原文網址 : https://www.cnblogs.com/slimenull/p/14735111.html

C#音訊視覺化

概述

在 NAudio 中, 常用型別有 WaveIn, WaveOut, WaveStream, WaveFileWriter, WaveFileReader 以及介面: IWaveProvider

WaveIn 表示波形輸入, 例如麥克風輸入, 或者計算機正在播放的音訊流.
WaveOut 表示波形輸出, 用來播放波形音樂, 以繼承了 IWaveProvider 的型別作為播放源播放音樂
WaveStream 表示波形流, 它繼承了 IWaveProvider, 可以用來作為播放源.
WaveFileReader 繼承了 WaveStream, 用來讀取波形檔案
WaveFileWriter 繼承了 Stream, 用來寫入檔案, 常用於儲存音訊錄製的資料
IWaveProvider 上面已經提到, 是音訊播放的提供者

播放音訊

常用的播放音訊方式有兩種, 播放波形音樂, 以及播放 MP3 音樂

播放波形音樂:

// NAudio 中, 通過 WaveFileReader 來讀取波形資料, 在例項化時, 你可以指定檔名或者是輸入流, 這意味著你可以讀取記憶體流中的音訊資料
// 但是需要注意的是, 不可以讀取來自網路流的音訊, 因為網路流不可以進行 Seek 操作.

// 此處, 假設 ms 為一個 MemoryStream, 記憶體有音訊資料.
WaveFileReader reader = new WaveFileReader(ms);
WaveOut wout = new WaveOut();
wout.Init(reader);             // 通過 IWaveProvider 為音訊輸出初始化
wout.Play();                   // 至此, wout 將從指定的 reader 中提供的資料進行播放

播放 MP3 音樂:

// 播放 MP3 音樂其實與播放波形音樂沒有太大區別, 只不過將 WaveFileReader 換成了 Mp3FileReader 罷了
// 另外, 也可以使用通用的 Reader, MediaFoundationReader, 它既可以讀取波形音樂, 也可以讀取 MP3

// 此處, 假設 ms 為一個 MemoryStream, 記憶體有音訊資料.
Mp3FileReader reader = new Mp3FileReader(ms);
WaveOut wout = new WaveOut();
wout.Init(reader);
wout.Play();

音訊錄製

錄製麥克風輸入

// 藉助 WaveIn 類, 我們可以輕易的捕獲麥克風輸入, 在每一次錄製到資料時, 將資料寫入到檔案或其他流, 這就實現了儲存錄音
// 在儲存波形檔案時需要藉助 WaveFileWriter, 當然, 如果你想儲存為其他格式, 也可以使用其它的 Writer, 例如 CurWaveFileWriter 以及
// AiffFileWriter, 美中不足的是沒有直接寫入到 MP3 的 FileWriter
// 需要注意的是, 如果你是用的桌面程式, 那麼你可以直接使用 WaveIn, 其回撥基於 Windows 訊息, 所以無法在控制檯應用中使用 WaveIn
// 如果要在控制檯應用中實現錄音, 只需要使用 WaveInEvent, 它的回撥基於事件而不是 Windows 訊息, 所以可以通用

WaveIn cap = new WaveIn();   // cap, capture
WaveFileWriter writer = new WaveFileWriter();
cap.DataAvailable += (s, args) => writer.Write(args.Buffer, 0, args.BytesRecorded);    // 訂閱事件
cap.StartRecording();   // 開始錄製

// 結束錄製時:
cap.StopRecording();    // 停止錄製
writer.Close();         // 關閉 FileWriter, 儲存資料

// 另外, 除了使用 WaveIn, 你還可以使用 WasapiCapture, 它與 WaveIn 的使用方式是一致的, 可以用來錄製麥克風
// Wasapi 全稱 Windows Audio Session Application Programming Interface (Windows音訊會話應用程式設計介面)
// 具體 WaveIn, WaveInEvent, WasapiCapture 的效能, 筆者還沒有測試過, 但估計不會有太大差異.
// 提示: WasapiCapture 和 WasapiLoopbackCapture 位於 NAudio.Wave 名稱空間下

錄製音效卡輸出

// 錄製音效卡輸出, 也就是錄製計算機正在播放的聲音, 藉助 WasapiLoopbackCapture 即可簡單實現, 使用方式與 WasapiCapture 無異

WasapiLoopbackCapture cap = new WasapiLoopbackCapture();
WaveFileWriter writer = new WaveFileWriter();
cap.DataAvailable += (s, args) => writer.Write(args.Buffer, 0, args.BytesRecorded);
cap.StartRecording();

高階應用

獲取計算機實時播放音量大小

// 其實這個是基於剛剛的錄製音效卡輸出的, 錄製時的回撥中, Buffer, BytesRecorded 指定了此次錄製的資料 (緩衝區和資料長度)
// 而這些資料, 其實是計算機對聲音的取樣(Sample), 具體的取樣格式可以檢視 WasapiLoopbackCapture 例項的 WaveForamt
// 波形格式中的 Encoding 與 BitsPerSample 是我們所需要的. 一般預設的 Encoding 是 IeeeFloat, 也就是每一個取樣都是
// 一個浮點數, 而 BitsPerSample 也就是 32 了. 通過 BitConverter.ToSingle() 我們可以從緩衝區中取得浮點數
// 遍歷, 每 32 位一個浮點數, 最終取最大值, 這就是我們所需要的音量了

float volume;
WasapiLoopbackCapture cap = new WasapiLoopbackCapture();
cap.DataAvailable += (s, args) => volume = Enumerable
                                     	       .Range(0, args.BytesRecorded / 4)                         // 每一個取樣的位置
                                     	       .Select(i => BitConverter.ToSingle(args.Buffer, i * 4))   // 獲取每一個取樣
                                     	       .Aggregate((v1, v2) => v1 > v2 ? v1 : v2);                // 找到值最大的取樣

實現音樂視覺化

// 既然我們已經知道了, 那些資料都是一個個的取樣, 自然也可以通過它們來繪製頻譜, 只需要進行快速傅立葉變換即可
// 而且有意思的是, NAudio 也為我們準備好了快速傅立葉變換的方法, 位於 NAudio.Dsp 名稱空間下
// 提示: 進行傅立葉變換所需要的複數(Complex)類也位於 NAudio.Dsp 名稱空間, 它有兩個欄位, X(實部) 與 Y(虛部)
// 下面給出在 IeeeFloat 格式下的音樂視覺化的簡單示例:
WasapiLoopbackCapture cap = new WasapiLoopbackCapture();
cap.DataAvailable += (s, args) =>
{
    float[] samples = Enumerable
                          .Range(0, args.BytesRecorded / 4)
                          .Select(i => BitConverter.ToSingle(args.Buffer, i * 4))
                          .ToArray();   // 獲取取樣
    
    int log = (int)Math.Ceiling(Math.Log(samples.Length, 2));
    float[] filledSamples = new float[(int)Math.Pow(2, log)];
    Array.Copy(samples, filledSamples, samples.Length);   // 填充資料
    
    int sampleRate = (s as WasapiLoopbackCapture).WaveFormat.SampleRate;    // 獲取取樣率
    Complex[] complexSrc = filledSamples.Select((v, i) =>
    {
        double deg = i / (double)sampleRate * Math.PI * 2;                  // 獲取當前取樣率在圓上對應的角度 (弧度制)
        return new Complex()
        {
            X = (float)(Math.Cos(deg) * v),
            Y = (float)(Math.Sin(deg) * v)
        };
    }).ToArray();                                         // 將取樣轉換為對應的複數 (纏繞到圓)
    
    FastFourierTransform.FFT(false, log, complexSrc);     // 進行傅立葉變換
    double[] result = complexSrc.Select(v => Math.Sqrt(v.X * v.X + v.Y * v.Y)).ToArray();    // 取得結果
};

音訊格式轉換

// 對於 Wave, CueWave, Aiff, 這些格式都有其對應的 FileWriter, 我們可以直接呼叫其 Writer 的 Create***File 來
// 從 IWaveProvider 建立對應格式的檔案. 對於 MP3 這類沒有 FileWriter 的格式, 可以呼叫 MediaFoundationEncoder

// 例如一個檔案, "./Disconnected.mp3", 我們要將它轉換為 wav 格式, 只需要使用下面的程式碼, CurWave 與 Aiff 同理
using (Mp3FileReader reader = new Mp3FileReader("./Disconnected.mp3"))
	WaveFileWriter.CreateWaveFile("./Disconnected.wav", reader);

// 從 IWaveProvider 建立 MP3 檔案, 假如一個 WaveFileReader 為 src
MediaFoundationEncoder.EncodeToMp3(src, "./NewMp3.mp3");

提示

對於剛剛所說的音訊錄製, 取樣的格式有一點需要注意, 將資料轉換為一個 float 陣列後, 其中還需要區分音訊通道, 例如一般音樂是雙通道, WaveFormat 的 Channel 為 2, 那麼在 float 陣列中, 每兩個取樣為一組, 一組取樣中每一個取樣都是一個通道在當前時間內的取樣.

以雙通道距離, 下圖中, 取樣資料中每一個圓圈都表示一個 float 值, 那麼每兩個取樣時間點相同, 而各個通道的取樣就是每一組中每一個取樣

所以對於我們剛剛進行的音樂視覺化, 嚴格意義上來講, 還需要區分通道

示例

本文提到的部分內容在 github.com/SlimeNull/AudioTest 倉庫中有示例, 例如音訊視覺化, 音訊錄製, 以及其他零星的示例

如有錯誤, 還請指出

[C#] 使用 NAudio 實現音訊視覺化
2021-05-09
C#音訊視覺化
iOS開發系列--音訊播放、錄音、視訊播放、拍照、視訊錄製(轉)
2020-04-04
iOS音訊
音訊錄製及視覺化處理
2024-07-11
音訊視覺化
AVFoundation 文字轉語音和音訊錄製播放
2019-04-19
音訊
Camera2錄製視訊(一)：音訊的錄製及編碼
2019-06-26
音訊
Android 音視訊錄製硬編碼實現
2018-09-18
Android
Android音訊視覺化操作
2021-03-28
Android音訊視覺化
音視訊入門系列之繪製圖片三種方式
2018-08-28
音訊開發之錄製播放pcm檔案
2019-01-18
音訊
ffmpeg命令錄製windows音視訊
2018-03-20
Windows
FFmpeg開發筆記（十八）FFmpeg相容各種音訊格式的播放
2024-05-04
筆記音訊
Python中2種常用資料視覺化庫：Bokeh和Altair
2024-04-17
Python視覺化AI
Android 音視訊開發 - 使用AudioTrack播放音訊
2019-03-28
Android音訊
【秒懂音視訊開發】08_音訊錄製
2021-03-17
音訊
音視訊入門之音訊採集、編碼、播放
2018-12-28
音訊
重構 - 用各種方式優化自己的函式庫
2018-06-11
優化函式
iOS ARKit錄製視訊（AVAssetWriter & 有聲音）
2018-05-17
iOS
win10系統ppt錄製視訊的時候播放沒有聲音怎麼辦
2020-05-20
Win10
資料視覺化——Matpoltlib庫的使用
2024-03-23
視覺化
音訊錄製：三星電腦如何錄製音訊？
2021-05-27
音訊
爬取B站視訊播放量及資料視覺化
2020-12-14
視覺化
使用jave1.0.2.jar進行音視訊轉碼
2018-09-29
JAR
AudioContext+canvas實現音訊視覺化
2018-11-29
ContextCanvas音訊視覺化
短視訊“音訊化”，音樂“視訊化”
2021-11-29
音訊
電腦錄音工具有什麼，怎麼錄製電視音訊？
2018-11-23
音訊
win10怎麼錄螢幕視訊帶聲音錄製視訊沒有聲音的解決方法
2020-12-29
Win10
音訊轉錄文字
2024-08-09
音訊
c#音樂播放
2020-11-19
C#
音視訊開發-全網最全常用音視訊編碼和格式彙總
2021-05-11
【秒懂音視訊開發】19_視訊錄製01_命令列
2021-04-29
命令列
Android WebView 實現檔案選擇、拍照、錄製視訊、錄音
2021-11-02
AndroidWebView
python實現播放音訊和錄音功能示例程式碼
2019-01-18
Python音訊
【秒懂音視訊開發】09_音訊錄製02_程式設計
2021-03-26
音訊程式設計
如何使用系統音訊錄製Mac螢幕？
2021-02-24
音訊Mac
Web Audio API 第5章音訊的分析與視覺化
2024-04-18
WebAPI音訊視覺化
LaTeX中各種常用盒子的使用總結
2020-10-28
5 種使用 Python 程式碼輕鬆實現資料視覺化的方法
2018-04-28
Python視覺化
仿抖音火山視訊滑動播放
2018-06-22

[C#] NAudio 庫的各種常用使用方式: 播放 錄製 轉碼 音訊視覺化

概述

播放音訊

音訊錄製

高階應用

提示

示例

相關文章

[C#] NAudio 庫的各種常用使用方式: 播放錄製轉碼音訊視覺化