iOS 音量柱的實現(mic 採集的聲音DB反映成音量柱)

小東邪發表於2019-03-04

需求 : APP 將麥克風採集到的聲音(Audio Queue / Audio Unit) 通過公式轉換成DB然後在介面中顯示出來可實時檢測DB變化。

流程:

  • 配置Audio 初始化引數,必須使用Audio Queue 或 Audio Unit 採集聲音。
  • 在Audio Queue 或 Audio Unit 採集聲音的回撥中將聲音資料轉為DB。
  • 將拿到每一幀聲音的DB值傳給主控制器的UI以反映聲音的變化

最終的效果如下,黃色柱形會反映聲音DB的變化:

音量柱的實現


GitHub地址(附程式碼) : 音量柱的實現

簡書地址 : 音量柱的實現

部落格地址 : 音量柱的實現

掘金地址 : 音量柱的實現


注意點

  • 經過測試如果使用Audio Unit的方式採集聲音, 由於設定的聲音級別是audioUnit.componentSubType = kAudioUnitSubType_VoiceProcessingIO; 而採集到的聲音資料從512開始變得不正常,資料格外大,非正常範圍資料,所以我們從512開始不處理後面的資料。下文有具體說明
  • 如果是採用Audio Queue計算的資料則不需要額外處理

具體實現

1.初始化Audio Queue / Audio Unit 採集聲音,這裡不做說明,如有問題可參考Audio Queue/ Audio Unit 採集聲音
2.在採集聲音回撥中將聲音資料轉為聲音的DB值。

以Audio Unit 為例,在回撥中處理如下

#pragma mark - AudioUnit
static OSStatus RecordCallback(void *inRefCon,
                               AudioUnitRenderActionFlags *ioActionFlags,
                               const AudioTimeStamp *inTimeStamp,
                               UInt32 inBusNumber,
                               UInt32 inNumberFrames,
                               AudioBufferList *ioData) {

    XDXRecorder *recorder = (XDXRecorder *)inRefCon;
    
    // 將回撥資料傳給_buffList
    AudioUnitRender(recorder->_audioUnit, ioActionFlags, inTimeStamp, inBusNumber, inNumberFrames, recorder->_buffList);
    
    void    *bufferData = recorder->_buffList->mBuffers[0].mData;
    UInt32   bufferSize = recorder->_buffList->mBuffers[0].mDataByteSize;
    //    printf("Audio Recoder Render dataSize : %d \n",bufferSize);
    
    float channelValue[2];
    caculate_bm_db(bufferData, bufferSize, 0, k_Mono, channelValue,true);
    recorder.volLDB = channelValue[0];
    recorder.volRDB = channelValue[1];
複製程式碼

根據聲音的計算公式dB=20∗log(A)→A=pow(10,(db/20.0)),我們對回撥中傳來的聲音資料進行處理,這裡需要注意的是,經過測試如果使用Audio Unit的方式採集聲音, 由於設定的聲音級別是audioUnit.componentSubType = kAudioUnitSubType_VoiceProcessingIO; 而採集到的聲音資料從512開始變得不正常,資料格外大,非正常範圍資料,所以我們從512開始不處理後面的資料,具體原因可能是因為Audio Unit的kAudioUnitSubType_VoiceProcessingIO分類做了一些聲音的消除回聲等優化導致資料和正常資料略有不同,在AudioQueue中並不存在這樣的情況。

我們的APP中使用的是單聲道,遍歷聲音資料,如下我們通過遍歷每一幀完整的聲音資料(audioData)找到其中最大的值(max)來對它進行處理,處理後的資料按照公式可得到一個聲音的DB值(-40 - 0)

void caculate_bm_db(void * const data ,size_t length ,int64_t timestamp, ChannelCount channelModel,float channelValue[2],bool isAudioUnit) {
    int16_t *audioData = (int16_t *)data;
    
    if (channelModel == k_Mono) {   // 單聲道
        int     sDbChnnel     = 0;
        int16_t curr          = 0;
        int16_t max           = 0;
        size_t traversalTimes = 0;
        
        if (isAudioUnit) {
            traversalTimes = length/2;// 由於512後面的資料顯示異常  需要全部忽略掉
        }else{
            traversalTimes = length;
        }
        
        for(int i = 0; i< traversalTimes; i++) {
            curr = *(audioData+i);
            if(curr > max) max = curr;
        }
        
        if(max < 1) {
            sDbChnnel = -100;
        }else {
            sDbChnnel = (20*log10((0.0 + max)/32767) - 0.5);
        }
        
        channelValue[0] = channelValue[1] = sDbChnnel;
        
    } else if (channelModel == k_Stereo){   // 立體聲
        int sDbChA = 0;
        int sDbChB = 0;
        
        int16_t nCurr[2] = {0};
        int16_t nMax[2] = {0};
        
        for(unsigned int i=0; i<length/2; i++) {
            nCurr[0] = audioData[i];
            nCurr[1] = audioData[i + 1];
            
            if(nMax[0] < nCurr[0]) nMax[0] = nCurr[0];
            
            if(nMax[1] < nCurr[1]) nMax[1] = nCurr[0];
        }
        
        if(nMax[0] < 1) {
            sDbChA = -100;
        } else {
            sDbChA = (20*log10((0.0 + nMax[0])/32767) - 0.5);
        }
        
        if(nMax[1] < 1) {
            sDbChB = -100;
        } else {
            sDbChB = (20*log10((0.0 + nMax[1])/32767) - 0.5);
        }
        
        channelValue[0] = sDbChA;
        channelValue[1] = sDbChB;
    }
}
複製程式碼
3.將拿到的DB值反映到UI介面上
  • 自定義音量柱的View類

我們在這裡使用CALayer來實現音量柱的變化,使用CALayer的好處是其底層自動做了動畫的處理,所以當我們連續對其設定不同的DB值在UI上變化是連續的。具體UI的處理可在XDXVolumeView.m中檢視。

  • 在主控制器中開啟定時器設定每隔0.25s更新一次UI,這樣可以保證音量柱連續變化
  • 注意:我們將拿到的聲音DB值(-40 - 0)轉為0 - 40方便UI的顯示

相關文章