JavaCV FFmpeg AAC編碼

HiIT青年發表於2021-01-06

原文網址 : https://www.cnblogs.com/itqn/p/14225880.html

上次成功通過FFmpeg採集麥克風的PCM資料，這次針對上一次的程式進行了改造，使用AAC編碼採集後的資料。

採集麥克風資料是一個解碼過程，而將採集後的資料進行AAC編碼則是編碼過程，如圖：

從上圖可以看出，編碼過程，資料流是從AVFrame流向AVPacket，而解碼過程正好相反，資料流是從AVPacket流向AVFrame。

javacpp-ffmpeg依賴：

<dependency>
    <groupId>org.bytedeco.javacpp-presets</groupId>
    <artifactId>ffmpeg</artifactId>
    <version>${ffmpeg.version}</version>
</dependency>

FFmpeg編碼的過程是解碼的逆過程，不過主線流程是類似的，如下圖：

基本上主要的步驟都是：

查詢編碼/解碼器
開啟編碼/解碼器
進行編碼/解碼

在FFmpeg的demo流程中其實還有建立流avformat_new_stream()，寫入頭部資訊avformat_write_header()和尾部資訊av_write_trailer()等操作，這裡只是將PCM資料編碼成AAC，所以可以暫時不需要考慮這些操作。

將採集音訊流資料進行AAC編碼的整體流程主要有以下幾個步驟：

採集音訊幀
將視音訊幀重取樣
構建AAC編碼器
對音訊幀進行編碼

採集音訊幀

採集音訊流中的音訊幀在上一次採集PCM資料的時候已經實現了，主要是從AVFormatContext中用av_read_frame()讀取音訊資料並進行解碼（avcodec_decode_audio4()），實現程式碼如下：

public AVFrame grab() throws FFmpegException {
    if (av_read_frame(pFormatCtx, pkt) >= 0 && pkt.stream_index() == audioIdx) {
        ret = avcodec_decode_audio4(pCodecCtx, pFrame, got, pkt);
        if (ret < 0) {
            throw new FFmpegException(ret, "avcodec_decode_audio4 解碼失敗");
        }
        if (got[0] != 0) {
            return pFrame;
        }
        av_packet_unref(pkt);
    }
    return null;
}

這樣通過grab()方法就可以獲取到音訊流中的音訊幀了。

音訊幀重取樣

在進行AAC編碼之前，如果採集的音訊幀資訊格式跟編碼器資訊不一致則需要進行重取樣，用到的是FFmpeg的SwrContext元件，下面的AudioConverter是對SwrContext封裝的元件，內部實現了AVFrame的填充及SwrContext的初始化，使用方式如下：

// 1. 建立AudioConverter，指定轉化格式為AV_SAMPLE_FMT_S16
AudioConverter.create(src_channel_layout, src_sample_fmt, src_sample_rate, 
    dst_channel_layout, AV_SAMPLE_FMT_S16, dst_sample_rate, dst_nb_samples);
// 2. 對音訊幀進行轉化swr_convert
converter.convert(pFrame);

AudioConverter的convert方式，實際上也是呼叫了SwrContext的swr_convert方法：

swr_convert(swrCtx, new PointerPointer<>(buffer), bufferLen, pFrame.data(), pFrame.nb_samples());

構建AAC編碼器

進行AAC編碼之前需要構建AAC編碼器，根據上面的流程圖利用avcodec_find_encoder()和avcodec_alloc_context3()實現編碼器的建立和引數配置，最後用avcodec_open()開啟編碼器，完整的初始化程式碼如下：

public static AudioAACEncoder create(int channels, int sample_fmt, int sample_rate, Consumer<byte[]> aacBufConsumer, Map<String, String> opts) throws FFmpegException {
    AudioAACEncoder a = new AudioAACEncoder();
    // 查詢AAC編碼器
    a.pCodec = avcodec_find_encoder(AV_CODEC_ID_AAC);
    if (a.pCodec == null) {
        throw new FFmpegException("初始化 AV_CODEC_ID_AAC 編碼器失敗");
    }
    // 初始化編碼器資訊
    a.pCodecCtx = avcodec_alloc_context3(a.pCodec);
    a.pCodecCtx.codec_id(AV_CODEC_ID_AAC);
    a.pCodecCtx.codec_type(AVMEDIA_TYPE_AUDIO);
    a.pCodecCtx.sample_fmt(sample_fmt);
    a.pCodecCtx.sample_rate(sample_rate);
    a.pCodecCtx.channel_layout(av_get_default_channel_layout(channels));
    // 音訊引數設定
    a.pCodecCtx.channels(av_get_channel_layout_nb_channels(a.pCodecCtx.channel_layout()));
    a.pCodecCtx.bit_rate(64000);
    // 其他引數設定
    AVDictionary dictionary = new AVDictionary();
    opts.forEach((k, v) -> av_dict_set(dictionary, k, v, 0));
    a.ret = avcodec_open2(a.pCodecCtx, a.pCodec, dictionary);
    if (a.ret < 0) {
        throw new FFmpegException(a.ret, "avcodec_open2 編碼器開啟失敗");
    }
    // 填充音訊幀
    a.aacFrame = av_frame_alloc();
    a.aacFrame.nb_samples(a.pCodecCtx.frame_size());
    a.aacFrame.format(a.pCodecCtx.sample_fmt());
    a.aacFrameSize = av_samples_get_buffer_size((IntPointer) null, a.pCodecCtx.channels(), //
        a.pCodecCtx.frame_size(), a.pCodecCtx.sample_fmt(), 1);
    // pCodecCtx.sample_fmt() = S16
    // AutoCloseable
    a.buffer = new BytePointer(av_malloc(a.aacFrameSize)).capacity(a.aacFrameSize);
    avcodec_fill_audio_frame(a.aacFrame, a.pCodecCtx.channels(), a.pCodecCtx.sample_fmt(), a.buffer, a.aacFrameSize, 1);

    a.pkt = new AVPacket();
    a.pcmBuffer = new byte[DEF_PCM_BUFFER_SIZE];
    a.aacBuffConsumer = aacBufConsumer;
    return a;
}

這裡需要特別注意的是，不是每一幀pcm資料都能編碼成為一幀AAC音訊幀，所以這裡通過Consumer<byte[]> aacBufConsumer指定回撥來消費編碼完成的AAC音訊幀。

對音訊幀進行編碼

編碼器構建完成後就可以對音訊幀進行編碼了，入參為AVFrame，出參通過Consumer<byte[]> aacBufConsumer指定回撥輸出byte[]，就如上面提到，不是一幀PCM音訊資料就能編碼成一幀AAC資料，所以這裡需要就多幀pcm音訊幀進行編碼，並快取未編碼的pcm資料留到下一次編碼。

public void encode(AVFrame avFrame) throws FFmpegException {
    // 計算Pcm容量
    int size = AudioUtils.toPcmFrameSize(avFrame, pCodecCtx.channels(), pCodecCtx.sample_fmt());
    byte[] buff = new byte[size];
    avFrame.data(0).get(buff);

    System.arraycopy(buff, 0, pcmBuffer, offset, size);
    offset += size;
    capacity += size;

    while (capacity >= aacFrameSize) {
        byte[] aacBuf = new byte[aacFrameSize];
        System.arraycopy(pcmBuffer, 0, aacBuf, 0, aacFrameSize);
        aacFrame.data(0).put(aacBuf);
        // 減去已經用於編碼的buff
        capacity -= aacFrameSize;
        offset = capacity;
        if (capacity > 0) { // 如果還有剩餘，則放入buffer最前面
            byte[] lBuff = new byte[capacity];
            System.arraycopy(pcmBuffer, aacFrameSize, lBuff, 0, capacity);
            System.arraycopy(lBuff, 0, pcmBuffer, 0, capacity);
        }

        ret = avcodec_encode_audio2(pCodecCtx, pkt, aacFrame, got);
        if (ret < 0) {
            throw new FFmpegException(ret, "avcodec_encode_audio2 音訊編碼失敗");
        }
        if (got[0] != 0) {
            byte[] pktBuff = new byte[pkt.size()];
            pkt.data().get(pktBuff);
            if (aacBuffConsumer != null) {
                aacBuffConsumer.accept(pktBuff);
            }
            av_packet_unref(pkt);
        }
    }
}

最後只需要調整一下上一次的主程式，將讀取pcm資料的部分，調整為將AVFrame丟進編碼器，拉取byte陣列即可。

public static void main(String[] args) throws FFmpegException, FileNotFoundException {
    FFmpegRegister.register();
    AudioGrabber a = AudioGrabber.create("External Mic (Realtek(R) Audio)");

    FileOutputStream fos = new FileOutputStream(new File("s16.aac"));
    AudioAACEncoder encoder = AudioAACEncoder.create(a.channels(), a.sample_fmt(), a.sample_rate(), buff -> {
        try {
            fos.write(buff);
        } catch (IOException e) {
            e.printStackTrace();
        }
    });
    for (int i = 0; i < 100; i++) {
        encoder.encode(a.grab());
    }
    encoder.release();
    a.release();
}

最終採集編碼後的AAC資料可以用VLC播放：

這裡對比一下，同樣的100幀pcm資料和aac資料的大小，相差還是很大的。

=========================================================
AAC編碼原始碼可關注公眾號 “HiIT青年” 傳送 “ffmpeg-aac” 獲取。

HiIT青年
關注公眾號，閱讀更多文章。

JavaCV FFmpeg H264編碼
2020-10-12
Java
ffmpeg音訊編碼之pcm轉碼aac
2024-06-08
音訊
從fdk_aac編碼器到自動靜態編譯FFmpeg
2019-07-15
編譯
ffmpeg提取aac資料
2024-05-25
MediaCodec硬編碼pcm2aac
2018-07-16
Android音視訊(四)MediaCodec編解碼AAC
2019-03-04
Android
JavaCV FFmpeg採集攝像頭YUV資料
2020-10-10
Java
FFmpeg學習之一（FFmpeg原始碼編譯）
2020-04-06
原始碼編譯
【秒懂音視訊開發】14_AAC編碼
2021-04-10
JavaCV FFmpeg採集麥克風PCM音訊資料
2021-01-03
Java音訊
ffmpeg iOS平臺編譯指令碼註釋
2018-07-07
iOS編譯指令碼
Android中使用ffmpeg編碼進行rtmp推流
2018-03-28
Android
安裝編譯ffmpeg
2024-06-29
編譯
29.FFmpeg+OpenGLES+OpenSLES播放器實現（三.FFmpeg配置和編譯指令碼）
2018-09-28
播放器編譯指令碼
第二章編譯FFmpeg並開啟H.264編碼
2024-07-17
編譯
C++實現RTMP協議傳送H.264編碼及AAC編碼的直播軟體開發音影片
2020-08-26
C++協議
FFmpeg系列(一)-Mac環境下使用NDK編譯FFmpeg
2019-04-11
Mac編譯
Web 端 H265 播放器（上）：WebAssembly 編碼 FFmpeg
2020-09-27
Web播放器
Make編譯之編譯32bit ffmpeg
2024-04-04
編譯
FFmpeg開發筆記（二十四）Linux環境給FFmpeg整合AV1的編解碼器
2024-05-27
筆記Linux
FFmpeg開發筆記（八）Linux交叉編譯Android的FFmpeg庫
2024-03-24
筆記Linux編譯Android
交叉編譯-Mac環境使用NDK編譯FFmpeg
2018-09-10
編譯Mac
ffmpeg學習window下使用Visual Studio建立cpp專案新增ffmpeg原始碼編譯好的依賴庫
2024-03-28
原始碼編譯
FFmpeg開發筆記（五）：ffmpeg解碼的基本流程詳解（ffmpeg3新解碼api）
2020-09-17
筆記API
Java版流媒體編解碼和影像處理(JavaCPP+FFmpeg)
2021-10-28
Java
Android-ffmpeg編譯so檔案
2018-11-01
Android編譯
Mac中編譯FFmpeg教程(Android版)
2019-03-04
Mac編譯Android
FFmpeg編譯Android使用的so庫
2018-09-28
編譯Android
NDKr20編譯ffmpeg-4.2.2
2020-02-17
編譯
FFmpeg開發筆記（七）尤拉系統編譯安裝FFmpeg
2024-03-23
筆記編譯
相親交友原始碼中，音訊AAC解碼的實現程式碼
2021-11-15
原始碼音訊
MediaCodec解碼FFmpeg AvPacket
2018-07-16
FFmpeg音訊解碼
2018-03-23
音訊
ffmpeg解碼基本流程
2024-07-21
Android 基於ffmpeg開發簡易播放器 - NDK交叉編譯ffmpeg
2018-06-11
Android播放器編譯
萬彩動畫大師教程 | 輸出視訊音訊編碼器選擇(AAC和MP3)
2019-03-19
動畫音訊
ffmpeg安裝之linux編譯安裝
2021-06-01
Linux編譯
編譯並裁剪 FFmpeg 在 Android 上做視訊編輯
2018-06-12
編譯Android

JavaCV FFmpeg AAC編碼

採集音訊幀

音訊幀重取樣

構建AAC編碼器

對音訊幀進行編碼

相關文章