音訊解碼基礎講解

小马同学..3發表於2024-07-28

音訊解碼流程

音訊解碼的總體流程如下:

輸入音訊格式(例如AAC)
透過音訊解碼器進行解碼
得到PCM資料

FFmpeg解碼流程

音訊解碼的具體步驟如下:

查詢指定的解碼器 avcodec_find_decoder
根據指定的解碼器ID初始化相應裸流的解析器 av_parser_init
分配解碼器上下文 avcodec_alloc_context3
開啟解碼器和關聯解碼器上下文 avcodec_open2
讀取原始裸流 fread
解析出一個完整的資料包 av_parser_parse2
傳送給解碼器 avcodec_send_packet
接收解碼後的幀 avcodec_receive_frame
迴圈讀取幀並將PCM資料寫入檔案 fwrite
檔案讀取完畢後沖刷解碼器,以讀取出快取在解碼器的資料幀 flush decoder
結束

關鍵函式和示例程式碼

查詢指定的解碼器

AVCodec* codec = avcodec_find_decoder(AV_CODEC_ID_AAC);
if (!codec) {
    std::cerr << "Codec not found" << std::endl;
    return -1;
}
初始化解析器
cpp
複製程式碼
AVCodecParserContext* parser = av_parser_init(codec->id);
if (!parser) {
    std::cerr << "Parser not found" << std::endl;
    return -1;
}

分配解碼器上下文

AVCodecContext* codecContext = avcodec_alloc_context3(codec);
if (!codecContext) {
    std::cerr << "Could not allocate audio codec context" << std::endl;
    return -1;
}

開啟解碼器

if (avcodec_open2(codecContext, codec, NULL) < 0) {
    std::cerr << "Could not open codec" << std::endl;
    return -1;
}

讀取原始裸流

FILE* inputFile = fopen(inputFileName, "rb");
if (!inputFile) {
    std::cerr << "Could not open input file" << std::endl;
    return -1;
}

解析資料包併傳送到解碼器

uint8_t inbuf[INBUF_SIZE + AV_INPUT_BUFFER_PADDING_SIZE];
while (!feof(inputFile)) {
    size_t dataSize = fread(inbuf, 1, INBUF_SIZE, inputFile);
    if (dataSize <= 0)
        break;

    uint8_t* data = inbuf;
    while (dataSize > 0) {
        int ret = av_parser_parse2(parser, codecContext, &packet.data, &packet.size, data, dataSize, AV_NOPTS_VALUE, AV_NOPTS_VALUE, 0);
        if (ret < 0) {
            std::cerr << "Error while parsing" << std::endl;
            return -1;
        }
        data += ret;
        dataSize -= ret;

        if (packet.size)
            decode(codecContext, &packet, outputFile);
    }
}

解碼函式

void decode(AVCodecContext* codecContext, AVPacket* packet, FILE* outputFile) {
    int ret = avcodec_send_packet(codecContext, packet);
    if (ret < 0) {
        std::cerr << "Error sending a packet for decoding" << std::endl;
        return;
    }

    while (ret >= 0) {
        ret = avcodec_receive_frame(codecContext, frame);
        if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF)
            return;
        else if (ret < 0) {
            std::cerr << "Error during decoding" << std::endl;
            return;
        }

        fwrite(frame->data[0], 1, frame->linesize[0], outputFile);
    }
}

沖刷解碼器

avcodec_send_packet(codecContext, NULL);
while (avcodec_receive_frame(codecContext, frame) == 0) {
    fwrite(frame->data[0], 1, frame->linesize[0], outputFile);
}

關閉檔案和釋放資源

fclose(inputFile);
fclose(outputFile);
av_parser_close(parser);
avcodec_free_context(&codecContext);
av_frame_free(&frame);
av_packet_free(&packet);

總結

透過以上步驟和程式碼示例,你可以瞭解如何使用FFmpeg進行音訊解碼,從而將AAC等格式的音訊檔案解碼為PCM資料。整個流程包括了查詢解碼器、初始化解析器、分配和開啟解碼器上下文、讀取和解析資料包、傳送資料包到解碼器、接收解碼後的幀並寫入檔案,以及最後的資源釋放。

相關文章