背景
在能夠基於ChatTTS合成有聲書影片以後,現在需要進行視覺化處理。
問題
如何用ffmpeg根據音mp3音訊生成頻譜影片?
方案
FFmpeg可以使用showwaves
和showcqt
等濾鏡來生成音訊的視覺化效果。下面是一些使用showwaves
生成波形圖的示例命令:
ffmpeg -i input.mp3 -filter_complex "showwaves=s=1280x720:mode=line:rate=25,format=yuv420p" output.mp4
在上面的命令中,
-i input.mp3
指定輸入音訊檔案。-filter_complex "showwaves=s=1280x720:mode=line:rate=25,format=yuv420p"
使用showwaves
濾鏡生成波形圖。其中s
引數指定了生成影片的解析度,rate
引數指定了幀率,format
引數指定了影片的顏色格式。
評價
的確能生成相應頻譜影片,不過效果不太美觀。
參考
- GPT3.5-turbo