FFmpeg 是視訊處理最常用的開源軟體。
它功能強大,用途廣泛,大量用於視訊網站和商業軟體(比如 Youtube 和 iTunes),也是許多音訊和視訊格式的標準編碼/解碼實現。
FFmpeg 本身是一個龐大的專案,包含許多元件和庫檔案,最常用的是它的命令列工具。本文介紹 FFmpeg 命令列如何處理視訊,比桌面視訊處理軟體更簡潔高效。
如果你還沒安裝,可以根據官方文件 先完成安裝。
一、概念
介紹 FFmpeg 用法之前,需要了解一些視訊處理的基本概念。
1.1 容器
視訊檔案本身其實是一個容器(container),裡面包括了視訊和音訊,也可能有字幕等其他內容。
常見的容器格式有以下幾種。一般來說,視訊檔案的字尾名反映了它的容器格式。
- MP4
- MKV
- WebM
- AVI
下面的命令檢視 FFmpeg 支援的容器。
$ ffmpeg -formats
1.2 編碼格式
視訊和音訊都需要經過編碼,才能儲存成檔案。不同的編碼格式(CODEC),有不同的壓縮率,會導致檔案大小和清晰度的差異。
常用的視訊編碼格式如下。
- H.262
- H.264
- H.265
上面的編碼格式都是有版權的,但是可以免費使用。此外,還有幾種無版權的視訊編碼格式。
- VP8
- VP9
- AV1
常用的音訊編碼格式如下。
- MP3
- AAC
上面所有這些都是有損的編碼格式,編碼後會損失一些細節,以換取壓縮後較小的檔案體積。無損的編碼格式壓縮出來的檔案體積較大,這裡就不介紹了。
下面的命令可以檢視 FFmpeg 支援的編碼格式,視訊編碼和音訊編碼都在內。
$ ffmpeg -codecs
1.3 編碼器
編碼器(encoders)是實現某種編碼格式的庫檔案。只有安裝了某種格式的編碼器,才能實現該格式視訊/音訊的編碼和解碼。
以下是一些 FFmpeg 內建的視訊編碼器。
- libx264:最流行的開源 H.264 編碼器
- NVENC:基於 NVIDIA GPU 的 H.264 編碼器
- libx265:開源的 HEVC 編碼器
- libvpx:谷歌的 VP8 和 VP9 編碼器
- libaom:AV1 編碼器
音訊編碼器如下。
- libfdk-aac
- aac
下面的命令可以檢視 FFmpeg 已安裝的編碼器。
$ ffmpeg -encoders
二、FFmpeg 的使用格式
FFmpeg 的命令列引數非常多,可以分成五個部分。
$ ffmpeg {1} {2} -i {3} {4} {5}
上面命令中,五個部分的引數依次如下。
- 全域性引數
- 輸入檔案引數
- 輸入檔案
- 輸出檔案引數
- 輸出檔案
引數太多的時候,為了便於檢視,ffmpeg 命令可以寫成多行。
$ ffmpeg \ [全域性引數] \ [輸入檔案引數] \ -i [輸入檔案] \ [輸出檔案引數] \ [輸出檔案]
下面是一個例子。
$ ffmpeg \ -y \ # 全域性引數 -c:a libfdk_aac -c:v libx264 \ # 輸入檔案引數 -i input.mp4 \ # 輸入檔案 -c:v libvpx-vp9 -c:a libvorbis \ # 輸出檔案引數 output.webm # 輸出檔案
上面的命令將 mp4 檔案轉成 webm 檔案,這兩個都是容器格式。輸入的 mp4 檔案的音訊編碼格式是 aac,視訊編碼格式是 H.264;輸出的 webm 檔案的視訊編碼格式是 VP9,音訊格式是 Vorbis。
如果不指明編碼格式,FFmpeg 會自己判斷輸入檔案的編碼。因此,上面的命令可以簡單寫成下面的樣子。
$ ffmpeg -i input.avi output.mp4
三、常用命令列引數
FFmpeg 常用的命令列引數如下。
-c
:指定編碼器-c copy
:直接複製,不經過重新編碼(這樣比較快)-c:v
:指定視訊編碼器-c:a
:指定音訊編碼器-i
:指定輸入檔案-an
:去除音訊流-vn
: 去除視訊流-preset
:指定輸出的視訊質量,會影響檔案的生成速度,有以下幾個可用的值 ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow。-y
:不經過確認,輸出時直接覆蓋同名檔案。
四、常見用法
下面介紹 FFmpeg 幾種常見用法。
4.1 轉換編碼格式
轉換編碼格式(transcoding)指的是, 將視訊檔案從一種編碼轉成另一種編碼。比如轉成 H.264 編碼,一般使用編碼器libx264
,所以只需指定輸出檔案的視訊編碼器即可。
$ ffmpeg -i [input.file] -c:v libx264 output.mp4
下面是轉成 H.265 編碼的寫法。
$ ffmpeg -i [input.file] -c:v libx265 output.mp4
4.2 轉換容器格式
轉換容器格式(transmuxing)指的是,將視訊檔案從一種容器轉到另一種容器。下面是 mp4 轉 webm 的寫法。
$ ffmpeg -i input.mp4 -c copy output.webm
上面例子中,只是轉一下容器,內部的編碼格式不變,所以使用-c copy
指定直接拷貝,不經過轉碼,這樣比較快。
4.3 調整位元速率
調整位元速率(transrating)指的是,改變編碼的位元率,一般用來將視訊檔案的體積變小。下面的例子指定位元速率最小為964K,最大為3856K,緩衝區大小為 2000K。
$ ffmpeg \ -i input.mp4 \ -minrate 964K -maxrate 3856K -bufsize 2000K \ output.mp4
4.4 改變解析度(transsizing)
下面是改變視訊解析度(transsizing)的例子,從 1080p 轉為 480p 。
$ ffmpeg \ -i input.mp4 \ -vf scale=480:-1 \ output.mp4
4.5 提取音訊
有時,需要從視訊裡面提取音訊(demuxing),可以像下面這樣寫。
$ ffmpeg \ -i input.mp4 \ -vn -c:a copy \ output.aac
上面例子中,-vn
表示去掉視訊,-c:a copy
表示不改變音訊編碼,直接拷貝。
4.6 新增音軌
新增音軌(muxing)指的是,將外部音訊加入視訊,比如新增背景音樂或旁白。
$ ffmpeg \ -i input.aac -i input.mp4 \ output.mp4
上面例子中,有音訊和視訊兩個輸入檔案,FFmpeg 會將它們合成為一個檔案。
4.7 截圖
下面的例子是從指定時間開始,連續對1秒鐘的視訊進行截圖。
$ ffmpeg \ -y \ -i input.mp4 \ -ss 00:01:24 -t 00:00:01 \ output_%3d.jpg
如果只需要截一張圖,可以指定只擷取一幀。
$ ffmpeg \ -ss 01:23:45 \ -i input \ -vframes 1 -q:v 2 \ output.jpg
上面例子中,-vframes 1
指定只擷取一幀,-q:v 2
表示輸出的圖片質量,一般是1到5之間(1 為質量最高)。
4.8 裁剪
裁剪(cutting)指的是,擷取原始視訊裡面的一個片段,輸出為一個新視訊。可以指定開始時間(start)和持續時間(duration),也可以指定結束時間(end)。
$ ffmpeg -ss [start] -i [input] -t [duration] -c copy [output] $ ffmpeg -ss [start] -i [input] -to [end] -c copy [output]
下面是實際的例子。
$ ffmpeg -ss 00:01:50 -i [input] -t 10.5 -c copy [output] $ ffmpeg -ss 2.5 -i [input] -to 10 -c copy [output]
上面例子中,-c copy
表示不改變音訊和視訊的編碼格式,直接拷貝,這樣會快很多。
五、參考連結
- FFmpeg libav tutorial
- Digital video introduction
- FFmpeg encoding and editing course
- Making Slideshows w/FFMpeg
(完)