各種音視訊編解碼學習詳解

查志強發表於2014-11-26

【原文:http://blog.csdn.net/brucexu1978/article/details/7321471

 編解碼學習筆記(一):基本概念

媒體業務是網路的主要業務之間。尤其移動網際網路業務的興起,在運營商和應用開發商中,媒體業務份量極重,其中媒體的編解碼服務涉及需求分析、應用開發、釋放license收費等等。最近因為專案的關係,需要理清媒體的codec,比較搞的是,在豆丁網上看運營商的規範 標準,同一運營商同樣的業務在不同文件中不同的要求,而且有些要求就我看來應當是歷史的延續,也就是現在已經很少採用了。所以豆丁上看不出所以然,從 wiki上查。中文的wiki資訊量有限,很短,而wiki的英文內容內多,刪減版也減肥得太過。我在網上還看到一個山寨的中文wiki,長得很像,紅色的,叫“天下維客”。wiki的中文還是很不錯的,但是閱讀後建議再閱讀英文。

  我對媒體codec做了一些整理和總結,資料來源於wiki,小部分來源於網路部落格的收集。網友資料我們將給出來源。如果資料已經轉手幾趟就沒辦法,雁過留聲,我們只能給出某個軌跡。

基本概念

編解碼

  編解碼器(codec)指的是一個能夠對一個訊號或者一個資料流進行變換的裝置或者程式。這裡指的變換既包括將 訊號或者資料流進行編碼(通常是為了傳輸、儲存或者加密)或者提取得到一個編碼流的操作,也包括為了觀察或者處理從這個編碼流中恢復適合觀察或操作的形式的操作。編解碼器經常用在視訊會議和流媒體等應用中。

容器

  很多多媒體資料流需要同時包含音訊資料和視訊資料,這時通常會加入一些用於音訊和視訊資料同步的後設資料,例如字幕。這三種資料流可能會被不同的程式,程式或者硬體處理,但是當它們傳輸或者儲存的時候,這三種資料通常是被封裝在一起的。通常這種封裝是通過視訊檔案格 式來實現的,例如常見的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 這些格式中有些只能使用某些編解碼器,而更多可以以容器的方式使用各種編解碼器。

  FourCC全稱Four-Character Codes,是由4個字元(4 bytes)組成,是一種獨立標示視訊資料流格式的四位元組,在wav、avi檔案之中會有一段FourCC來描述這個AVI檔案,是利用何種codec來 編碼的。因此wav、avi大量存在等於“IDP3”的FourCC。

  視訊是現在電腦中多媒體系統中的重要一環。為了適應儲存視訊的需要,人們設定了不同的視訊檔案格式來把視訊和音訊放在一個檔案中,以方便同時回放。視訊檔實際上都是一個容器裡面包裹著不同的軌道,使用的容器的格式關係到視訊檔的可擴充套件性。

引數介紹

取樣率

  取樣率(也稱為取樣速度或者取樣頻率)定義了每秒從連續訊號中提取並組成離散訊號的取樣個數,它用赫茲(Hz)來表示。取樣頻率的倒數叫作取樣週期或取樣時間,它是取樣之間的時間間隔。注意不要將取樣率與位元率(bit rate,亦稱“位速率”)相混淆。

  取樣定理表明取樣頻率必須大於被取樣訊號頻寬的兩倍,另外一種等同的說法是奈奎斯特頻率必須大於被取樣訊號的頻寬。如果訊號的頻寬是 100Hz,那麼為了避免混疊現象取樣頻率必須大於200Hz。換句話說就是取樣頻率必須至少是訊號中最大頻率分量頻率的兩倍,否則就不能從訊號取樣中恢復原始訊號。

  對於語音取樣:

  • 8,000 Hz - 電話所用取樣率, 對於人的說話已經足夠
  • 11,025 Hz
  • 22,050 Hz - 無線電廣播所用取樣率
  • 32,000 Hz - miniDV 數碼視訊 camcorder、DAT (LP mode)所用取樣率
  • 44,100 Hz - 音訊 CD, 也常用於 MPEG-1 音訊(VCD, SVCD, MP3)所用取樣率
  • 47,250 Hz - Nippon Columbia (Denon)開發的世界上第一個商用 PCM 錄音機所用取樣率
  • 48,000 Hz - miniDV、數字電視、DVD、DAT、電影和專業音訊所用的數字聲音所用取樣率
  • 50,000 Hz - 二十世紀七十年代後期出現的 3M 和 Soundstream 開發的第一款商用數字錄音機所用取樣率
  • 50,400 Hz - 三菱 X-80 數字錄音機所用所用取樣率
  • 96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音軌、Blu-ray Disc(藍光碟)音軌、和 HD-DVD (高清晰度 DVD)音軌所用所用取樣率
  • 2.8224 MHz - SACD、 索尼 和 飛利浦 聯合開發的稱為 Direct Stream Digital 的 1 位 sigma-delta modulation 過程所用取樣率。

  在模擬視訊中,取樣率定義為幀頻和場頻,而不是概念上的畫素時鐘。影象取樣頻率是感測器積分週期的迴圈速度。由於積分週期遠遠小於重複所需時間,取樣頻率可能與取樣時間的倒數不同。

  • 50 Hz - PAL 視訊
  • 60 / 1.001 Hz - NTSC 視訊

  當模擬視訊轉換為數字視訊的時候,出現另外一種不同的取樣過程,這次是使用畫素頻率。一些常見的畫素取樣率有:

  • 13.5 MHz - CCIR 601、D1 video

解析度

  解析度,泛指量測或顯示系統對細節的分辨能力。此概念可以用時間、空間等領域的量測。日常用語中之解析度多用於影象的清晰度。解析度越高代表影象品質越好,越能表現出更多的細節。但相對的,因為紀錄的資訊越多,檔案也就會越大。目前個人電腦裡的影象,可以使用影象 處理軟體,調整影象的大小、編修照片等。例如 photoshop,或是photoimpact等軟體。

 影象解析度 :

  用以描述影象細節分辨能力,同樣適用於數字影象、膠捲影象、及其他型別影象。常用'線每毫米'、 '線每英吋'等來衡量。通常,“解析度”被表示成每一個方向上的畫素數量,比如640x480等。而在某些情況下,它也可以同時表示成“每英吋畫素” (pixels per inch,ppi)以及圖形的長度和寬度。比如72ppi,和8x6英吋。

 視訊解析度 :

各種電視規格解析度比較視 頻的畫面大小稱為“解析度”。數位視訊以畫素為度量單位,而類比視訊以水平掃瞄線數量為度量單位。標清電視訊號解析度為 720/704/640x480i60(NTSC)或768/720x576i50(PAL/SECAM)。新的高清電視(HDTV)解析度可達 1920x1080p60,即每條水平掃瞄線有1920個畫素,每個畫面有1080條掃瞄線,以每秒鐘60張畫面的速度播放。

畫面更新率fps

  Frame rate中文常譯為“畫面更新率”或“幀率”,是指視訊格式每秒鐘播放的靜態畫面數量。典型的畫面更新率由早期的每秒6或8張(frame persecond,簡稱fps),至現今的每秒120張不等。PAL (歐洲,亞洲,澳洲等地的電視廣播格式) 與 SECAM (法國,俄國,部分非洲等地的電視廣播格式) 規定其更新率為25fps,而NTSC (美國,加拿大,日本等地的電視廣播格式) 則規定其更新率為29.97 fps。電影膠捲則是以稍慢的24fps在拍攝,這使得各國電視廣播在播映電影時需要一些複雜的轉換手續(參考Telecine轉換)。要達成最基本的視覺暫留效果大約需要10fps的速度。

壓縮方法

有失真壓縮和無失真壓縮

  在視訊壓縮中有損(Lossy )和無損(Lossless)的概念與靜態影象中基本類似。無失真壓縮也即壓縮前和解壓縮後的資料完全一致。多數的無失真壓縮都採用RLE行程編碼演算法。有損 壓縮意味著解壓縮後的資料與壓縮前的資料不一致。在壓縮的過程中要丟失一些人眼和人耳所不敏感的影象或音訊資訊,而且丟失的資訊不可恢復。幾乎所有高壓縮的演算法都採用有失真壓縮,這樣才能達到低資料率的目標。丟失的資料率與壓縮比有關,壓縮比越小,丟失的資料越多,解壓縮後的效果一般越差。此外,某些有損壓 縮演算法採用多次重複壓縮的方式,這樣還會引起額外的資料丟失。

  • 無損格式,例如WAV,PCM,TTA,FLAC,AU,APE,TAK,WavPack(WV)
  • 有損格式,例如MP3,Windows Media Audio(WMA),Ogg Vorbis(OGG),AAC

幀內壓縮和幀間壓縮

  幀內(Intraframe)壓縮也稱為空間壓縮 (Spatial compression)。當壓縮一幀影象時,僅考慮本幀的資料而不考慮相鄰幀之間的冗餘資訊,這實際上與靜態影象壓縮類似。幀內一般採用有失真壓縮演算法,由於幀內壓縮時各個幀之間沒有相互關係,所以壓縮後的視訊資料仍可以以幀為單位進行編輯。幀內壓縮一般達不到很高的壓縮。

  採用幀間(Interframe)壓縮是基於許多視訊或 動畫的連續前後兩幀具有很大的相關性,或者說前後兩幀資訊變化很小的特點。也即連續的視訊其相鄰幀之間具有冗餘資訊,根據這一特性,壓縮相鄰幀之間的冗餘量就可以進一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時間壓縮(Temporalcompression),它通過比較時間軸上不同幀之間的資料進行壓縮。幀間壓縮一般是無損的。幀差值(Frame differencing)演算法是一種典型的時間壓縮法,它通過比較本幀與相鄰幀之間的差異,僅記錄本幀與其相鄰幀的差值,這樣可以大大減少資料量。

對稱編碼和不對稱編碼

  對稱性(symmetric)是壓縮編碼的一個關鍵特 徵。對稱意味著壓縮和解壓縮佔用相同的計算處理能力和時間,對稱演算法適合於實時壓縮和傳送視訊,如視訊會議應用就以採用對稱的壓縮編碼演算法為好。而在電子出版和其它多媒體應用中,一般是把視訊預先壓縮處理好,爾後再播放,因此可以採用不對稱(asymmetric)編碼。不對稱或非對稱意味著壓縮時需要花費大量的處理能力和時間,而解壓縮時則能較好地實時回放,也即以不同的速度進行壓縮和解壓縮。一般地說,壓縮一段視訊的時間比回放(解壓縮)該視訊的時間 要多得多。例如,壓縮一段三分鐘的視訊片斷可能需要10多分鐘的時間,而該片斷實時回放時間只有三分鐘。

除wiki外的資料來源:http://tech.lmtw.com/csyy/Using/200411/3142.html

 

 

 

編解碼學習筆記(二):codec型別

資料(港臺將information翻譯為資料)壓縮是透過去除資料中的冗餘資訊而達成。就視訊資料而言,資料中的冗餘資訊可以分成四類:

時間上的冗餘資訊(temporal redundancy)
  在視訊資料中,相鄰的幀(frame)與幀之間通常有很強的關連性,這樣的關連性即為時間上的冗餘資訊。這即是上一次學習中的幀間壓縮。

空間上的冗餘資訊(spatial redundancy)
  在同一張幀之中,相鄰的畫素之 間通常有很強的關連性,這樣的關連性即為空間上的冗餘資訊。這即是上一次學習中的幀內壓縮。

統計上的冗餘資訊(statistical redundancy)
  統計上的冗餘資訊指的是欲編碼的符號(symbol)的機率分佈是不均勻(non-uniform)的。

感知上的冗餘資訊(perceptual redundancy)
  感知上的冗餘資訊是指在人在觀看視訊時,人眼無法察覺的資訊。

 

  視訊壓縮(英文:Video compression)是指運用資料壓縮技術將數位視訊資料中的冗餘資訊去除,降低表示原始視訊所需的資料量,以便視訊資料的傳輸與儲存。實際上,原始視訊資料的資料量往往過大,例如未經壓縮的電視品質視訊資料的位元率高達216Mbps,絕大多數的應用無法處理如此龐大的資料量,因此視訊壓縮是必要的。目前最新的視訊編碼標準為ITU-T視訊編碼專家組(VCEG)和ISO/IEC動態影象專家組(MPEG)聯合組成的聯合視訊組(JVT,Joint Video Team)所提出的H.264/AVC。

  一個典型的視訊編碼器:在進行當前訊號編碼時,編碼器首先會產生對當前訊號做預測的訊號,稱作預測訊號(predicted signal),預測的方式可以是時間上的預測(interprediction),亦即使用先前幀的訊號做預測,或是空間上的預測 (intra prediction),亦即使用同一張幀之中相鄰畫素的訊號做預測。得到預測訊號後,編碼器會將當前訊號與預測訊號相減得到殘餘訊號(residual signal),並只對殘餘訊號進行編碼,如此一來,可以去除一部份時間上或是空間上的冗餘資訊。接著,編碼器並不會直接對殘餘訊號進行編碼,而是先將殘餘訊號經過變換(通常為離散餘弦變換)然後量化以 進一步去除空間上和感知上的冗餘資訊。量化後得到的量化係數會再透過熵編碼,去除統計上的冗餘資訊。

視訊編碼標準發展

年份

標準

制定組織

解除版權保護
(DRM-free )

主要應用

1984

H.120

ITU-T

 

1990

H.261

ITU-T

視訊會議視訊通話

1993

MPEG-1 第二部份

ISO /IEC

影音光碟(VCD )

1995

H.262/MPEG-2 第二部份

ISO / IECITU-T

DVD影碟DVD-Video )、藍光Blu-Ray )影碟、數位視訊廣播(DVB )、SVCD

1996

H.263 [6]

ITU-T

 

視訊會議視訊通話3G 手機視訊(3GP )

1999

MPEG-4 第二部份

ISO /IEC

 

2003

H.264/MPEG-4 AVC [1]

ISO / IECITU-T

藍光Blu-Ray )影碟、數位視訊廣播(DVB )、iPod 視訊、高畫質DVDHD DVD )

常見的編解碼見下表,在以後會分類論述:

視訊codec

ISO/IEC

MJPEG · Motion JPEG 2000 · MPEG-1 · MPEG-2 (Part 2 )· MPEG-4 (Part 2/ASP · Part 10/AVC )·HVC

ITU-T

H.120 · H.261 · H.262 · H.263 · H.264 · H.265

其它

AMV · AVS · Bink · CineForm · Cinepak · Dirac · DV · Indeo · Microsoft Video 1 · OMS Video · Pixlet· RealVideo · RTVideo · SheerVideo · Smacker · Sorenson Video & Sorenson Spark · Theora · VC-1 · VP3 · VP6 · VP7 · VP8 · WMV

音訊 codec

ISO/IECMPEG

MPEG-1 Layer III (MP3) · MPEG-1 Layer II · MPEG-1 Layer I · AAC · HE-AAC · MPEG-4 ALS ·MPEG-4 SLS · MPEG-4 DST

ITU-T

G.711 · G.718 · G.719 · G.722 · G.722.1 · G.722.2 · G.723 · G.723.1 · G.726 · G.728 · G.729 ·G.729.1

其它

AC-3 · AMR · AMR-WB · AMR-WB+ · Apple Lossless · ATRAC · DRA · DTS · FLAC · GSM-HR ·GSM-FR · GSM-EFR · iLBC · Monkey's Audio · TTA (True Audio)· MT9 · μ-law · Musepack ·Nellymoser · OptimFROG · OSQ · RealAudio · RTAudio · SD2 · SHN · SILK · Siren · Speex ·TwinVQ · Vorbis · WavPack · WMA

影象壓縮

ISO/IEC/ITU-T

JPEG · JPEG 2000 · JPEG XR · lossless JPEG · JBIG · JBIG2 · PNG · WBMP

Others

APNG · BMP · DjVu · EXR · GIF · ICER · ILBM · MNG · PCX · PGF · TGA · TIFF

媒體容器

通用

3GP · ASF · AVI · Bink · BXF · DMF · DPX · EVO · FLV · GXF · M2TS · Matroska · MPEG-PS ·MPEG-TS · MP4 · MXF · Ogg · QuickTime · RealMedia · RIFF · Smacker · VOB

只用於音訊

AIFF · AU· WAV

上面的表格,檢視某個具體的codec,可以在中文的wiki中查詢,但是英文的wiki諮詢更為豐富,見下表

Multimedia compression formats

Video compression

ISO/IEC

MJPEG · Motion JPEG 2000 · MPEG-1 · MPEG-2 (Part 2 )· MPEG-4 (Part 2/ASP · Part 10/AVC )· HEVC

ITU-T

H.120 · H.261 · H.262 · H.263 · H.264 · HEVC

Others

AMV · AVS · Bink · CineForm · Cinepak · Dirac · DV · Indeo · Microsoft Video 1 · OMS Video· Pixlet · RealVideo · RTVideo · SheerVideo · Smacker · Sorenson Video & Sorenson Spark· Theora · VC-1 · VP3 · VP6 · VP7 · VP8 · WMV

Audio compression

ISO/IEC

MPEG-1 Layer III (MP3) · MPEG-1 Layer II · MPEG-1 Layer I · AAC · HE-AAC · MPEG-4 ALS· MPEG-4 SLS · MPEG-4 DST · MPEG-4 HVXC · MPEG-4 CELP

ITU-T

G.711 · G.718 · G.719 · G.722 · G.722.1 · G.722.2 · G.723 · G.723.1 · G.726 · G.728 ·G.729 · G.729.1

Others

AC-3 · AMR · AMR-WB · AMR-WB+ · Apple Lossless · ATRAC · DRA · DTS · FLAC · GSM-HR · GSM-FR · GSM-EFR · iLBC · Monkey's Audio · TTA (True Audio)· MT9 · μ-law ·Musepack · Nellymoser · OptimFROG · OSQ · RealAudio · RTAudio · SD2 · SHN · SILK ·Siren · Speex · TwinVQ · Vorbis · WavPack · WMA

Image compression

ISO /IEC /ITU-T

JPEG · JPEG 2000 · JPEG XR · lossless JPEG · JBIG · JBIG2 · PNG · WBMP

Others

APNG · BMP · DjVu · EXR · GIF · ICER · ILBM · MNG · PCX · PGF · TGA · QTVR ·TIFF

Media containers

ISO/IEC

MPEG-PS · MPEG-TS · MPEG-4 Part 12 /JPEG 2000 Part 12 · MPEG-4 Part 14

ITU-T

H.222.0

Others

3GP and 3G2 · ASF · AVI · Bink · DivX Media Format · DPX · EVO · Flash Video · GXF ·M2TS · Matroska · MXF · Ogg · QuickTime · RealMedia · REDCODE RAW · RIFF ·Smacker · MOD and TOD · VOB · WebM

Audio only

AIFF · AU · WAV

 

編解碼學習筆記(三):Mpeg系列——Mpeg 1和Mpeg 2

MPEG是Moving Picture Experts Group的簡稱。這個名字本來的含義是指一個研究視訊和音訊編碼標準的小組。現在我們所說的MPEG泛指又該小組制定的一系列視訊編碼標準。該小組於 1988年組成,至今已經制定了MPEG-1、MPEG-2、MPEG-3、MPEG-4、MPEG-7等多個標準,MPEG-21正在制定中。

MPEG到目前為止已經制定並正在制定以下和視訊相關的標準:

  • MPEG-1: 第一個官方的視訊音訊壓縮標準,隨後在Video CD中被採用,其中的音訊壓縮的第三級(MPEG-1 Layer 3)簡稱MP3, 成為比較流行的音訊壓縮格式。
  • MPEG-2: 廣播質量的視訊、音訊和傳輸協議。被用於無線數位電視-ATSC、DVB以及ISDB、數字衛星電視(例如DirecTV)、 數字有線電視訊號,以及DVD視訊光碟技術中。
  • MPEG-3: 原本目標是為高解析度電視(HDTV)設計,隨後發現MPEG-2已足夠HDTV應用,故 MPEG-3的研發便中止。
  • MPEG- 4:2003 年釋出的視訊壓縮標準,主要是擴充套件MPEG-1、MPEG-2等標準以支援視訊/音訊物件(video/audio "objects")的編碼、3D內容、低位元率編碼(low bitrate encoding)和數位版權管理(Digital Rights Management),其中第10部分由ISO/IEC和ITU-T聯合釋出,稱為H.264/MPEG-4 Part 10。參見H.264。
  • MPEG-7:MPEG-7並不是一個視訊壓縮標準,它是一個多媒體內容的描述標準。
  • MPEG-21:MPEG-21是一個正在制定中的標準,它的目標是為未來多媒體的應用提供一個完整的平臺。

  媒體codec在於MPEG-1,MPEG-2,MPEG-4,如上圖所示。

圖中名稱解釋:在圖中DVD地球人都知道,何為DVB?

DVB:數字視訊廣播(DVB, Digital VideoBroadcasting),是由“DVB Project”維護的一系列為國際所承認的數字電視公開標準。DVB系統傳輸方式有如下幾種:

·        衛星電視(DVB-S 及 DVB-S2)

·        有線電視(DVB-C)

·        無線電視(DVB-T)

·        手持地面無線(DVB-H)

這些標準定義了傳輸系統的物理層與資料鏈路層。裝置通過同步並行介面(synchronous parallel interface, SPI),同步序列介面(synchronous serial interface, SSI),或非同步序列介面(asynchronousserial interface, ASI)與物理層互動。資料以MPEG-2傳輸流的方式傳輸,並要求符合更嚴格的限制(DVB-MPEG)。對移動終端即時壓縮傳輸資料的標準(DVB- H)目前正處於測試之中。

這些傳輸方式的主要區別在於使用的調製方式,因為不同它們應用的頻率頻寬的要求不同。利用高頻載波的DVB-S使用QPSK調製方式,利用低頻載波的DVB-C使用QAM-64 調製方式,而利用VHF 及 UHF載波的DVB-T使用COFDM調製方式。

除音訊與視訊傳輸外,DVB也定義了帶回傳通道(DVB-RC)的資料通訊標準(DVB-DATA)。

DVB的codec,視訊為:MPEG-2,MPEG-4 AVC;音訊為:MP3,AC-3,AAC,HE-AAC。

MPEG-1

  MPEG-1作為ISO/IEC11172正式釋出。

  MPEG-1較早的視訊編碼,質量比較差,主要用於 CD-ROM 儲存視訊,國內最為大家熟悉的就是 VCD(Video CD),他的視訊編碼就是採用 MPEG-1。它是為CD光碟介質定製的視訊和音訊壓縮格式。一張70分鐘的CD光碟傳輸速率大約在1.4Mbps。而 MPEG-1採用了塊方式的運動補償、離散餘弦變換(DCT)、量化等技術,併為1.2Mbps傳輸速率進行了優化。MPEG-1 隨後被Video CD採用作為核心技術。MPEG-1的輸出質量大約和傳統錄影機VCR,訊號質量相當,這也許是Video CD在已開發國家未獲成功的原因。

  MPEG-1音訊分三層,就是MPEG-1 Layer I, II, III,其中第三層協議也就是MPEG- 1 Layer 3,簡稱MP3。MP3目前已經成為廣泛流傳的音訊壓縮技術。

MPEG-1有下面幾個部分:

  • 第一部分(Part 1):系統;
  • 第二部分(Part 2):視訊;
  • 第三部分(Part 3):音訊;定義level1,level2,level3,並在MPEG-2中定義了擴充套件。
  • 第四部分(Part 4):一次性測試;
  • 第五部分(Part 5):參考軟體;

MPEG-1的缺點:

  • 1個音訊壓縮系統限於兩個通道(立體聲)
  • 沒有為隔行掃描視訊提供標準化支援,且壓縮率差
  • 只有一個標準化的“profile” (約束引數位元流), 不適應 更高解析度的視訊。MPEG - 1可以支援4k的視訊,但難以提供更高解析度的視訊編碼並且標識硬體的支援能力。
  • 支援只有一個顏色空間,4:2:0。

MPEG-2

MPEG-2內容介紹

  MPEG-2作為ISO/IEC 13818正式釋出,通常用來為廣播訊號提供視訊和音訊編碼,包括衛星電視、有線電視等。MPEG-2經過少量修改後,也成為DVD產品的核心技術。

  MPEG-2有11部分,具體如下:

第一部(Part 1):系統-描述視訊和音訊的同步和多路技術

  正式名稱是 ISO/IEC 13818-1或 ITU-T中的H.222.0

  MPEG-2的系統描述部分(第1部分)定義了傳輸流,它用來一套在非可靠介質上傳輸數字視訊訊號和音訊訊號的機制,主要用在廣播電視領域。

  定義了兩個不同但相關的容器格式,MPEG transport stream和MPEG program stream,也就是圖中的TS和PS。MPEG傳輸流(TS)為攜帶可損數字視訊和音訊,媒體流的開始和結束可以不標識出來,就像廣播或者磁帶,其中的 例子包括ATSC,DVB,SBTVD 和HDV。MPEG-2系統還定義了MPEG節目流(PS),它為以檔案為基礎的媒體設計一個容器格式,用於 硬碟驅動器,光碟 和快閃記憶體。

   MPEG-2 PS(節目流)是為在儲存介質儲存視訊資訊而開發的。 MPEG-2 TS(傳輸流)是為在網路傳輸視訊資訊而開發的。目前,MPEG-2 TS最廣泛地應用是DVB系統。TS流與PS流的區別在於TS流的包結構是固定度的,而PS流的包結構是可變長度。 PS包與TS包在結構上的這種差異,導致了它們對傳輸誤碼具有不同的抵抗能力,因而應用的環境也有所不同。TS碼流由於採用了固定長度的包結構,當傳輸誤 碼破壞了某一TS包的同步資訊時,接收機可在固定的位置檢測它後面包中的同步資訊,從而恢復同步,避免了資訊丟失。而PS包由於長度是變化的,一旦某一 PS包的同步資訊丟失,接收機無法確定下一包的同步位置,就會造 成失步,導致嚴重的資訊丟失。因此,在通道環境較為惡劣,傳輸誤碼較高時,一般採用TS碼流;而在通道環境較好,傳輸誤碼較低時,一般採用PS碼流由於 TS碼流具有較強的抵抗傳輸誤碼的能力,因此目前在傳輸媒體中進行傳輸的MPEG-2碼流基本上都採用了TS碼流的包格。

第二部(Part 2):視訊-視訊壓縮

  正式名稱是 ISO/IEC 13818-2或 ITU-T H.262。

  提供隔行掃描和非隔行掃描視訊訊號的壓縮編解碼器。

  MPEG-2的第二部分即視訊部分和MPEG-1類似,但是它提供對隔行掃描視訊顯示模式的支援(隔行掃描廣泛應用在廣播電視領域)。MPEG-2視訊並沒有對低位速率(小於1Mbps)進行優化,在 3Mbit/s及以上位速率情況下,MPEG-2明顯優於MPEG-1。 MPEG-2向後相容,也即是說,所有符合標準的MPEG-2解碼器也能夠正常播放MPEG-1視訊流。

  MPEG-2技術也應用在了HDTV傳輸系統中。MPEG-2 不光運用於 DVD-Video ,現在大部 分 HDTV(高清電視)也採用 MPEG-2 編碼,解析度達到了 1920x1080。由於 MPEG-2 的普及,本來為 HDTV 準備 的 MPEG-3 最終宣告放棄。

  MPEG-2視訊通常包含多個GOP(GroupOf Pictures),每一個GOP包含多個幀(frame)。幀的幀類(frame type)通常包括I-幀(I-frame)、P-幀(P-frame)和B-幀(B-frame)。其中I-幀採用幀內編碼,P-幀採用前向估計,B- 幀採用雙向估計。一般來說輸入視訊格式是25(CCIR標準)或者29.97(FCC)幀/秒。

  MPEG-2支援隔行掃描和逐行掃描。在逐行掃描模式下,編碼的基本單元是幀。在隔行掃描模式下,基本編碼可以是幀,也可以是場(field)。

  原始輸入影象首先被轉換到YCbCr顏色空間。其中Y是亮度,Cb和Cr是兩個色度通道。 Cb指藍色色 度,Cr指紅色色度。對於每一通道,首先採用塊分割槽,然後形成“巨集塊”(macroblocks),巨集塊構成了編碼的基本單元。每一個巨集塊再分 區成8x8的小塊。色度通道分割槽成小塊的數目取決於初始引數設定。例如,在常用的4:2:0格式下,每個色度巨集塊只取樣出一個小塊,所以三個通道巨集塊能夠 分割槽成的小塊數目是4+1+1=6個。

  對於I-幀,整幅影象直接進入編碼過程。對於P-幀和B-幀,首先做運動補償。通常來說,由於相鄰幀之間的相關 性很強,巨集塊可以在前幀和後幀中對應相近的位置找到相似的區域匹配的比較好,這個偏移量作為運動向量被記錄下來,運動估計重構的區域的誤差被送到編碼器中編碼。

  對於每一個8×8小塊,離散餘弦變換把影象從空間域轉換到頻域。得到的變換系數被量化並重新組織排列順序,從而增加長零的可能性。之後做遊程編碼(run-length code)。最後作哈夫曼編碼(Huffman Encoding)。

  I幀編碼是為了減少空間域冗餘,P幀和B幀是為了減少時間域冗餘。

  GOP是由固定模式的一系列I幀、P幀、B幀組成。常用的結構由15個幀組成,具有以下形式 IBBPBBPBBPBBPBB。GOP中各個幀的比例的選取和頻寬、影象的質量要求有一定關係。例如因為B幀的壓縮時間可能是I幀的三倍,所以對於計算 能力不強的某些實時系統,可能需要減少B幀的比例。

  MPEG-2輸出的位元流可以是勻速或者變速的。最大位元率,例如在DVD應用上,可達10.4 Mbit/s。如果要使用固定位元率,量化尺度就需要不斷的調節以產生勻速的位元流。但是,提高量化尺度可能帶來可視的失真效果。比如馬賽克現象。

第三部(Part 3):音訊-音訊壓縮

  MPEG-2的第三部分定義了音訊壓縮標準。MPEG-2 BC(Backwards compatible),後向相容MPEG-1音訊。該部分改進了MPEG-1的音訊壓縮,支援兩通道以上的音訊,可高達5.1多聲道。MPEG-2音訊 壓縮部分也保持了向後相容的特點(也稱為MPEG - 2 BC),允許的MPEG - 1音訊解碼器解碼兩個主立體聲元件。還定義音訊MPEG-1 Layer I,II ,III額外的位元率和取樣頻率。

  例如mp2,是MPEG-1 Audio level 2,標準有:ISO/IEC 11172-3, ISO/IEC 13818-3。MPEG-1Layer II 定義在 ISO/IEC 11172-3,也就是MPEG-1的第三部分,在 ISO/IEC 13818-3,也就是MPEG-2的第3部分定義擴充套件。

第四部(Part 4):測試規範

  描述測試程式。

第五部(Part 5):模擬軟體

  描述軟體模擬系統。

第六部(Part 6):DSM-CC(Digital Storage Media Commandand Control)擴充套件

  描述DSM-CC(數字儲存媒體命令及控制)擴充套件。

第七部(Part 7):Advanced Audio Coding (AAC)

  MPEG-2的第七部分定義了不能向後相容的音訊壓縮(也成為MPEG-2 NBC)。也成為MPEG-2 NBC(not-backwards compatible MPEG-1Audio)。該部分提供了更強的音訊功能。通常我們所說的MPEG-2 AAC指的就是這一部分。AAC即Advanced Audio Coding。 AAC是比以前的MPEG音訊標準的效率,並在某個程度上沒有它的前任MPEG-1 Layer3(MP3)複雜,它沒有複雜的混合濾波器(hybrid filter bank)。它支援從1到48個通道,取樣率從8-96千赫,多渠道,多語種和多節目(multiprogram)能力。AAC也在MPEG-4標準的第 3部分描述。

第八 部(Part 8):

   已取消。

第九部(Part 9):實時介面擴充套件

  實時介面擴充套件。

第十部(Part 10):DSM-CC一致性擴充套件

  DSM-CC一致性擴充套件。

第十一部(Part 11) :IP

  智慧財產權管理(IPMP)。XML定義在ISO/IEC23001-3。MPEG-2核心技術大約涉及640個專利,這些專利主要集中在20間公司和一間大學。

MPEG- 2音訊

  MPEG- 2提供新的音訊編碼方式。在第3部分和第7部分介紹。

第三部分

  MPEG-2 BC (backward compatible with MPEG-1 audio formats),使用一半的取樣速率處理低位速率的音訊,(MPEG-1 Layer 1/2/3 LSF),多通道編碼達到5.1個通道。

第七部分

  MPEG-2 NBC (Non-Backward Compatible),提供MPEG-2AAC,且不能向後相容, 多通道編碼達到 48個通道。

MPEG- 2 profile和level

  MPEG-2提供廣泛的應用, 對於大部分的應用,即不現實的也過於昂貴,去支援整個標準,通常只支援子集,因此標準定義了profile和level來表示這些子集。profile定 義特性相關,例如壓縮演算法,色度格式等。level定義效能相關,例如最大位元率,最大幀大小等。一個應用程式應當通過profile和level來表示 他的能力。profile和level的組合構成MPEG-2視訊編碼標準在某種特定應用下的子集。對某一輸入格式的影象,採用特定集合的壓縮編碼工具,產生規定速率範圍內的編碼碼流 。 例如一臺DVD播放機可以說,它支援最多的主要profile和主要level(通常寫為MP@ML)。

  MPEG-2主要的profile:

名稱

英文

中文

影象編碼型別

色度格式 YCbCr

長寬比

伸縮模式

SP

Simple Profile

簡單類

I幀、P幀

4:2:0

4:3或16:9

 

MP

Main Profile

主類

I幀、P幀、B幀

4:2:0

4:3 或16:9

 

SNR

SNR Scalable profile

訊雜比分層類

I幀、P幀、B幀

4:2:0

4:3 或16:9

訊雜比可伸縮

Spatial

Spatially scalable profile

空間可分層類

I幀、P幀、B幀

4:2:0

4:3 或16:9

訊雜比或空間可伸縮

442P

4:2:2 Profile

 

I幀、P幀、B幀

4:2:2

   

HP

High profile

高類

I幀、P幀、B幀

4:2:0或 4:2:2

4:3 或16:9

訊雜比或空間可伸縮

  MPEG-2主要的level:

名稱

英文

幀頻

最大長×最大寬

每秒最大亮度樣本 (約為高×寬×幀頻率)

最大位元率 (Mbit/s)

LL

Low Level

23.976, 24, 25, 29.97, 30

352×288

3,041,280

4

ML

Main Level

23.976, 24, 25, 29.97, 30

720×576

10,368,000,例外為:HP中4:2:0為14,475,600,4:2:2為11,059,200

15

H-14

High-1440 level

23.976, 24, 25, 29.97, 30, 50, 59.94, 60

1440×1152

47,001,600,例外為:HP中4:2:0為62,668,800

60

HL

High level

23.976, 24, 25, 29.97, 30, 50, 59.94, 60

1920×1152

62,668,800,例外為:HP中4:2:0為83,558,400

80

組合例子

Profile @ Level

Resolution (px)

Framerate max. (Hz)

Sampling

Bitrate (Mbit/s)

Example Application

SP@LL

176 × 144

15

4:2:0

0.096

Wireless handsets

SP@ML

352 × 288

15

4:2:0

0.384

PDAs

320 × 240

24

MP@LL

352 × 288

30

4:2:0

4

Set-top boxes (STB)

MP@ML

720 × 480

30

4:2:0

15 (DVD: 9.8)

DVD, SD-DVB

720 × 576

25

MP@H-14

1440 × 1080

30

4:2:0

60 (HDV: 25)

HDV

1280 × 720

30

MP@HL

1920 × 1080

30

4:2:0

80

ATSC 1080i, 720p60, HD-DVB (HDTV).

(Bitrate for terrestrial transmission is limited to 19.39Mbit/s)

1280 × 720

60

422P@LL

   

4:2:2

   

422P@ML

720 × 480

30

4:2:2

50

Sony IMX using I-frame only, Broadcast "contribution" video (I&P only)

720 × 576

25

422P@H-14

1440 × 1080

30

4:2:2

80

Potential future MPEG-2-based HD products from Sony and Panasonic

1280 × 720

60

422P@HL

1920 × 1080

30

4:2:2

300

Potential future MPEG-2-based HD products from Panasonic

1280 × 720

60

MPEG- 2在DVD上的應用

DVD中採用了 MPEG-2標準並引入如下技術引數限制:
* 解析度
o 720 x 480, 704 x 480, 352 x 480, 352 x 240 畫素(NTSC制式)
o 720 x 576, 704 x 576, 352 x 576, 352 x 288 畫素(PAL制式)
* 縱橫比
o 4:3
o 16:9
* 幀率(幀播放速度)
o 59.94 場/秒,23.976幀/秒,29.97幀/秒(NTSC)
o 50 場/秒,25幀/秒(PAL)
* 視訊+音訊 位元率
o 平均最大緩衝區 9.8 Mbit/s
o 峰值 15 Mbit/s
o 最小值 300 Kbit/s
* YUV 4:2:0
* 字幕支援
* 內嵌字幕支援(NTSC only)
* 音訊
o LPCM編碼:48kHz或96kHz;16或24-bit;最多可達6聲道
o MPEG Layer 2 (MP2):48 kHz,可達5.1聲道
o 杜比數字-Dolby Digital(DD,也稱為AC-3):48 kHz,32-448kbit/s,可達5.1聲道
o 數字家庭影院系統-Digital Theater Systems (DTS):754 kbit/s或1510 kbit/s
o NTSC制式DVD必須包含至少一道LPCM或Dolby Digital
o PAL制式DVD必須包含至少一道MPEG Layer 2、LPCM或者Dolby Digital
* GOP結構
o 必須為GOP提供序列的頭資訊
o GOP最大可含幀數目:18 (NTSC) / 15 (PAL)

MPEG- 2在DVB上的應用

DVB-MPEG相關技術引數:
* 必須符合以下一種解析度:
o 720 × 480 畫素,24/1.001,24,30/1.001或30幀/秒
o 640 × 480 畫素,24/1.001,24,30/1.001或30幀/秒
o 544 × 480 畫素,24/1.001,24,30/1.001或30幀/秒
o 480 × 480 畫素,24/1.001,24,30/1.001或30幀/秒
o 352 × 480 畫素,24/1.001,24,30/1.001或30幀/秒
o 352 × 240 畫素,24/1.001,24,30/1.001或30幀/秒
o 720 × 576 畫素,25幀/秒
o 544 × 576 畫素,25幀/秒
o 480 × 576 畫素,25幀/秒
o 352 × 576 畫素,25幀/秒
o 352 × 288 畫素,25幀/秒

MPEG- 2和NTSC

必須符合以下一種解析度:
o 1920 × 1080 畫素,最多60幀/秒(1080i)
o 1280 × 720 畫素,最多60幀/秒(720p)
o 720 × 576 畫素,最多50幀/秒,25幀/秒(576i,576p)
o 720 × 480 畫素,最多60幀/秒,30幀/秒(480i,480p)
o 640 × 480 畫素,最多60幀/秒
注:1080i按 1920×1088畫素編碼,但是最後8行在顯示時拋棄。

對YCbCr的補充資料

YCbCr不是一種絕對色彩空間,是YUV壓縮和偏移的版本。右圖為UV色版。

Y(Luma,Luminance)視訊,也就是灰階值。UV 視作表示彩度的 C(Chrominance或Chroma)。主要的取樣(subsample)格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。YUV的表示法稱為 A:B:C 表示法:

* 4:4:4 表示完全取樣。
* 4:2:2 表示 2:1 的水平取樣,沒有垂直下采樣。
* 4:2:0 表示 2:1 的水平取樣,2:1 的垂直下采樣。
* 4:1:1 表示 4:1 的水平取樣,沒有垂直下采樣。

最常用Y:UV記錄的比重通常 1:1 或2:1,DVD-Video 是以 YUV 4:2:0 的方式記錄,也就是我們俗稱的I420,YUV4:2:0 並不是說只有U(即 Cb), V(即 Cr)一定為 0,而是指U:V互相援引,時見時隱,也就是說對於每一個行,只有一個U或者V份量,如果一行是4:2:0的話,下一行就是4:0:2,再下一行是 4:2:0...以此類推。

以上來自wiki資料的整理。

編解碼學習筆記(四):Mpeg系列——Mpeg 4

在上次對MPEG-2的學習整理中,有一個疑惑,雙聲道理解,就是左右立體聲,但是5.1聲道是什麼?我們經常看到杜比5.1聲道的說法。“0.1”聲道具體指什麼?今天去wiki查了一下,相關內容也整理入我們的學習筆記。本文件資料來源:

5.1聲道

  使用杜比數字技術下,最標準常用的是5.1聲道設定,但杜比數字容許一系列不同聲道的選擇。全部可供選擇的聲道如下列所示:

  • 單聲道(中央)
  • 雙聲道立體聲(左、右),選擇性地交叉應用杜比環回
  • 三聲道立體聲(左、中、右)
  • 雙聲道立體聲加單環回(左、右、環回)
  • 三聲道立體聲加單環回(左、中、右、環回)
  • 四聲道環回立體聲(左前、右前、左後、右後)
  • 五聲道環回立體聲(左前、中、右前、左後、右後)

  以上所有這些設定可選擇性地使用低頻效果和杜比數字EX矩陣編碼中加入附加後環繞聲道。杜比編碼技術是向下相容 的,很多杜比播放器/解碼器均備有向下混音作用是釋出不同聲道至可供使用的揚聲器。這包括一些功能例如聲音資料通過前揚聲器播放(如適用),和當中央揚聲器不適用時釋出中央頻道至左或右揚聲器。或當使用者只有2.0喇叭時,杜比解碼器能把多聲道訊號混音編碼為 2.0立體聲。

  在5.1, 7.1 或其他等文字中,'.1'指的是低頻LFE聲道。

  其實5.1聲道就是使用5個喇叭和1個超低音揚聲器來實現一種身臨其境的音樂播放方式,它是由杜比公司開發的,所以叫做“杜比5.1聲道”。在5.1聲道系統裡採用左(L)、中(C)、右(R)、左後(LS)、右後(RS)五個方向輸出聲音,使人產生猶如身臨音樂廳的感覺。五個聲道相互獨立,其中“.1” 聲道,則是一個專門設計的超低音聲道。正是因為前後左右都有喇叭,所以就會產生被音樂包圍的真實感。如右圖所示。

MPEG-4

總體介紹

  MPEG-4是一套用於音訊、視訊資訊的壓縮編碼標準, 由國際標準化組織(ISO)和國際電工委員會(IEC)下屬的“動態影像專家組”(Moving Picture Experts Group,即MPEG) 制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網上流媒體、光碟、語音傳送(視訊電話),以及電視廣播。MPEG-4作為ISO/IEC14496正式釋出。ISO/IEC 14496-Coding of audio-visual object (AV物件編碼)。

  為了應對網路傳輸等環境,傳統的 MPEG-1/2 已經不能適應,所以促使了 MPEG-4 的誕生。 與 MPEG-1和MPEG-2相比,MPEG-4的特點是其更適於互動AV服務以及遠端監控。MPEG-4是第一個使你由被動變為主動(不再只是觀看,允許 你加入其中,即有互動性)的動態影象標準,它的另一個特點是其綜合性。從根源上說,MPEG-4試圖將自然物體與人造物體相溶合 (視覺效果意義上的)。MPEG-4的設計目標還有更廣的適應性和更靈活的可擴充套件性。 MPEG-4 採用了一系列新技術,來滿足在低頻寬下傳輸較高視訊質量的需求。DivX,XviD,MS MPEG4 都是採用的MPEG-4 視訊編碼,除了在 DVDRip 上面的應用,3GPP現在也接納了 MPEG-4 作為視訊編碼方案。

  最初MPEG-4的主要目的是用於低位元率下的視訊通訊,但是作為一個多媒體的編碼標準,它的範圍最後得到了擴充套件。在技術方面MPEG-4允許不同的軟體/硬體開發商建立多媒體物件來提供更好的適應性、靈活性,為數字電視,動態影象,網際網路等業務提供更好的質量。  

  MPEG-4提供範圍從每秒幾k位元到每秒數十兆位元的,它具有下面功能:

  • 改善MPEG-2的編碼效率
    • MPEG-4基於更高的編碼效率。同已有的或即將形成的其它標準相比,在相同的位元率下,它基於更高的視覺聽覺質量,這就 使得在低頻寬的通道上傳送視訊、音訊成為可能。同時MPEG-4還能對同時發生的資料流進行編碼。一個場景的多視角或多聲道資料流可以高效、同步地合成為 最終資料流。這可用於虛擬三維遊戲、三維電影、飛行模擬練習等。
  • 提供混合媒體資料(視訊,音訊,語音)的編碼能力
  • 差錯容忍使得內容穩定傳輸。
    • 當在傳輸有誤碼或丟包現象時,MPEG4受到的影響很小,並且能迅速恢復。
  • 提供受眾視聽場景的互動能力,MPEG-4終端使用者提供不同的物件支援各種互動要求。
    • MPEG-4提供了基於內容的多媒體資料訪問工具,如索引、超級連結、上傳、下載、刪除等。利用這些工具,使用者可以方便地 從多媒體資料庫中有選擇地獲取自己所需的與物件有關的內容,並提供了內容的操作和位流編輯功能,可應用於互動式家庭購物,淡入淡出的數字化效果等。 MPEG-4提供了高效的自然或合成的多媒體資料編碼方法。它可以把自然場景或物件組合起來成為合成的多媒體資料。
  • MPEG-4對傳輸資料網是透明的,它可以相容各種網路。
    • MPEG-4提供了易出錯環境的魯棒性,來保證其在許多無線和有線網路以及儲存介質中的應用,此外,MPEG-4還支援基於內容的的可分級性,即把內容、質量、複雜性分成許多小塊來滿足不同使用者的不同需求,支援具有不同頻寬,不同儲存容量的傳輸通道和接收端。
    • 這些特點無疑會加速多媒體應用的發展,從中受益的應用領域有:因特網多媒體應用;廣播電視;互動式視訊遊戲;實時可視通 信;互動式儲存媒體應用;演播室技術及電視後期製作;採用面部動畫技術的虛擬會議;多媒體郵件;行動通訊條件下的多媒體應用;遠端視訊監控;通過ATM網 絡等進行的遠端資料庫業務等。

MPEG-4視訊編碼核心思想

  在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是採用第一代壓縮編碼技術,著 眼於影象訊號的統計特性來設計編碼器,屬於波形編碼的範疇。第一代壓縮編碼方案把視訊序列按時間先後分為一系列幀,每一幀影象又分成巨集塊以進行運動補償和編碼,這種編碼方案存在以下缺陷:

  • 將影象固定地分成相同大小的塊,在高壓縮比的情況下會出現嚴重的塊效應,即馬賽克效應;
  • 不能對影象內容進行訪問、編輯和回放等操作;
  • 未充分利用人類視覺系統(HVS,Human Visual System)的特性。

  MPEG-4則代表了基於模型/物件的第二代壓縮編碼技術,它充分利用了人眼視覺特性,抓住了影象資訊傳輸的本質,從輪廓、紋理思路出發,支援基於視覺內容的互動功能,這適應了多媒體資訊的應用由播放型轉向基於內容的訪問、檢索及操作的發展趨勢。

  AV物件(AVO,AudioVisual Object)是MPEG-4為支援基於內容編碼而提出的重要概念。物件是指在一個場景中能夠訪問和操縱的實體,物件的劃分可根據其獨特的紋理、運動、形狀、模型和高層語義為依據。在MPEG-4中所見的視音訊已不再是過去MPEG-1、MPEG-2中影象幀的概念,而是一個個視聽場景(AV場景),這些 不同的AV場景由不同的AV物件組成。AV物件是聽覺、視覺、或者視聽內容的表示單元,其基本單位是原始AV物件,它可以是自然的或合成的聲音、影象。原 始AV物件具有高效編碼、高效儲存與傳輸以及可互動操作的特性,它又可進一步組成複合AV物件。因此MPEG-4標準的基本內容就是對AV物件進行高效編 碼、組織、儲存與傳輸。AV物件的提出,使多媒體通訊具有高度互動及高效編碼的能力,AV物件編碼就是MPEG-4的核心編碼技術。

  MPEG-4實現基於內容互動的首要任務就是把視訊/影象分割成不同物件或者把運動物件從背景中分離出來,然後針對不同物件採用相應編碼方法,以實現高效壓縮。因此視訊物件提取即視訊物件分割,是MPEG-4視訊編碼的關鍵技術,也是新一代視訊編碼的研究熱點和難點。

  MPEG-4不僅可提供高壓縮率,同時也可實現更好的多媒體內容互動性及全方位的存取性,它採用開放的編碼系統,可隨時加入新的編碼演算法模組,同時也可根據不同應用需求現場配置解碼器,以支援多種多媒體應用。

MPEG-4各部分

  MPEG-4由一系列的子標準組成,被稱為部,包括以下的部分。對於媒體編解碼,重點關注Part2,Part 3, Part 10。

第一部(ISO/IEC 14496-1):系統

  描述視訊和音訊的同步以及混合方式(Multiplexing,簡寫為MUX)。定義了 MP4 容器格式, 支援類似 DVD 選單這樣的直觀和互動特性等。

第二部(ISO/IEC 14496-2):視訊

  定義了一個對各種視覺資訊(包括視訊、靜止紋理、計算機合成圖形等等)的編解碼器。對視訊部分來說,眾多”Profiles”中很常用的一種是Advanced SimpleProfile (ASP),例如XviD編碼就 屬於MPEG-4Part 2。包括 3ivx, DivX4/Project Mayo, DivX 5, Envivio,ffmpeg/ffds, mpegable, Nero Digital, QuickTime, Sorenson, XviD 等常見的視訊格式, 需要注意的是 Divx 3.11, MS MPEG-4, RV9/10, VP6,WMV9 並不屬於標準的 MPEG-4 標準。

第三部(ISO/IEC 14496-3):音訊

  定義了一個對各種音訊訊號進行編碼的編解碼器的集合。包括高階音訊編碼(Advanced Audio Coding,縮寫為AAC) 的若干變形和其他一些音訊/語音編碼工具。即 AAC 音訊標準, 包括 LCAAC, HE AAC 等, 支援 5.1 聲道編碼, 可以用更低的位元速率實現更好的效果 (相對於 MP3, OGG 等) 。

第四部(ISO/IEC 14496-4):一致性

  定義了對本標準其他的部分進行一致性測試的程式。

第五部(ISO/IEC 14496-5):參考軟體

  提供了用於演示功能和說明本標準其他部分功能的軟體。

第六部(ISO/IEC 14496-6):多媒體傳輸整合框架

  即DMIF:Delivery Multimedia IntegrationFramework

第七部(ISO/IEC 14496-7):優化的參考軟體

  提供了對實現進行優化的例子(這裡的實現指的是第五部分)。

第八部(ISO/IEC 14496-8):在IP網路上傳輸

  定義了在IP網路上傳輸MPEG-4內容的方式。

第九部(ISO/IEC 14496-9):參考硬體

  提供了用於演示怎樣在硬體上實現本標準其他部分功能的硬體設計方案。

第十部(ISO/IEC 14496-10):進階視訊編碼,也即ITU H.264,常寫為H.264/AVC

  或稱高階視訊編碼(Advanced Video Coding,縮寫為AVC):定義了一個視訊編解碼器(codec),AVC和XviD都屬於MPEG-4編碼,但由於AVC屬於MPEG-4Part 10,在技術特性上比屬於MPEG-4 Part2的XviD要先進。另外從技術上講,它和ITU-T H.264標準是一致的,故全稱為MPEG-4 AVC/H.264。

第十一部(ISO/IEC 14496-11):場景描述和應用引擎

  可用於多種profile(包括2D和3D版本)的互互動媒體。修訂了MPEG-4 Part 1:2001以及Part1的兩個修訂方案。它定義了應用引擎(交付,生命週期,格式,可下載Java位元組程式碼應用程式的行為),二進位制場景格式 (BIFS:Binary Format for Scene),可擴充套件MPEG-4文字格式(一種使用XML描述MPEG-4多媒體內容的文字格式)系統level表述。也就是MPEG-4 Part21中的BIFS,XMT,MPEG-J。

第十二部(ISO/IEC 14496-12):基於ISO的媒體檔案格式

  定義了一個儲存媒體內容的檔案格式。

第十三部(ISO/IEC 14496-13):IP

  智慧財產權管理和保護(IPMP for Intellectual Property Management and Protection)擴充。

第十四部(ISO/IEC 14496-14):MPEG-4檔案格式

  定義了基於第十二部分的用於儲存MPEG-4內容的視訊檔案格式。

第十五部(ISO/IEC 14496-15):AVC檔案格式

  定義了基於第十二部分的用於儲存第十部分的視訊內容的檔案格式。

第十六部(ISO/IEC 14496-16):動畫框架擴充套件

  動畫框架擴充套件(AFX : Animation Framework eXtension)。

第十七部(ISO/IEC 14496-17):同步文字字幕格式

  尚未完成-2005年1月達成”最終委員會草案”,FCD: Final Committee Draft。

第十八部(ISO/IEC 14496-18):字型壓縮和流式傳輸(針對公開字型格式)。

第十九部(ISO/IEC 14496-19):綜合用材質流(Synthesized TextureStream)。

第二十部(ISO/IEC 14496-20):簡單場景表示

  LASeR for Lightweight Scene Representation,尚未完成-2005年1月達成”最終委員會草案”,FCD for Final Committee Draft。

第二十一部(ISO/IEC 14496-21):用於描繪(Rendering)的MPEG-J擴充

  尚未完成-2005年1月達成“委員會草案”,CD for Committee Draft)。

Profile和Level

  MPEG-4提供大量的編碼方式和豐富的設定。 和MPEG-2一樣,應用一般不可能支援MPEG-4全集,通過profile和level來描述子集。這些子集,通過 “profile”來表明解碼器要求,為了避免計算的複雜,每個profile都有一個或者多個“level”。profile和level的有效組合使得編碼生成器只需實現標準中所需的子集,同時保持與其他MPEG-4裝置的互通。(解碼支援範圍通常比編碼支援範圍大),檢查其他MPEG-4裝置是否符 合標準,即一致性測試。

  對於H.264/AVC(也就是MPEG-4 Part 4)提供下面的profile:

Feature support in particular profiles

Feature

CBP

BP

XP

MP

HiP

Hi10P

Hi422P

Hi444PP

B slices

No

No

Yes

Yes

Yes

Yes

Yes

Yes

SI and SP slices

No

No

Yes

No

No

No

No

No

Flexible macroblock ordering (FMO)

No

Yes

Yes

No

No

No

No

No

Arbitrary slice ordering (ASO)

No

Yes

Yes

No

No

No

No

No

Redundant slices (RS)

No

Yes

Yes

No

No

No

No

No

Data partitioning

No

No

Yes

No

No

No

No

No

Interlaced coding (PicAFF, MBAFF)

No

No

Yes

Yes

Yes

Yes

Yes

Yes

CABAC entropy coding

No

No

No

Yes

Yes

Yes

Yes

Yes

8×8 vs. 4×4 transform adaptivity

No

No

No

No

Yes

Yes

Yes

Yes

Quantization scaling matrices

No

No

No

No

Yes

Yes

Yes

Yes

Separate Cb and Cr QP control

No

No

No

No

Yes

Yes

Yes

Yes

Monochrome (4:0:0)

No

No

No

No

Yes

Yes

Yes

Yes

Chroma formats

4:2:0

4:2:0

4:2:0

4:2:0

4:2:0

4:2:0

4:2:0/4:2:2

4:2:0/4:2:2/4:4:4

Sample depths (bits)

8

8

8

8

8

8 to 10

8 to 10

8 to 14

Separate color plane coding

No

No

No

No

No

No

No

Yes

Predictive lossless coding

No

No

No

No

No

No

No

Yes

  level用來表明一個profile的解碼器的效能要求的範圍,例如最大圖片分配了,幀頻,位元率等等。對於解碼器,一個指定的level要求可以對該level以及低於該level的碼流進行解碼。(A decoder that conforms to agiven level is required to be capable of decoding all bitstreams that areencoded for that level and for all lower levels. 來源:http://en.wikipedia.org/wiki/H.264/MPEG-4_AVC

Levels with maximum property values

Level

Max macroblocks

Max video bit rate (VCL)

Examples for high resolution @ 
frame rate 
(max stored frames)

per second

per frame

BP, XP, MP
(kbit/s)

HiP 
(kbit/s)

Hi10P 
(kbit/s)

Hi422P, Hi444PP 
(kbit/s)

1

1,485

99

64

80

192

256

128×96@30.9 (8) 
176×144@15.0 (4)

1b

1,485

99

128

160

384

512

128×96@30.9 (8) 
176×144@15.0 (4)

1.1

3,000

396

192

240

576

768

176×144@30.3 (9) 
320×240@10.0 (3) 
352×288@7.5 (2)

1.2

6,000

396

384

480

1,152

1,536

320×240@20.0 (7) 
352×288@15.2 (6)

1.3

11,880

396

768

960

2,304

3,072

320×240@36.0 (7) 
352×288@30.0 (6)

2

11,880

396

2,000

2,500

6,000

8,000

320×240@36.0 (7) 
352×288@30.0 (6)

2.1

19,800

792

4,000

5,000

12,000

16,000

352×480@30.0 (7) 
352×576@25.0 (6)

2.2

20,250

1,620

4,000

5,000

12,000

16,000

352×480@30.7(10) 
352×576@25.6 (7) 
720×480@15.0 (6) 
720×576@12.5 (5)

3

40,500

1,620

10,000

12,500

30,000

40,000

352×480@61.4 (12) 
352×576@51.1 (10) 
720×480@30.0 (6) 
720×576@25.0 (5)

3.1

108,000

3,600

14,000

17,500

42,000

56,000

720×480@80.0 (13) 
720×576@66.7 (11) 
1280×720@30.0 (5)

3.2

216,000

5,120

20,000

25,000

60,000

80,000

1,280×720@60.0 (5) 
1,280×1,024@42.2 (4)

4

245,760

8,192

20,000

25,000

60,000

80,000

1,280×720@68.3 (9) 
1,920×1,080@30.1 (4) 
2,048×1,024@30.0 (4)

4.1

245,760

8,192

50,000

62,500

150,000

200,000

1,280×720@68.3 (9) 
1,920×1,080@30.1 (4) 
2,048×1,024@30.0 (4)

4.2

522,240

8,704

50,000

62,500

150,000

200,000

1,920×1,080@64.0 (4) 
2,048×1,080@60.0 (4)

5

589,824

22,080

135,000

168,750

405,000

540,000

1,920×1,080@72.3 (13) 
2,048×1,024@72.0 (13) 
2,048×1,080@67.8 (12) 
2,560×1,920@30.7 (5) 
3,680×1,536@26.7 (5)

5.1

983,040

36,864

240,000

300,000

720,000

960,000

1,920×1,080@120.5 (16) 
4,096×2,048@30.0 (5) 
4,096×2,304@26.7 (5)

 

 

編解碼學習筆記(五):Mpeg系列——AAC音訊

 下面資料來自wiki。AAC在MPEG2和MPEG4中定義。

副檔名:.m4a, .m4b, .m4p, .m4v, .m4r, .3gp, .mp4, .aac 
網際網路媒體型別:audio/aac, audio/aacp, audio/3gpp, audio/3gpp2,audio/mp4, audio/MP4A-LATM, audio/mpeg4-generic
格式:有損資料壓縮 
延伸自:MPEG-2 音訊 
標準:ISO/IEC 13818-7(MPEG-2第7部), ISO/IEC 14496-3(MPEG-4第3部)

  AAC(Advanced Audio Coding),中文稱為“高階音訊編碼”,出現於1997年,基於 MPEG-2的音訊編碼技術。由Fraunhofer IIS、杜比實驗室、AT&T、Sony(索尼)等公司共同開發,目的是取代MP3格式。2000年,MPEG-4標準出現後,AAC 重新整合了其特性,加入了SBR技術和PS技術,為了區別於傳統的 MPEG-2 AAC 又稱為 MPEG-4 AAC。

AAC格式的主要副檔名有三種:

  • AAC - 使用MPEG-2 Audio Transport Stream( ADTS,參見MPEG-2 )容器,區別於使用MPEG-4容器的MP4/M4A格式,屬於傳統的AAC編碼(FAAC預設的封裝,但FAAC亦可輸出 MPEG-4 封裝的AAC)
  • MP4 - 使用了MPEG-4 Part 14(第14部分)的簡化版即3GPP Media Release 6 Basic (3gp6,參見3GP ) 進行封裝的AAC編碼(Nero AAC 編碼器僅能輸出MPEG-4封裝的AAC);
  • M4A - 為了區別純音訊MP4檔案和包含視訊的MP4檔案而由蘋果(Apple)公司使用的副檔名,Apple iTunes 對純音訊MP4檔案採用了".M4A"命名。M4A的本質和音訊MP4相同,故音訊MP4檔案亦可直接更改副檔名為M4A。

  作為一種高壓縮比的音訊壓縮演算法,AAC壓縮比通常為18:1,也有資料說為20:1,遠勝mp3; 在音質方面,由於採用多聲道,和使用低複雜性的描述方式,使其比幾乎所有的傳統編碼方式在同規格的情況下更勝一籌。不過直到2006年, 使用這一格式儲存音樂的並不多,可以播放該格式的mp3播放器更是少之又少,目前所知僅有蘋果iPod、Sony Walkman(NWZ-A、NWZ-S、NWZ-E、NWZ-X系列)、任天堂NDSi。魅 族M8,此外計算機上很多音樂播放軟體都支援AAC(前提是安裝過AAC解碼器),如蘋果iTunes。但在行動電話領域,AAC的支援度已很普 遍,Nokia、Sony Ericsson、Motorola等品牌均在其中高階產品中支援 AAC(一開始主要是LC-AAC,隨著行動電話效能的發展,HE-AAC的支援也已廣泛)。

  AAC可以支援多達48個音軌,15個低頻(LFE)音軌,5.1多聲道支援,更高的取樣率(最高可達 96kHz,音訊CD為44.1kHz)和更高的取樣精度(支援8bit、16bit、24bit、32bit,音訊CD為 16bit)以及有多種語言的相容能力,更高的解碼效率,一般來說,AAC可以在對比MP3檔案縮小30%的前題下提供更好的音質。

  • 相對於傳統的LC-AAC,High Efficiency AAC(HE-AAC或寫為 AAC-HE)又稱為 "aacPlus v1" 或 "AAC+" - 結合了 SBR (Spectral Band Replication) and AAC技術;適用於低位元率(64kbps以下);
  • HE-AAC v2,又稱為 "aacPlus v2" - 結合了 Parametric Stereo(引數化立體 聲,PS)和 HE-AAC 中的SBR技術。

  因為"AAC"是一個大家族,他們共分為 9 種規格,以適應不同場合的需要,也正是由於 AAC 的規格(Profile)繁多,導致普通電腦使用者感覺十分困擾:

  1. MPEG-2 AAC LC 低複雜度規格(Low Complexity)
  2. MPEG-2 AAC Main 主規格
  3. MPEG-2 AAC SSR 可變取樣率規格(Scaleable Sample Rate)
  4. MPEG-4 AAC LC 低複雜度規格(Low Complexity),現在的手機比較常見的 MP4 檔案中的音訊部份就包括了該規格音訊檔案
  5. MPEG-4 AAC Main 主規格
  6. MPEG-4 AAC SSR 可變取樣率規格(Scaleable Sample Rate)
  7. MPEG-4 AAC LTP 長時期預測規格(Long Term Predicition)
  8. MPEG-4 AAC LD 低延遲規格(Low Delay)
  9. MPEG-4 AAC HE 高效率規格(High Efficiency)

  上述的規格中,主規格(Main)包含了除增益控制之外的全部功能,其音質最好,而低複雜度規格(LC)則是比較簡單,沒有了增益控制,但提高了 編碼效率,至‘SSR’對‘LC’規格大體是相同,但是多了增益的控制功能,另外,MPEG-4 AAC/LTP/LD/HE,都是用在低位元率下編碼,特別是‘HE’是有 Nero ACC 編碼器支援,是近來常用的一種編碼器,不過通常來說,Main 規格和 LC 規格的音質相差不大,因此目前使用最多的 AAC 規格多數是‘LC’規格,因為要考慮手機目前的儲存器能力未達合理水準。

編解碼學習筆記(六):H.26x系列

部分資料來源與wiki以及http://www.365pr.net/tech_view.asp?id=315

H.26x有H.261,H.262,H.263, H.263v2以及H.264,H.261基本上已經不再使用。其中H.262和H.264已經在MPEG系列中介紹,他們分別對應MPEG2的第2部和MPEG-4的第10部。不在整理這方面的資料。

H.261

H.261其速率為64kbps的整數倍(1~30倍)。它最初是 針對在ISDN(綜合業務數字網,Integrated Services Digital Network)上雙向聲像業務(特別是可視電話、視訊會議)而設計的。

H.261是最早的運動影象壓縮標準,它只對CIF和QCIF兩 種影象格式進行處理,每幀影象分成影象層、巨集塊組(GOB)層、巨集塊(MB)層、塊(Block)層來處理;並詳細制定了視訊編碼的各個部分,包括運動補償的幀間預測、DCT(離散餘弦變換)、量化、熵編碼,以及與固定速率的通道相適配的速率控制等部分。實際的編碼演算法類似於MPEG演算法,但不能與後者兼 容。H.261在實時編碼時比MPEG所佔用的CPU運算量少得多,此演算法為了優化頻寬佔用量,引進了在影象質量與運動幅度之間的平衡折衷機制。也就是說,劇烈運動的影象比相對靜止的影象質量要差。因此這種方法是屬於恆定碼流可變質量編碼。

H.261是第一個實用的數字視訊編碼標準。H.261的設計相當成功,之後的視訊編碼國際標準基本上都是基於 H.261相同的設計框架,包括 MPEG-1,MPEG-2/H.262,H.263,甚至 H.264。同樣,H.261開發委員會(由Sakae Okubo領導,他的日文姓名是大久保榮)的基本的運作方式也被之後的視訊編碼標準開發組織所繼承。H.261使用了混合編碼框架,包括了基於運動補償的 幀間預測,基於離散餘弦變換的空域變換編碼,量化,zig-zag掃描和熵編碼。

實際上H.261標準僅僅規定了如何進行視訊的解碼(後繼的各個視訊編碼標準也繼承了這種做法)。這樣的話,實際上開發者在編碼器的設計上擁有相當的自由來設計編碼演算法,只要他們的編碼器產生的碼流能夠被所有按照H.261規範製造的解碼器解碼就可以了。編碼器可以按照自己的需要對輸入的視訊進行任何預處理,解碼器也有自由對輸出的視訊在顯示之前進行任何後處理。去塊效應濾波器是一個有效的後處理技術,它能明顯的減輕因為使用分塊運動補償編碼造成的 塊效應(馬賽克)--在觀看低位元速率視訊(例如網站上的視訊新聞)的時候我們都會注意到這種討厭的效應。因此,在之後的視訊編碼標準如H.264中就把去塊 效應濾波器加為標準的一部分(即使在使用H.264 的時候,再完成解碼後再增加一個標準外的去塊效應濾波器也能提高主觀視訊質量)。

後來的視訊編碼標準都可以說是在H.261的基礎上進行逐步改進,引入新功能得到的。現在的視訊編碼標準比起H.261 來在各效能方面都有了很大的提高,這使得H.261成為了過時的標準,除了在一些視訊會議系統和網路視訊中為了向後相容還支援H.261,已經基本上看不到使用H.261的產品了。 但是這並不妨礙H.261成為視訊編碼領域一個重要的里程碑式的標準。

H.263

H.263最初設計為基於H.324的系統進行傳輸 (即基於公共交換電話網和其它基於電路交換的網路進行視訊會議和視訊電話)。後來發現H.263也可以成功的應用與H.323(基於RTP/IP網路的視 頻會議系統),H.320(基於綜合業務數字網的視訊會議系統),RTSP(流式媒體傳輸系統)和SIP(基於因特網的視訊會議)。

基於之前的視訊編碼國際標準(H.261,MPEG-1和H.262/MPEG-2),H.263的效能有了革命性的提高。它的第一版於1995年 完 成,在所有位元速率下都優於之前的H.261。 之後還有在1998 年增加了新的功能的第二版H.263+,或者叫H.263v2,以及在2000年完 成的第三版H.263++,即H.263v3。

H.263v2(通常也叫做H.263+或者1998年版H.263)是ITU-TH.263 視訊編 碼標準第二版的非正式名稱。 它保持了原先版本H.263的所有技術,但是通過增加了幾個附錄顯著的提高了編碼效率並提供了其它的一些能力,例如增強了抵抗傳輸通道的資料丟失的能力(Robustness)。H.263+ 專案於1997年底/1998年初完成(這取決於我們怎麼定義"完成")。

H.263v3:接下來一個被稱為"H.263++" 的專案被隨即推出,在H.263+的基礎上增加了更多的新的功能。H.263++於2000年底完成。增加了下面的附錄:

  • Annex A - Inverse transform accuracy specification
  • Annex B - Hypothetical Reference Decoder
  • Annex C - Considerations for Multipoint
  • Annex D - Unrestricted Motion Vector mode
  • Annex E - Syntax-based Arithmetic Coding mode
  • Annex F - Advanced Prediction mode
  • Annex G - PB-frames mode
  • Annex H - Forward Error Correction for coded video signal

在H.263之後,ITU-T(在與MPEG的合作下)的下一代視訊編解碼器是H.264,或者叫AVC以及MPEG- 4第 10部分。由於H.264在效能上超越了H.263很多,現在通常認為H.263是一個過時的標準(雖然它的開發完成並不是很久以前的事情)。大多數新的 視訊會議產品都已經支援了H.264視訊編解碼器,就像以前支援H.263和H.261一樣。

話雖然如此,H.263在3GPP中仍然佔有很高的地位,後繼修訂的版本,包括運營商的標準一直保留著H.263, 作為必選的要求,地位遠遠高於H.264,這是個奇怪的現象。一個重要的可能原因是H.263的編碼比H.264的要輕載,在手機的modem中提供 H.263的編解碼能力,不提供H.264的編解碼能力,或者只提供H.264的解碼能力不提供編碼能力,如果不是智慧手機不能在主機板的其他晶片(例如 CPU)提供H.264的編解碼能力,開發者就沒什麼辦法,H.263可以通過軟體來提供,H.264對處理能力的要求很高,目前需要依賴硬體能力提供。因此H.263仍然具有很大的市場,尤其對於小尺寸的手持裝置,螢幕解析度有限,高清無意義。

H.264

H.264等同於MPEG-4的第10部,在這裡仍然收集資料進行學習記錄。

在H.263之後,ITU-T(在與MPEG的合作下)的下一代視 頻編解碼器是H.264,或者叫AVC以 及MPEG-4第 10部分。由於H.264在效能上超越了H.263很多,現在通常認為H.263是一個過時的標準(雖然它的開發完成並不是很久以前的事情)。大多數新的 視訊會議產品都已經支援了H.264視訊編解碼器,就像以前支援H.263和H.261一樣。

H.264/AVC可工作於多種速率,廣泛應用於Internet/intranet上的多媒體流服務、視訊點播、可視遊戲、低位元速率移動多媒體通訊 (視訊 手機等)、互動式多媒體應用、實時多媒體監控、數字電視與演播電視和虛擬視訊會議等,大有在上述領域一統天下的趨勢,有非常廣泛的開發和應用前景。

H.264是一種視訊高壓縮技術,同時稱為MPEG-4 AVC,或MPEG-4 Part10。ITU-T從1998年就H.26L的H.26S兩個分組,H.26L研製節目時間較長的高壓縮編碼技術,H.26S則指短節目標準制訂部 門。前面的H.263就是H.26S標準化技術,而H.264標準是在H.26L基礎上發展而來的。為了不引起誤解,ITU-T推薦使用H.264作為這 一標準的正式名稱。H.264集中體現了當今國際視訊編碼解碼技術的最新成果。在相同的重建影象質量下,H.264比其他視訊壓縮編碼具有更高的壓縮比、 更好的IP和無線網路通道適應性。

首先,H.264具備超高壓縮率,其壓縮率為MPEG-2的2 倍,MPEG-4的1.5倍。這樣的高壓縮率是以編碼的大運算量來換取的,H.264的編碼處理計算量有MPEG-2的十多倍。不過其解碼的運算量並沒有上升很多。從CPU頻率和記憶體的高速發展的角度來看,1995年推出MPEG-2時,主流的CPU是奔騰100,記憶體更是小的可憐。而如今主流CPU的工 作頻率比那個時候快了30倍,記憶體擴大了50多倍。所以H.264編碼的大運算現在也不算什麼大問題了。

高壓縮率使影象的資料量減少,給儲存和傳輸帶來了方便。加上基本規格公開的國際標準和公正的許可制度,所以,電視廣播、家電和通訊三大行業都進入到 H.264的實際運用研發中心。美國高等電視系統會議和日本無線電工業和事務協會都準備把H.264作為地面行動式數字電視廣播的編碼方式。歐洲數字電視廣播標準化團體也正在將H.264作為數字電視的一種編碼方式來採用。

家電行業中的視訊儲存裝置廠商也看中了H.264。東芝和NEC推出的下一代採用藍色鐳射的光碟HD DVD-ROM,因為容量小於Sony等九大公司的藍光碟,故將視訊壓縮編碼改用H.264,從而使最終的節目錄制時長能與藍光碟相近。H.264也能使 HDTV節目錄影和 SDTV的長時間錄影成為可能。因而,生產LSI晶片的廠商也十分重視H.264。D9型DVD碟只有8.5GB,不足以存放2小時的HDTV節目,如用 H.264來壓縮就變得有可能。同時,在通訊領域,網際網路工程任務已開始將H.264作為實時傳輸協議流的格式進行標準化。網際網路和手機的視訊傳送也會有 H.264作為編碼方式。

相對於MPEG壓縮編碼H.264的變化之一是在幀內編碼I畫面中,又加入了幀內預測編碼技術,即解碼時可用周圍資料的差分值來重構畫面。在運動預 測塊中,H.264採用全面運動預測和I畫面幀內預測後,編碼量得到減少,但LSI的運算處理量增大。為此,H.264引入了DCT的簡化處理技術,來減 輕LSI的負擔,畫質也有所改善。H.264與MPEG-2和MPEG-4的不同還存在於熵編碼塊中,H.264的熵編碼CAVLC(內容自適應可變長度 碼)和CABAC(內容自適應二進位制演算法編碼)能提高糾錯能力。而MPEG-2和MPEG-4是霍夫曼編碼。另外,還加入瞭解鎖濾波器 (Deblocking Filter),有降低噪聲的效果。H.264的整數變換以4×4畫素塊為單位,已比原來的8×8畫素塊的塊噪聲少,再次降低,畫質得到了進一步提高。

H.264標準分為三檔:基本檔次;主要檔次(可用於SDTV、HDTV和DVD等);以及擴充套件檔次(用於網路的視訊流)。其中H.264的基本檔 次是免費,使用者可以無償使用,現得到美國蘋果公司和美國Cisco系統公司、中國聯想公司、諾基亞、美國On2技術公司、德國西門子、TI公司等的支援; 其許可體系要比MPEG-4單純,公正無差別對待使用者和專利持有者。H.264替代MPEG-4的呼聲很高,除了其高效能外,低額專利費和公正的無差別許 可制度也至關重要。由於技術的日益成熟,半導體廠商已在進行H.264的編碼/解碼LSI的開發。特別是HDD錄影機和DVD錄影機等裝置中,採用 H.264的例項已很多,更引起了半導體廠商的關心。加之,H.264採用的動畫編碼方式和音訊編碼方式具有多樣化特性,今後幾乎將會是全部廠商的主要規格之一。

編碼效率比較

Codec

MPEG-4

H.263

MPEG-2

H.264

39%

49%

64%

MPEG-4

--

17%

43%

H.263

--

--

31%

編解碼學習筆記(七):微軟Windows Media系列

資料來源於wiki與 http://chaoqunz.blog.163.com/blog/static/6154877720084493941186/

Microsoft 公司主導的音訊視訊編碼系列,它的出現主要是為了進行網路視訊傳輸,現在已經向HDTV 方面進軍,開發了 WMV HD 應用。WMV(Windows Media Video)是微軟公司開發的一組數字視訊編 解碼格式的通稱,它是Windows Media架構下的一部分。它最初是為低速率流媒體應用作為專有編解碼開發出來的,但是2003年微軟公司基於Windows Media Video第9版編解碼起草了視訊編解碼規範並且提交給SMPTE申請作為標準。這個標準在2006年3月作為SMPTE 421M被正式批准,這樣Windows Media Video 9編解碼就不再是一個專有的技術。早期的變解碼版本(7和8)仍然被認為是專有技術,因為它們不在SMPTE 421M標準的涵蓋範圍內。

微軟媒體系列分為WMV(Windows Media Video)和WMA(Windows Media Audio),說白了就是微軟的視訊和音訊。

容器

視訊流通常與Windows Media Audio音訊流組合在一起並且使用副檔名為.wmv或者.asf的Advanced Streaming Format的檔案進行封裝。WMV通常使用Advanced StreamingFormat(ASF) 封裝,它也可以使用AVI或者Matroska格 式封裝。如果是AVI封裝的檔案結果檔案可以是.avi,如果是ASF封裝的話則是.wmv或者.asf, 如果是MKV封裝的話則是.mkv。當使用VirtualDub編 碼器編碼和WMV9 VCM編解碼實現的時候WMV可以儲存在AVI檔案中。用於Mac的微軟公司媒體播放器不支援所有的WMV編碼的文 件,因為它只支援ASF檔案 封裝,Flip4Mac和QuickTime或 者用於MacOSX的MPlayer可 以播放更多的檔案。

WMV

副檔名: .wmv 
網際網路媒體型別: video/x-ms-wmv 
統一型別標識: com.microsoft.windows-?media-wmv 
開發者: 微軟公司 
格式: 數字視訊

WMV(Windows Media Video)是微軟公司開發的一組數字視訊編解碼格式的通稱,它是Windows Media架構下的一部分。它最初是為低速率流媒體應用作為專有編解碼開發出來的,但是2003年微軟公司基於Windows Media Video第9版編解碼起草了視訊編解碼規範並且提交給SMPTE申請作為標準。這個標準在2006年3月作為SMPTE 421M被正式批准,這樣Windows Media Video 9編解碼就不再是一個專有的技術。早期的變解碼版本(7和8)仍然被認為是專有技術,因為它們不在SMPTE 421M標準的涵蓋範圍內。

WMV不是僅僅基於微軟公司的自有技術開發的。從第七版(WMV1)開始,微軟公司開始使用它自己非標準MPEG- 4 Part 2。但是,由於WMV第九版已經是SMPTE的一個獨立標準(421M,也稱為VC- 1),有理由相信WMV的發展已經不像之前那樣是一個它自己專有的編解碼技術。現在VC-1專利共享的企業有16家(2006年4月),微軟公司也是 MPEG-4 AVC/H.264專利共享企業中的一家。

正式名稱

FourCC

Codec版本

描述

Windows Media Video v7

WMV1

0

 

Microsoft MPEG-4 Video Codec v3

MP43

1

 

Windows Media Video v8

WMV2

2

 

Microsoft MPEG-4 Video Codec v2

MP42

3

 

Microsoft ISO MPEG-4 Video Codec v1

MP4S

4

 

Windows Media Video v9

WMV3

5

 

Windows Media Video v9 Advanced Profile

WMVA

6

deprecated as not VC-1 不完全相容。

Windows Media Video v9 Advanced Profile

WVC1

7

VC-1完整支援

FourCC全稱Four-Character Codes,是由4個字元(4 bytes)組成,是一種獨立標示視訊資料流格式的四位元組,在wav、avi檔案之中會有一段FourCC來描述這個AVI檔案,是利用何種codec來 編碼的。因此wav、avi大量存在等於“IDP3”的FourCC。

Microsoft MPEG-4 v1/v2/v3

常見的有1.0、2.0、3.0三種版本,是基於MPEG-4技術的,其中3.0並不能用於AVI的編碼,只能用於生成支援“視訊流”技術的ASF檔案。

Microsoft MPEG-4 version 1 
是微軟基礎的視訊編碼,是非標準的MPEG-4,與MPEG-4 Part2不相容。FourCC:MPG4

Microsoft MPEG-4 version 2 
VFW的基礎編解碼。與V與MPEG-4Part2不相容。VFW(Video for Windows),是微軟推出的關於數字視訊的一個軟體開發包,VFW的核心是AVI檔案標準。AVI(AudioVideo Interleave)檔案中的音、視訊資料幀交錯存放。圍繞AVI檔案,VFW推出了一整套完整的視訊採集、壓縮、解壓縮、回放和編輯的應用程式介面 (API)。由於AVI檔案格式推出較早且在數字視訊技術中有廣泛的應用,所以VFW仍然有很大的實用價值,而且進一步發展的趨勢。在VC++開發環境中 呼叫VFW和使用其它開發包沒有什麼不同,只是需要將VFW32.lib 檔案加入工程中,但在開放視訊捕捉與壓縮管理程式時需要其它軟體硬體設定。VFW為AVI檔案提供了豐富的處理函式和巨集定義,AVI檔案的特點在於它是典 型的資料流檔案,它由視訊流、音訊流、文字流組成。所以對AVI檔案的處理主要是處理檔案流。FourCC:MP42

Microsoft MPEG-4 version 3 
VFW的基礎編解碼。與V與MPEG-4Part2不相容。最終只用於ASF檔案。FourCC:MP43

除此之外: 
Microsoft ISO MPEG-4 version 1 
基於DirectX Media Objects (DMO)-based編解碼,與MPEG-4 SP(Simple Profile)相容 。FourCC:MP4S。

Microsoft ISO MPEG-4 version 1.1 
與MPEG-4 ASP(AdvancedSimple Profile)相容。FourCC:M4S2

目前在Windows平臺上比較實用的MPEG-4視訊編解碼器主要有:由微軟公司開發的Microsoft MPEG-4 Codec v1/v2 /v3,主要是配合微軟公司的流媒體技術使用;在Microsoft MPEG-4 v3的基礎上,由DivXNetworks公司開發的 DivX Codec;在OpenDivX的基礎,遵循GPL開發的開源XviD Codec。
這些codec在windows中以dll方式呈現。

Windows Media Video 7

是DirectXMedia Objects (DMO)-based codec。Microsoft 正式開發的 第一個 Windows Media Video,開始脫離了MPEG-4,和MPEG-4 不相容,從這一點上可見微軟的野心(微軟公司開始使用它自己非標準MPEG-4Part 2)。可惜這個版本壓縮效果非常爛,打破了微軟一飛沖天的美夢,不過它在壓縮速度上非常快,現在網路上有很多采用這種格式壓縮的 WMV。FourCC:WMV1

Windows Media Video 8

在WMV7 基 礎上改進的版本,質量上面進不了不少。是DMO-based codec。FourCC:WMV2.

Windows Media Video 9

微軟的重頭戲,不光是這一個編碼,V9 系列更是一個平臺,讓微軟有足夠的能力挑戰 MPEG,ITU 等標準化組織。雖然這個版本並沒有微軟吹得那麼厲害,特別 是低位元速率下比較差,不過跟以前版本相比進步還是非常多的。特別是 WMV HD 的應用,讓微軟也躋身視訊標準領域。
DMO-based codec. Video for Windows (VfW/VCM) version also available. FourCC:WMV3

Windows Media Video 9 Advanced Profile

在WMV4的Simple和Main profile levels與VC-1標準中的是相同的。VC-1中的AdvancedProfile採用一個新的WMV編解碼,稱為WindowsMedia Video 9 Advanced Profile。它提高隔行掃描的內容壓縮,並與傳輸無關,使得他可以封裝在MPEG的傳輸流(TS)中或者採用RTP傳輸。它與之前的WMV9的 codec是不相容的。

隨著 Windows Media Player 10 推出的編碼器,能夠更進一步控制WMV9 的質量。但是不能在老版本的 WMP9 上播放,也就是不相容老版本的 WMP9,真不知微軟在搞什麼?

FourCC:WVC1,VC-1相容。FourCC:WMVA,不推薦使用非VC-1相容方式。我們可以認為WMV9與VC-1相容。

Windows Media Video 9 Screen

靜態螢幕無失真壓縮編碼,質量非常好,壓縮率高,只針對如螢幕等變化非常小的環境。WMV Screen是一個screencast編解碼器,它可以捕抓動態的螢幕內容,將第三方抓屏程式轉換到WMV9 Screen檔案中。用於之一是計算機的step-by*step演示視訊,第一版本是WMV7 Screen,第二個版本也就是當前的版本是WMV9 Screen,支援CBR和VBR。

Windows Media Video 9 Image

靜態影象壓縮編碼。WMV Image是一個視訊幻燈片的編碼器,播放多個畫面時可根據時間進行平移和過度效果展現。與WMV9相比,具有高壓縮率和高態影象質量。由於編解碼依賴解 碼器(播放器)生成實施視訊幀,播放WMV Image檔案(即使在普通的1024×768,30fps)要求很高的處理能力。在最新的版本,WMV9.1 Image,使用Photo Story3提高轉換效果,耽於原來的WMV9 Image不相容。

視訊質量

微軟宣稱WMV9提供的壓縮率為MPEG-4的2倍,MPEG-2的3倍。微軟還宣稱WMV9的壓縮效率筆WMV8高15%~50%。但是在2005年的一個測試報告中,顯示WMV9的壓縮效率比WMV8要差。

Windows Media Player 10 Mobile

在wiki上,我們注意到“Windows Media Player 10 Mobile”,顯示WMV10將用於移動,可能是Windows Mobile。但是我們沒有查到進一步的資料。

WMA

副檔名 .wma 
網際網路媒體型別 audio/x-ms-wma 
統一型別標識 com.microsoft.windows-?media-wma 
開發者 微軟 
格式 數字音訊

WMA(Windows Media Audio)是微軟公司開發的一種數字音訊壓縮格式。一些使用Windows Media Audio編碼格式編碼其所有內容的純音訊ASF檔案也使用WMA作為副檔名。WMA格式為微軟公司私有,但是隨著蘋果公司的iTunes對它的支援,這 個格式正在成為MP3格式的競爭對手。它相容MP3的ID3後設資料標籤,同時支援額外的標籤。

WMA可以用於多種格式的編碼檔案中。應用程式可以使用Windows MediaFormat SDK進行WMA格式的編碼和解碼。一些常見的支援WMA的應用程式包括Windows Media Player、Windows Media Encoder、RealPlayer、Winamp等等。其它一些平臺,例如Linux和移動裝置中的軟硬體也支援此格式。

WMA 7之後的WMA支援證照加密,未經許可(即未獲得許可證照),即使是非法拷貝到本地,也是無法收聽的。同時,微軟公司開始時宣稱的:同檔案比MP3體積小 一倍而音質不變,這也得到了兌現。另外,微軟公司在WMA 9大幅改進了其引擎,實際上幾乎可以在同檔案同音質下比MP3體積少1/3左右,因此非常適合用於網路流媒體。

跟MP3相比,WMA在高位的音質渲染力明顯不足,甚至還比MP3更差;與MP3相同,通常的WMA也是有損資料壓縮的檔案格式,對於有更高要求的使用者來說WMA並不是一個適合的格式。但在WMA9版本開始支援無失真壓縮——Windows Media Audio 9 Lossless(在安裝WMP11或Windows Media Format 11之後升級至9.1,無失真壓縮版本最高支援5.1聲道編碼)。此外WMA也與MP3一樣同為有專利版權的檔案格式。支援的裝置需要購買使用版權。

Windows Media Audio v1/v2

微軟最早的音訊編碼技術,用於 ASF 中,後來被破解也用在 DivX Audio 中,質量比較差。

Windows Media Audio 7/8/9

隨著各種不同的 WMV 而推出的相應的音訊編碼,質量節節提升,不過還沒有達到 64kbps CD音質的神化。

Windows Media Audio 9 Professional

WMA9 中 出現的新編碼,主要用於多聲道編碼和高取樣率音訊的編碼,質量不錯。

Windows Media Audio 9 Voice

針對語音的編碼,最高 20kbps ,不過和 AMR 相比,效果就太差了。

Windows Media Audio 9 Lossless

無損音訊編碼,可以完美保留CD原質量,是CD備份的不錯選擇,不過代價是體積過大。

VC-1

VC-1,全名VC-1視訊編解碼器(Video Codec 1),是基於微軟WMV9,並推廣為工業標準。2003年提出標準化申請,最早名字是VC-9。2006年4月正式通過成為標準。VC-1是SMPTE 421M視訊編解碼標準的正式名稱。HD DVD 和藍光光碟(Blu-ray Disc)都支援VC-1。微軟表示Windows Vista將支援VC-1影像壓縮技術的HD DVD規格。電影及電視學會(SMPTE)已採用VC-1為視訊壓縮標準。

VC-1是基於Windows Media Video 9壓縮技術的影像壓縮標準,由三大編解碼元件所組成,每一個編解碼元件都具有其獨自的FourCC編碼。

WMV3 :

即WMV9。VC-1的Simple和Main這兩種Profile就是WMV3應用,使得與WMV 9相容,支援逐行掃描編解碼。隔行掃描的編解碼也提供,但在很快地,在微軟推出WMVAdvanced profile後,不推薦採用。逐行掃描編解碼用於YUV4:2:0,隔行的(不推薦)用於YUV4:1:1。

WMV3用於高質量的視訊和流媒體。同樣的質量,它只是MPEG-2的頻寬的1/2~1/3。在商業上用於高清電影和視訊的WMV HD,編碼為WMV3 Main Profile @ High Level(MP@HL)。

WMVA :

它是在WMV Advanced Profile被SMPTE吸收為作為VC-1草案之間出現的。它與WVC1之間細微的差役,因此解碼器也不一樣,2006年起,WMVA被認為是個過時的編碼,因為與VC-1不完全相容。

WVC1 :

也就是WMV 9 Advanced Profile,實現了個更新的,完全符合的AdvancedProfile的VC-1編碼標準。它支援隔行掃描內容,與底層傳輸無關。

壓縮技術整合了MPEG及H.264之優點,採用Biliner和Bicubic方式,次畫素(Sub- Pixel)最小可達4分之1畫素。VC-1只有4種動作補償(motion composition),壓縮比無法勝過H.264。VC-1在壓縮時間上,明顯比H.264短了許多,複雜度約只有H.264的50%,對特效電影有 很傑出的效能表現。由於H.264 使用較小尺寸的轉換公式與無法調整的量化矩陣,造成不能完整保留影像的高頻細節資訊。

wiki上有一篇 VC-1和H.264比較 的文章,很值得看一看。我看到這樣的一個段:

VC-1:需付費。Reference decoder 並非免費,不過附贈外部檔案

H.264:免費.Reference encoder 和 decoder 也是免費。此外,核查小組及M4IF郵寄名單可在一個可能會收到回答了AVC的有關問題。

除此之外,我們在Google上search H.264 license中也看到了說free的字樣。但是,果真如此嗎?

版權問題

我一直認為H.264是需要付費的,因此我對上面的表述不確定是否正確。我上網查了一下:也看到“H.264的基本系統無需使用版權 ,具有開放的性質,能很好地適應IP和無線網路的使用,”的字樣。基於這些疑問,我上網查了一下。IP總是個麻煩的問題,最好向Andriod那樣,提供平臺,版權,產品維護都是手機生產廠家的事情。

MPEG LA公司是世界領先的替代技術特許服務提供商,它使使用者能夠通過單筆交易從多個專利持有人那裡購買某項技術標準或平臺所必須的全球專利權,而不必分別洽談各項特許權。只要獨立管理的一站式專利特許權能夠開啟方便之門、幫助使用者推廣某項技術, MPEG LA公司率先採用的特許模式就能提供解決方案。MPEG LA公司的特許權之一就是MPEG-2數字視訊壓縮,這一技術幫助產生了消費電子歷史上應用最為廣泛的標準。包括57個國家逾870個MPEG-2基本專利的MPEG-2專利組合特許權擁有至少1500家被許可人,覆蓋目前全球市場上的大多數MPEG-2產品,包括機頂盒、DVD播放器、數字電視機、個人 電腦和DVD視訊光碟。作為獨立特許經營管理人,MPEG LA公司不與任何標準管理機構相關聯,也不是任何專利權持有人的關聯人。欲瞭解更多資訊,請登入http://www.mpegla.com。 (http://www.dvbcn.com/2010-01/28-44547.html

我去MEPG-LA網上查閱,發現有AVC/H.264,也就是說這個是需要付費的。在資料中有下面的一張PPT。:

我不是很看得的懂,比如一個H.264的片子,是提供下載片子的內容供應商付錢,還是提供解碼器的終端裝置商需要付費?又例如使用H.264進行視訊電話,小於12分鐘不收費,大於12分鐘收費?混亂啊。因此智慧財產權這攤事,還是留個專業的法律人士來負責。

編解碼學習筆記(八):Real系列

下面資料從wiki中整理獲取。

Real系列是RealNetworks提供的,分為RealVideo和RealAudio。

RealVideo

RealVideo是一種影片格式由RealNetworks於 1997年所開發,至2006年時已到RealVideo版本10。它從開發伊始就定位為應用為網路上視訊播放上的格式。支援多種播放的平臺,包含 Windows、Mac、Linux、Solaris以及某些行動電話。相較於其它的視訊編解碼器,RealVideo通常可以將視訊資料壓縮得更小。因此它可以在用56Kbps MODEM撥號上網的條件實現不間斷的視訊播放。

一般的副檔名為.rm/.rvm,現在廣泛流行的是rmvb格式,即動態編位元速率的real video。

RealVideo早期使用H.263,在RealVideo8及之後公司採用私有或者不公開的視訊格式。官方的的播放器是 RealNetworks RealPlayer SP,最新的版本是v12,在多個平臺,包括Windows,Macintosh,和Linux中提供。RealNetworks公司同時也開發了開源的 Helix播放器,但是在Helix專案中沒有提供RealVideo,因為Real系列的編解碼仍是不公開的。

RealMedia檔案可以通過RTSP在網路上傳輸,但是RTSP只用於建立和管理連線,真正的視訊資料是通過 Real自己私有的 RDT(Real Data Transport)協議傳輸。這種方式引起很大的批評,因為難以在其他播放器和伺服器中使用RealVideo,現在一些開源專案,例如MPlayer 已經可以播放RDT流。為了支援實時流,RealVideo和RealAudio通常採用CBR(恆定碼速)編碼,使得每秒傳遞的資料相等。後來,公司開發了可變碼速,成為RealMedia Variable Bitrate(RMVB),提供更高的水平資料,但是這種格式不適合作為流,因為難以預測某個特定的媒體流需要多少網路資源。帶有快速移動和場景變化的視訊需要更高的碼流,如果碼流超出網路所能提供的速率,將會引起中斷。

RealNetworks公司說RealVideo和RealAudio編解碼的原始碼不在RPSL的許可內。在許可原始碼在不支援的處理器和作業系統的商用移植中許可。雖然公司擁有大多數的智慧財產權,但是允許第三方為某個特性享有版權。

RealVideo 1.0

RealVideo的第一個版本在1997年釋放,是基於H.263格式。在RealPayer5中提供。FourCC為rv10,rv13

RealVideo G2和RealVideoG2+SVT

也是就要H.263,在RealPlayer6中提供。質量比較糟糕。FourCC為rv20

RealVideo 8

隨著 RealPlayer 8 推出的視訊格式,是現在主流的網路視訊編碼之一。編碼速度較慢,質量也只能算一般。猜測是基於早期的H.264 draft,在RealPlayer 8中提供,FourCC為rv30。

RealVideo 9

RealNetworks 開 發的新一代編碼,質量進步了很多,特別是在底位元速率下,而且編碼速度很快,做到了速與質的很好統一。
猜測是基於H.264,在RealPlayer9中提供。FourCC為rv40.

RealVideo 10

在RealVideo 9 基 礎上加入了一些引數,如 EHQ 等,更加精確控制位元速率,和 RealVideo 9 相容。在RealPlayer10中提供,FourCC為rv40(與RealVideo9相同)

RealAudio

檔名擴充套件: .ra, .ram

Internet media type:audio/vnd.rn-realaudio,audio/x-pn-realaudio

RealAUdio是RealNetwoks公司私有的賓朋編解碼格式,最早在1995年釋放。它包括一系列的音訊編解碼,從古老撥號modem的 低速率格式到高質量的音樂。可用於媒體流,過去很多的網際網路電臺使用RealAudio作為他們節目的實時音訊流,近年使用得較少,讓位與其他流行的格 式。

RealAudio檔案字尾為.ra。1997年,公司開始提供視訊格式成為RealVideo。將音訊和視訊合併是以哦那個的容器字尾為.rm。然而,最新的版本,使用.ra用於音訊檔案,使用.rv用於帶或不帶音訊的視訊檔案,用.rmvb用於可變速率的視訊檔案。

.ram(Real Audio Metadata)和.smil(SynchronizedMultimedia Integration Language)檔案格式用於流媒體中的連結。在很多情況下,網路並不直接連結一個RealAudio檔案,而是連結.ram和.smil檔案。這是一 個很小的文字檔案,包括音訊流的連結。當使用者點選一個連結,網路瀏覽器下載.ram和.smil檔案,並載入使用者的媒體播放器,媒體播放器從檔案中讀取 pnm或者rtsp的URL,並開始播放流。

RealAudio檔案包括多種音訊編解碼,每個編解碼都是用FourCC(Four Character Code)來表示,介紹如下:

  • lpcJ: IS-54 VSELP (RealAudio 1)
  • 28_8: G.728 LD-CELP (RealAudio 2)
  • dnet: Dolby AC3 (RealAudio 3)
  • sipr: Sipro Lab Telecom ACELP-NET (RealAudio 4/5)
  • cook: G2/Cook Codec (RealAudio 6)
  • atrc: Sony ATRAC3 (RealAudio 8)
  • raac: MPEG-4 LC-AAC (RealAudio 9)
  • racp: MPEG-4 HE-AAC (RealAudio 10)
  • ralf: RealAudio Lossless Format (RealAudio 10)

編解碼學習筆記(九):QuickTime系列

副檔名 .mov,.qt
網際網路媒體型別 video/quicktime
型別程式碼 MooV
統一型別標識 com.apple.quicktime-movie
開發者 蘋果公司
格式  媒體容器
專門屬 音訊、視訊、文字

  或者標題可以改為Apple系列。QuickTime 並不是一個編碼,而是一個多媒體平臺,它的上面有眾多編碼,這裡只針對幾個主流的編碼器。
  QuickTime技術擁有三種主要的元件:

  • 媒體播放器,蘋果計算機在他自己的網站免費讓人下載以及內建在他的計算機中。
  • QuickTime 檔案格式-公開檔案並且任何人都可以使用,不須權利金。
  • 軟體開發工具可用於Macintosh和Windows平臺。這些工具允許人們開發他們自己的軟體來操作QuickTime以及其它媒體檔案。這些對已註冊開發人員是 免費的(註冊免費)。

  蘋果在Mac OS和Windows平臺推出免費之官方媒體播放軟體,名字為"QuickTime Player"(早期的版本簡單地使用  了"MoviePlayer"這個名稱)。這個播放器也包含一些媒體編輯和媒體創作的特色,但是使用者必須從 Apple購買序列號來開啟這些功能,把這個播放器轉變為"QuickTimePro"。

QuickTime歷史:1991年到1998年:1.x- 2.x

  蘋果電腦於1991年12月2日釋出第一個QuickTime的版本,作為System 7上的多媒體附加功能。QuickTime的首席開發者,Bruce Leak,於1991年五月的Worldwide Developers Conference做了第一次的公開展示。他在Mac上展示蘋果電腦有名的1984電視廣告,在那時候是一種令人印象深刻的突破。Microsoft的 競爭技術-Video for Windows- 在1992年11 月之前都還未出現。

  第一個版本的QuickTime制定的基本架構,到現在基本上還存在未更改,包含多重電影軌道,可擴充的媒體形態支援,一種開放的檔案格式,以及完整的編輯功能。原本的視訊codec包含:

  • Apple視訊codec(也稱作"Road Pizza"),適合普通現場動作影象。
  • 動畫codec,使用簡單的run-length圖形壓縮方式,適合卡通形態的大區域顏色很適合。
  • 圖形codec,對於每一點8位(8-bit-per-pixel)的影象優化,包含有抖色en:dithering的圖形。

  蘋果電腦在1992年後期發放了Mac作業系統的1.5版本。

  蘋果電腦在1994年二月釋出了QuickTime 2.0 for Mac OS版--這個是唯一的一個不免費的版本。在這個版本中加入了對音樂軌跡的支援,音樂軌跡相當於MIDI的資料,這個功能可以驅動sound- synthesis引擎自我建立於QuickTime中(使用的聲音許可證來自Roland),或者是任何外部的MIDI裝置,因此建立出來的聲音只佔用 一小部分的電影資料。

  在接下來的2.1和2.5版本中,QuickTime繼續免費。工程師改良了對音樂的支援並增加了sprite軌跡,這個功能可以實現建立複雜的動畫,檔案大小就只比靜態的圖片大一點。

  QuickTime 2.0 for Windows釋出於1994年11月。

QuickTime歷史:1998 - 2001: 3.0 and 4.0

  執行於Mac OS的QuickTime 3.0於1998年3月30日發行。其現有的功能是免費的,但如果要獲得Apple所提供的具有更多特性的QuickTime Player和Picture Viewer程式,終端使用者需要通過購買一個QuickTime Pro 許可證來解除對軟體的限制。

  QuickTime 3.0增加了支援影象匯入的元件,從而可以從GIF、JPEG、TIFF和其他檔案格式中讀取影象。而通過FireWire主要作為視訊資料輸出的視訊輸 出元件同樣增加了視覺效果,使程式設計師可以把實時技術運用到視訊軌道中。一些效果甚至可以響應使用者的滑鼠單擊,就像是電影本身的互動支援一樣。

  蘋果於1999年6 月10日發行了QuickTime 4.0 for Mac OS。它增加了影象匯出元件,支援輸出成與預匯入者可以閱讀的相同格式的非GIF格式(或許是因為LZW許可)。它增加了Sorenson video codec的第一個版本,並且支援streaming。

  QuickTime 4.1於2000年伊始釋出,增加了在Mac OS 9及後續版本中播放超過2G的電影;並且終止了對68K Mac的支援。使用者獲得了操作QuickTime Player viaAppleScript的能力。

QuickTime歷史:2001 - present 5.0 and later 
  QuickTime 5.0 for Mac OS於2001年4月23日出現。它增加了"皮膚"功能和多處理影象壓縮支援。在這一版本中只有擁有QuickTime Pro許可證的使用者才可以使用全屏模式,這一做法引起了爭議,至今尚未解決。

QuickTime歷史:QuickTime 6.x 
  QuickTime 6.0 for Mac OS,於2002年7月15日釋出,第一次包括Mac OS X使用的版本。

更新至QuickTime 6

釋出日期

版本

平臺

特色

2002 年 7 月15 日

QuickTime 6

Mac OS 8.6 –Mac OS X ,Windows

MPEG-2 、MPEG-4 以及AAC

2003 年 1 月14 日

QuickTime6.1

Mac OS X

品質與效能的增進

2003 年 3 月31 日

QuickTime 6.1

Windows

修正CAN-2003-0168 安全性弱點

2003 年 4 月29 日

QuickTime 6.2

Mac OS X

對於iTunes 4 的支援、增進的AAC 支援

2003 年 6 月3 日

QuickTime 6.3

Mac OS X, Windows

3GPP 與AMR

2003 年 10 月16 日

QuickTime 6.4

Mac OS X, Windows

Pixlet 編碼解碼器、整合3GPP

2003 年 12 月18 日

QuickTime 6.5

Mac OS X, Windows

3GPP2 與AMC 移動式多媒體格式

2004 年 4 月28 日

QuickTime 6.5.1

Mac OS X, Windows

Apple Lossless

2004 年 10 月27 日

QuickTime 6.5.2

Mac OS X, Windows (對Windows 98/Me 的最後一個版本)

修正程式錯誤、安全性更新、以及品質與效能的增進

2005 年 10 月12 日

QuickTime 6.5.3

Mac OS X v10.2.8

 

QuickTime歷史QuickTime 7.x

  更新至QuickTime 7。

更新至QuickTime 7

釋出日期

版本

平臺

特色

2005 年 5 月31 日

QuickTime 7.0.1

Mac OS X

修復一個關於Quartz Composer 外掛模組 的安全性問題

2005 年 7 月15 日

QuickTime 7.0.2

Mac OS X

修復程式錯誤與相容性的增進

2005 年 9 月7 日

QuickTime 7.0.2

Windows 2000 /XP

第一個非預覽版本釋出

2005 年 10 月12 日

QuickTime 7.0.3

Mac OS X & Windows 2000 /XP

流 與H.264 的程式錯誤修復。
需要通過iTunes Music Store 支援視訊的購買。

2005 年 10 月29 日

QuickTime 7.0.3.50

Windows 2000 /XP

 

2006 年 1 月10 日

QuickTime 7.0.4

Mac OS X & Windows 2000 /XP

第一個通用二進位制 版本。
眾多的程式錯誤修復與H.264 效能的改善。

2006 年 5 月11 日

QuickTime 7.1

Mac OS X & Windows 2000 /XP

眾多的程式錯誤修復、對於iLife '06 的支援、以及H.264 效能的改善

2006 年 5 月31 日

QuickTime 7.1.1

Mac OS X

 

2006 年 6 月28 日

QuickTime 7.1.2

Mac OS X

Addresses an issue previewing iDVD projects.

2006 年 9 月12 日

QuickTime 7.1.3

Mac OS X & Windows 2000 /XP

程式錯誤修復與嚴重的安全性問題。

  現時QuickTime的最新版本是QuickTime 7.6,但Windows 2000可以使用的最高版本卻是7.1.6。在7.5.5之前的版本,都存在Cross site scriping的安全性問題。
QuickTime的歷史:QuickTime X

  QuickTime X(讀作Quicktime Ten,當中 的"X"是羅馬數字的十)是下一世代的QuickTime,在2008年6 月9日的WWDC上 發表。產品預期會在2009年的年中隨同Mac OS X v10.6推出[3]。Version X會使用與iPhone OS相同的媒體技術,並支援更新的編碼及更具效益的媒體播放功能。
Sorenson Video

Sorenson Video 2:

Sorenson Media 公 司開發的編碼器,主要用於QuickTime 4 的視訊編碼,質量較差。

Sorenson Video 3:

Sorenson Media 公 司隨 QuickTime 5釋出的編碼器,質量很不錯,已經成為 QuickTime 的標準視訊編碼,網路上大部分電影預告片都採用這種編碼。

Apple MPEG-4

  Apple 公司自己開發的 MPEG-4 編碼器,隨 QuickTime 6 釋出,質量很差。

Apple H.264

  Apple 公司自己開發的 H.264 編碼器,隨 QuickTime 7 釋出,支援 HDTV。

Audio QDesign Music

QDesign Music 1

QDesign 公司開發的音訊編碼器,這個版本現在已經開不到它的身影了。

QDesign Music 2

QDesign Music 的 第二個版本,也是最後一個版本,在時下這些先進的音訊編碼面前,它已經沒有生命力了,主要應用於網上的電影預告片。

Audio Apple MPEG-4 AAC

  Apple 公司自己開發 的 AAC 編碼器,質量非常好,是最優秀的 AAC 編碼器之一,隨 QuickTime 6 釋出。

Apple Lossless

  Apple 公司開 發的無損音訊編碼,主要應用於 iTunes 抓取 CD。Apple Lossless(AppleLossless Audio Codec、ALAC)為蘋果的無損音訊壓縮編碼格式。 在 iTunes 上名稱為 Apple Lossless。

  可將非壓縮音訊格式(WAV、AIFF)壓縮至原先容量的40%至60%左右,編譯碼速度很快。也因為是無失真壓縮,聽起來與原檔案完全一樣,不會因解壓縮和壓縮而改變。

  它在2004年4月28日公佈的iTunes4.5和QuickTime6.5.1 的其中一部份。目前攜帶型數字多媒體播放器中只有 iPod 可播放。

  雖為非自由軟體或開放原始碼軟體、但 Apple Lossless 的開放原始碼譯碼器已經釋出。

注:上述材料來源於wiki的整理。

編解碼學習筆記(十):Ogg系列

Ogg是一個自由且開放標準的容器格式,由Xiph.Org 基金會所維護。Ogg格式並不受到軟體專利的限制,並設計用於有效率地串流媒體和處理高質量的數字多媒體。

  Ogg意指一種檔案格式,可以納入各式各樣自由和開放原始碼的編解碼器,包含音效、視訊、 文字(像字幕)與後設資料的處理。

OggTheora

  Theora是一個免權利金、開放格式的有損影像壓縮技術,由Xiph.Org基金會開發,該基金會還開發了著名的聲音編碼技術Vorbis, 以及多媒體容器檔案Ogg。Theora 是由 On2Technologies 公司專屬的 VP3 編碼器經過開放原始碼後衍生而來。Theora 的命名來自於一個電視節目Max Headroom。

  Theora是一個可 變位速率、以DCT為基礎的影像壓縮格式。和多數的影像編碼格式一樣,Theora 使用了色度抽樣、block basedmotion compensation 和 8×8 DCT block,也支援視 訊壓縮影象型別和 視 訊壓縮影象型別,但是不支援使用在 H.264 和 VC-1 的 bi-predictive frames(B-frame),Theora 也不支援 隔 行掃描, variable frame rates, 或 bit-depths larger than 8 bits per component。

  Theora 的影像流可以儲存在任何的容器檔案格式中,最常用的是和聲音編碼Vorbis一起儲存在Ogg檔案格式中,這種方式可以提供完全開放、免權利金的多媒體檔案。此外Theora影像也可以儲存在Matroska檔 案中。

  Google官方blog稱,Web視訊目前沒有一個標準,有些網站使用Flash,但這要求使用者有Flash播放 器;有些使用Java播放器,但為了在JVM虛擬機器中解碼視訊和音訊使用者需要一個配置很高的機器;等等諸如此類。

  好訊息是新一代的 HTML 5標準引入了視訊元素,Web開發者可以用一種標準的方式指定視訊的外觀。現在問題變成了使用哪一種視訊格式。

  Google 認為開放標準格式可以成為目前無序的視訊格式之爭的底線。最後的權益方案不需要最複雜的格式,或者是最大張旗鼓宣傳,幾乎已成為行業標準的格式,因此他們決定選擇支援使用廣泛的開源Ogg Theora格式。

  Theora是On2 Technologies 公司的 VP3 編碼器的開源衍生版,Google於去年收購了On2公司。

  資料來源:http://tech.it168.com/a2010/0412/872/000000872493.shtml

  在2002年3月,On2將許可改為下週VP3開原始碼為LGPL。在2002年6月,On2將VP3作為 Xiph.Org僅僅和下的一個類似BSD的開源許可。On2還制定了一個不可更改的免版權費的宣告,任何人可以用於任何軟體,任何的衍生產品以及任何目 的。2002年88月,On2與Xiph.Org簽訂一項協議,將VP3作為一個新的,免費的視訊編解碼,成為Theora。On2宣稱Theora是 VP3的一個繼任者。在2002年10月3日,On2和Xiph宣佈Theora最早的Alpha程式碼釋放。

  位元流格式在2004年凍結(version 1.0 alpha3),有經過了幾年的beta版本,Theora第一穩定版本(v1.0)在2008年11月釋放。Theora任何版本的視訊編碼在格式凍結後都與未來的播放器相容。目前的工作集中在“Thusnelda”分支的bug修復,目前為beta版本,將最後作為Theora1.1版本釋放。

  Theora視訊壓縮格式基本上與VP3視訊壓縮格式相容,包含一個後先相容的超集。Theora是VP3和 VP3流(有小量語法修訂)的超集,VP3流可以不經過重新壓縮改為Theora流,但是反過來把成立。VP3視訊壓縮可以由Theora來實現解碼,但 是Theora視訊演示通常不能夠使用古老的VP3來進行解碼。

  Theora將視訊格式建立在開源的基礎上,並作為基百科視訊內容選擇的編碼格式。然而,Theora缺少商業支援,並正努力獲取分銷商尤其是網路分銷商接受。

  Mozilla使用這項技術在Firefox上提供HTML5視訊。蘋果和微軟的HTML5視訊都準備採用 MPEG LA管理的H.264。該團體的成員包括微軟和蘋果,及許多科技公司。

  這裡面的爭議關鍵在於license的問題,H.264是需要給license的。

  Mozilla則發出以下宣告:“我們相信,HTML5視訊在多方、開放和無權利金的編/解碼器,以同於W3C 授權標準之方式支援下,才符合公眾利益。如 果MPGA LA願意根據W3C標準定義的開放網路條件提供H.264,我們絕對會考慮採用這項技術。本組織堅持我們對Theora的立場。”

  Opera技術長Hakon Wium Lie也提供下列宣告;“為了開放網路的成長茁壯,所有媒體(包括視訊),必須在無需支付編/解碼器授權費的前提下使用。真正支援一個開放網路的瀏覽器製造商,必須努力建造一個無授權費的基本影音編/解碼器。”

  微軟的公司部落格寫道:“原始碼能否取得,與智慧財產權之間的區別,在於可取用的原始碼是極度必要的。目前,H.264的智慧財產權,可通過MPEG LA管理的一個定義明確的方案取得。其它編/解碼器的權利通常較不清楚。”

Ogg Vorbis

Ogg 的音訊編碼, 質量非常優秀,特別是低位元速率下,支援多聲道。最高位元速率能夠達到500kbps,是 AAC 的有力競爭者。

  「Ogg」這個詞彙通常意指Ogg Vorbis此一音訊檔案格式,也就是將Vorbis編碼的音效包含在Ogg的容器中所成的格式。在以往,.ogg此一副檔名曾經被用在任何Ogg支援格 式下的內容,但在2007年,Xiph.Org基金會為了向後相容的考慮,提出請求,將.ogg只留給Vorbis格式來使用。Xiph.Org基金會決定創造一些新的副檔名和媒體格式來描述不同型別的內容,像是隻包含音效所用的.oga,包含或不含聲音的影片(涵蓋 Theora)所用的.ogv和程式所用的.ogx。

  Vorbis的是一個 開源自由軟體 專案負責人是 Xiph.Org基金會。該專案產生的數位音訊格式規範和軟體實施(編譯碼器)為有損音訊壓縮。 Vorbi是最常用的結合與Ogg容器格式,因此通常被稱為 Ogg Vorbis格式.

  Vorbis是一個延續的音訊壓縮的開發始於 1993年克里斯蒙哥馬利.集約發展始於1998年9月後,信弗勞恩霍夫協會 該公司宣佈將收取許可費為 MP3音訊格式。Vorbis的專案開始作為公司的一部分,Xiph.Org 基金會的Ogg專案(也稱為 OggSquish多媒體專案)。克里斯蒙哥馬利開始工作的專案,並協助越來越多的其它開發商。他們繼續完善原始碼 直到Vorbis的檔案格式被凍結 2000年5月為 1.0 和一個穩定的版本(1.0)的參考軟體釋出於 2002年7月19日。

OggSpeex

  Ogg 的語音編碼,專門針對低位元速率的語音編碼。

Ogg FLAC

Ogg 的無損音訊編碼。

On2 VPX 系列

On2 公司開發了一系列優秀的視訊編碼,現在應用得最多的恐怕是 NullsoftVideo 的視訊,它們就採用了 VP3,VP5,VP6 視訊編碼。

VP3

  已經作為開放原始碼公佈,現在 是 Ogg Theora 專案,當然,Theora 的質量可比 VP3 好多了。

VP4

  On2 公司當年吹牛全球最好的視訊編碼,後來證明質量很一般。

VP5

  至今還很神祕,On2 並沒有放出來,只在 NullsoftVideo 裡面見到他的身影。

VP6

  從一開始,On2 就把這個編碼器提供給大家下載,質量還是不錯的。不過最近似乎又關閉了,主頁上只有一個解碼器。On2 TrueMotion VP6是一個專有的有損視訊編解碼格式和視訊編解碼器。它是TrueMotion視訊編解碼的具體體現,是一系列由On2開發的視訊編解碼,通產個用於 Adobe flash,Flash Video和JavaFX媒體檔案。

VP7

  On2 最新的編碼器,在 VP6 上有不少進步。在2005年1月,On2宣佈推出比VP6有更好的壓縮比的新的編解碼VP7。在2005ian4月,On2公司許可On2視訊編碼器9包 括VP6和VP7)用於Macromedia Flash。在2005年8月,Macromedia宣佈他們選擇VP6作為新的Flash Player8的視訊回放的旗艦式編解碼。

VP8

  Google在2009年收購了On2 Technologies,並於2010年5月19日在Google I/O會議上宣佈將VP8以BSD許可證的形式開源。。VP8是On2 Technologies繼VP3之後宣佈開源的第二個編解碼器。(Xiph.Org 基金會於2002年接手VP3並將之冠名以Theora,之後以BSD許可證的形式將Theora開源)。要求Google將VP8開源的最大呼聲來自於 自由軟體基金會。2010年3月12日,自由軟體基金會給Google發了一封公開信,請求Google逐漸用開源形式的VP8和HTML 5取代YouTube上的Adobe Flash和H.264。

  2010年5月19日,WebM啟動。WebM包含了來自於Mozilla、Opera、Google以及其他四十多家出版商和計算機軟硬體供 應商(包括AMD、NVIDIA)的貢獻,旨在大力倡導在HTML5中使用VP8。InternetExplorer 9在安裝了適合的編解碼器之後也能支援VP8。

注:上述材料來源於wiki的整理。

編解碼學習筆記(十一):Flash Video系列

用於在 Flash 中壓縮視訊。FLV流媒體格式是一種新的視訊格式,它的出現有效地解決了視訊檔案匯入Flash後,使匯出的SWF檔案體積龐大,不能在網路上有效使用等 缺點。一般FLV檔案包在SWF PLAYER 的殼裡,並且FLV可以很好的保護原始地址,不容易被下載到,從而起到保護版權的作用。

  • 檔名: .flv, .f4v, .f4p, .f4a, .f4b
  • 媒體型別:video/x-flv, video/mp4, video/x-m4v, audio/mp4a-latm, video/3gpp, video/quicktime, audio/mp4
  • 廠家:Adobe Systems (originally developed by Macromedia)
  • Type of format: Media container
  • Container for :Audio, video, text, data Extended from
  • 擴充套件:FLV: SWF ,F4V: MPEG-4 Part 12

Flash介紹

  Flash Video是一個檔案容器格式,是Adobe Flash播放器版本6-10用於在網際網路上傳遞視訊。Flash視訊內容也可以封裝在SWF檔案。Flash視訊有兩種不同的檔案格式:FLV和 F4V。FLV檔案中,同SWF檔案一樣音訊和視訊資料採用相同方式進行編碼。晚出現的F4V,它的格式是基於ISO為基礎的媒體檔案格式,並在 Flash Player 9 update 3中開始得到支援。這些格式Adobe Flash播放器都能支援,並由Adobe公司開發,其中FLV最找石油Macromedia公司開發的。

  Flash視訊FLV檔案所包含的媒體的編碼通常採用Sorenson Spark和VP6視訊壓縮格式。最新發布的Flash播放器支援H.264視訊和HE-AAC音訊。所有的這些編解碼目前受到專利的限制。

  Sorenson編解碼看參考以下兩種專用的視訊編解碼:Sorenson Video或者Sorenson Spark。Sorenson Video也被稱為Sorenson Codec,Sorenson Video Quantizer或者SVQ。Sorenson Spark也稱為Sorenson H.263。這些編解碼都是有Sorenson 媒體公司設計(及以前的Sorenson Vision公司)。Sorenson Video在Apple的QuickTime中使用,SorensonSpark在Adobe Flash(以前的MacromediaFlash)中使用。

  Flash視訊通過廣泛使用的Adobe Flash播放器和瀏覽器的plugin或者其他的第三方程式,使它能在絕大多是的作業系統都可以使用。

通常Flash視訊FLV檔案包含的視訊位元流是一個專有的H.263視訊標準的變體,FourCC為 FLV1(Sorenson Spark)。SorensonSpark是一個FLV檔案老式編解碼,但被廣泛應用和相容,因此它是第一個被Flash Player支援的視訊編解碼。這是在Flash Player 6和7要求的視訊壓縮格式。Flash Player 8和更新的版本支援On2 TrueMotion VP6視訊位元流回放(FourCC VP6F或者FLV4)。On2 VP6是FlashPlayer 8或者更高版本優先使用的視訊壓縮格式。On2 VP6可以提供能夠提供比Sorenson Spark更高視覺質量,尤其在低位元流中。另外它的計算更為複雜,因此在某些古老的系統配置中無法很好使用。

  Flash 9 update 3,在2007年12月3日釋放,提供了新的Flash視訊檔案格式F4V,支援H.264視訊標準(也即MPEG-4part 10或者AVC),H.264需要更復雜的技術,但是提供更加卓著質量/位元流比例。具體而言,Flash播放器現在支援H.264視訊壓縮(MPEG- 4 Part 10),AAC音訊壓縮(MPEG-3 Part 3),F4V,MP4(MPEG-4 Part14),M4V,3GP和MOV多媒體容器格式,3GPP Timed Text標準(MEPG-4 Part 17)(這是一個標準的的字幕格式,能夠部分解析ID3的’ilist’,等同於iTunes使用的metadata儲存。不支援MPEG-4 Part 2視訊(例如有DivX或者Xvid建立)。Jonathan Gay,一個Flash的主要程式設計師在接收BBC新聞採訪時表示:公司最初想在Flash中使用H.264,但是被每年5百萬美金(3.5百萬英鎊)的專 利許可費而卻步。

  Flash Video FLV檔案格式支援兩個成為“screenshare‘(Screen Video)編解碼的版本,這是一種用於桌面演示的編碼格式。這兩種格式都是基於tmap平鋪方式,可以通過減少色深進行有損編碼,並使用zlib壓縮。 第二個版本之在Flash播放器8以及更新的版本支援。

  在Flash視訊檔案中,通常使用MP3作為音訊編碼然而,在Flash視訊FLV檔案通過麥克風錄音使用專用 的Nellymoser Asao編解碼(Flash Player 10 在2008年釋出,也支援開源的Speex編解碼)。FLV檔案支援不壓縮的音訊或ADPCM音訊格式。最新的Flahs Player 9 支援AAC(HE-AAC/AAC SBR,AAC Main Profile,和AAC-LC)。

  編碼為Flash Video檔案有一個編碼工具提供,包括Adobe的Flash Professional和Creative Suite產品,On2的Flix編碼工具,SorensonSqueeze,FFmepg和其他第三方工具。

容器

  在2002年釋出的Flash Player6增加了對SWF檔案格式的支援。在2003年,FlashPlayer7增加了對FLV檔案格式的直接支援。由於FLV檔案格式的限制,Adobe System公司在2007年提出下面列出的新的檔案格式,是基於ISO基本媒體檔案格式(MPEG-4 Part 12)。Flash播放器不檢查檔案的副檔名,而直接檢視檔案,檢查屬於那種格式。

副檔名

Mime Type

描述

.f4v

video/mp4

Video for Adobe Flash Player

.f4p

video/mp4

Protected Video for Adobe Flash Player

.f4a

video/mp4

Audio for Adobe Flash Player

.f4b

video/mp4

Audio Book for Adobe Flash Player

  在Flash Player6及以後的版本對SWF檔案的支援,使得可以與Adobe Flash媒體伺服器通過RTMP來進行音訊,視訊和資料的互動。Flash媒體伺服器的資料支援採用FLV檔案格式的檔案(MIME型別為 video/x-flv)。從Flash Player 9 Update 3開始建立的SWF檔案,Flash Player可以播發新的F4V檔案格式。

媒體格式

  在FLV檔案中支援的媒體型別:

  • 視訊:On2 VP6,Sorneson Spark(Sorenson H.263),Screen Video,H.264
  • 音訊:MP3,ADPCM,Linear PCM,Nellymoser,Speex,AAC,G.711(保留用於互通需求)

  在F4V檔案中支援的媒體型別:

  • 視訊:H.264
  • 影象(視訊資料的靜止幀):GIF,PNG,JPEG
  • 音訊:AAC,HE-AAC,MP3

在Flash Player和Flash Video中支援的音視訊壓縮格式

Flash Player version

Released

File format

Video compression formats

Audio compression formats

6

2002

SWF

Sorenson Spark, Screen video

MP3, ADPCM, Nellymoser

7

2003

SWF, FLV

Sorenson Spark, Screen video

MP3, ADPCM, Nellymoser

8

2005

SWF, FLV

On2 VP6, Sorenson Spark, Screen video, Screen video 2

MP3, ADPCM, Nellymoser

9.0.115.0

2007

SWF, FLV

On2 VP6, Sorenson Spark, Screen video, Screen video 2, H.264[*]

MP3, ADPCM, Nellymoser, AAC[*]

   

SWF, F4V, ISO base media file format

H.264

AAC, MP3

10

2008

SWF, FLV

On2 VP6, Sorenson Spark, Screen video, Screen video 2, H.264[*]

MP3, ADPCM, Nellymoser, Speex, AAC[*]

   

SWF, F4V, ISO base media file format

H.264

AAC, MP3

[*]在FLV檔案格式中使用H.264和AAC壓縮有一些限制,Flash Player的作者強烈推薦大家使用新的F4V檔案格式。

Flash傳遞的幾種方式

一、作為一個標準的flv檔案。

二、嵌入SWF檔案,使用Flash認證工具(在FlashPlayer 6及以後的版本支援)。

三、通過HTTP的漸進流下載(progressive download)。這種方式使用ActionScript,包括客戶端側的一個外部託管Flash Video檔案用於播放。然而,和使用RTMP的媒體流不一樣,HTTP“流”不支援實時廣播。HTTP流要求一個定製的播放器以及包含每個關鍵幀精確開 始位元組位置以及時間碼的特定FlashVideo後設資料的加入。使用這些特定的資訊,定製Flash Video播放器可以要求在任何指定的關鍵幀中開始播放。例如,Google Video,Youtube和BitGravity支援漸進流下載,可以在快取滿之前檢視視訊的任何部分。在伺服器側,這種“假HTTP流“方式實現相當 簡單,例如可以採用Apache的PHP模組,使用lighttpd。

四、採用RTMP協議的流,可提供的有Flash媒體伺服器(以前稱為Flash Communication Server),VCS,Electro Server,Helix Universal Serval,Wowza Pro,用於.NET的WebORB,用於Java的WebORB,以及開源的Red5伺服器。在2008年4月,這個協議有流錄影提供,不需要重新編碼 的screencast軟體。

  RTMP,實時訊息協議,Real Time Message Protocol是一個有Adobe System為在網際網路的音訊,視訊和資料流開發的私有協議,執行在Flash播放器和伺服器之間。RTMP協議有三個方式:
1、 通過在TCP上,使用1935埠的“純”協議。 
2、 用於在穿越防火牆時,在HTTP請求中封裝的RTMPT。 
3、 在HTTPS的安全連線中使用的RTPMS。

注:上述材料來源於wiki的整理。

編解碼學習筆記(十二):其他編解碼

M-JPEG

  M-JPEG(Motion-JoinPhotographicExpertsGroup)技術即運動靜止影象(或逐幀)壓縮技術,廣泛應用於非線性編輯領域可精確到幀編輯和多層影象處理,把運動的視訊序列作為連續的靜止影象來處理,這種壓縮方式單獨完整地壓縮每 一幀,在編輯過程中可隨機儲存每一幀,可進行精確到幀的編輯,此外M-JPEG的壓縮和解壓縮是對稱的,可由相同的硬體和軟體實現。

  同樣格式的MPEG視 頻壓縮不同於幀間壓縮,因為壓縮位元率比較低,所以編碼與 解碼相對比較容易,並不需要過多的運算能力,也使得軟體或者晶片可以十分容易地對Motion JPEG進行編輯。也因為此,一些移動裝置,如數碼相機使用MotionJPEG來進行短片的編碼。

Motion JPEG 2000

  JPEG2000是基於小波變換的影象壓縮標準,由Joint PhotographicExperts Group組織建立和維護。JPEG2000通常被認為是未來取代JPEG(基於離散餘弦變換)的下一代影象壓縮標準。JPEG2000檔案的副檔名通常為.jp2,MIME型別是image/jp2。

  雖然JPEG2000在技術上有一定的優勢,但是到目前為止(2006年),網際網路上採用JPEG2000技術 製作的影象檔案數量仍然很少,並且大多數的瀏覽器仍然沒有預設支援JPEG2000影象檔案的顯示。但是,由於 JPEG2000在無失真壓縮下仍然能有比較好的壓縮率,所以JPEG2000在影象品質要求比較高的醫學影象的分析和處理中已經有了一定程度的廣泛應用。

DivX

  • 檔名擴充套件: .divx
  • 型別:DIVX
  • 開發者: DivX,Inc
  • 格式型別:媒體容器,用於MPEG-4 Part 2–compliant video
  • 擴充套件來源:AVI

  這是由MPEG-4衍生出的另一種視訊編碼(壓縮)標準,也即通常所說的DVDrip格式,它採用了MPEG4 的壓縮演算法同時又綜合了MPEG-4 與MP3各方面的技術,說白了就是使用DivX壓縮技術對DVD碟片的視訊影象進行高質量壓縮,同時用MP3或AC3對音訊進行壓縮,然後再將視訊與音訊 合成並加上相應的外掛字幕檔案而形成的視訊格式。其畫質直逼DVD並且體積只有DVD的數分之一。這種編碼對機器的要求也不高,所以DivX視訊編碼技術 可以說是一種對DVD造成威脅最大的新生視訊壓縮格式,號稱DVD殺手或DVD終結者。

  DivX,是DivX公司(前身是DivXNetworks公司)的著名品牌,是一種MPEG-4技術視訊編譯碼器(codec),2007年秋以2200萬美元收購德國MainConcept。

  ISO公佈了“超低位元率活動影象和語音壓縮標準 ”,排序MPEG-4,1998年10月批准第一版,1994年4月又公佈了第二版及其校驗模型(VM),MPEG-4正式編號是ISO/IEC國際標準 14496,它是一種新型的多媒體標準,它與前標準一個重要區別就在於,是一個基於物件的視編碼壓縮標準,所定義的位元速率控制的目標就是獲得在給定位元速率下的最優質量,它為網際網路上傳輸高質量的多媒體視訊提供了很好的技術平臺。

  1998年微軟開發了第一個在PC上使用的MPEG-4編碼器,它包括MS MPEG4V1、MSMPEG4V2、MS MPEG4V3的系列編碼內碼,其中V1和V2用來製作AVI檔案,一直到現在它都是作為Windows的預設元件,不過V1和V2的編碼質量不是很好,一直到MS MPEG4V3才開始有好轉,畫質有了顯著的進步,但是不知微軟出於什麼目的,卻將這個MS MPEGV3的視訊編碼核心封閉,僅僅使其應用於Windows Media流媒體技術上,也就是我們熟悉的ASF流媒體檔案中。ASF檔案雖然有一些優勢,但是由於過分的封閉不能被編輯,末得到廣泛應用,這便惹怒了那些個不怕天不怕地的視訊黑客和致力於鑽研視訊編碼的高手,後來,這些小組不僅破解了微軟的視訊編碼,而且經過他們的修改,一種新的視訊編碼誕生了:那就是 廣為流傳的MPEG編碼器-DivX3.11。

  DivX採用了MS的MPEGV3,改良後並加入自己功能稱之為DivX3.11,也是目前網際網路上普通採用的 MPEG-4編碼器之一。很快,DivX被傳得紅得發紫,幾乎成了業界的標準,但是,同樣很快地出現了,DivX的基礎技術是非法盜用微軟的,微軟聲稱將 對所有推動DivX發展的人、企業進行追究,可是DivX技術的創造者之一羅達(Rota)正全面申請將DivX合法化,這是基於DivX雖然是從 Window的發明出來的,但卻沒有用過任何微軟的技術,更組建新公司DivXNetworks全力推廣DivX,看來DivX(俗稱壓縮電影)蓬勃發展 的大潮是勢不可擋了。

  看來任何吸引眼球的故事在關鍵時刻都會發生轉折,DivX的發展竟也不能脫離這一俗套,就在DivX順利發展時 期,DivX的技術逐漸成熟,商機無限的時候,一臺好戲上演了,DivXNetworks成立初衷就是擺脫微軟的技術封閉,因而發起一個完全開放原始碼的專案,名為 “ Projet Mayo ”,目標是開發一套全新的、開放原始碼的MPEG4編碼軟體,由於它完全符合ISO MPEG標準,又是完全開放原始碼,OpenDivXCODEC吸引了 很多軟體,視訊高手參與,很快便開發出具有更高效能的編碼器Encore2等等,就在DivX最輝煌的時期,DXN公司突然封閉了DivX的原始碼,並在 Encore2的基礎上釋出了自有產品DivX4,原來DXN早就給自己留了後門,DivX採取的是LGPL協議,而不是GPL協議,雖說它們都是公共許 可證協議,保障自由使用和修改軟體或原始碼的權利,但LGPL允許私有,DXN就是利用這一協議初其不備的耍出了大刀。

  接著,很多被DXN公司狠狠涮了一回的軟體、視訊團體另起門戶,逐漸重新聚攏開發力量,高舉復仇大旗,在OpenDivX版本基礎上,再次開發出一種新的MPEG-4編碼--XviD,名字的順序和DviX剛好相反,僅僅從名字就可以看出Xvid充滿了復仇的力量。

  DivX是近一兩年來稱霸網路視訊的影象壓縮編碼標準。起初它是以微軟MPEG 4視訊編碼標準為基礎修改和開發的,並以免費方式釋出。其特點是具有十分不錯的壓縮比率,可以將一整套DVD質量的影片壓縮存放到一張CD-R光碟中。現 在的DivX分為普通版和Pro版,其中後者還有收費版和Adware(廣告)版兩種,自帶DivX Player程式進行播放。使用者如果安裝了免費的DivX Codec後,也可用Windows Media player觀看DivX影片。

注:上述材料來源於wiki的整理。

編解碼學習筆記(十三):容器(上篇)

視訊是現在電腦中多媒體系統中的重要一環。為了適應儲存視訊的需要,人們設定了不同的視訊檔案格式來把視訊和音訊放在一個檔案中,以方便同時回放。視訊檔實際上都是一個容器裡面包裹著不同的軌道,使用的容器的格式關係到視訊檔的可擴充套件性。

  FourCC全稱Four-Character Codes,是由4個字元(4 bytes)組成,是一種獨立標示視訊資料流格式的四位元組,在wav、avi檔案之中會有一段FourCC來描述這個AVI檔案,是利用何種codec來 編碼的。因此wav、avi大量存在等於“IDP3”的FourCC。

ISO/IEC

MPEG-PS · MPEG-TS · MPEG-4 Part 12 /JPEG 2000 Part 12 · MPEG-4 Part 14

ITU-T

H.222.0

Others

3GP and 3G2 · ASF · AVI · Bink · DivX Media Format · DPX · EVO · Flash Video · GXF · M2TS ·Matroska · MXF · Ogg · QuickTime File Format · RealMedia · REDCODE RAW · RIFF · Smacker · MOD and TOD · VOB · WebM

Audio Only

AIFF · AU · WAV

3GP和3G2容器  

  3GP(3GPP檔案格式)是一個多媒體容器由第三代合作伙伴計劃(3GPP)針對3G UMTS多媒體服務定義。它用於3G行動電話,但也可以用於某些2G和4G的電話。3GP在ETSI 3GPP技術規範中定義,他是視訊檔案格式,並帶有講話/音訊媒體型別和帶時間資訊的文字,用於IMS,MMS,多媒體廣播/多播服務(MBMS)和傳輸端到端的包交換流媒體服務(PSS)。

  3G2(3GPP2檔案格式)是一個多媒體容器有3GPP2為3G CDMA 2000多媒體服務定義。她與3GP檔案格式非常相似,但與之相比存在一些擴充套件和限制。3G2在3GPP2技術規範中定義。

  3GP和3G2檔案格式都是基於在ISO/IEC 14496-12(MPEG-4 Part 12)定義的ISO基礎媒體檔案格式,但是老闆不的3GP檔案格式不具有其中某些屬性。3GP和3G2與MP4(MPEG-4 Part 14)相似,MP4也是基於MPEP-4 Part 12。3GP和3G2設計目的是為行動電話減少儲存和頻寬要求,它們是非常相似的標準,但有區別:

  • 3GPP 檔案格式用於GSM類電話,副檔名:.3gp
  • 3GPP2檔案格式用於CDMA類電話,並具有副檔名:.3g2

  3GP檔案存貯視訊流:MPEG-4 Part2,H.263,MPEG-4 Part 10(AVC/H.264),音訊流 AMR-NB, AMR-WB, AMR-WB+,AAC-LC, HE-AAC v1 和 Enhanced aacPlus (HE-AAC v2)。3GPP允許ISO基礎檔案格式(MPEG-4Part12)中使用AMR和H.263編解碼,因為3GPP在ISO基礎檔案格式中規定了取樣條目和模板欄位的使用,可以為編解碼定義新的box。這些 擴充套件在ISO基礎媒體文家格式(“MP4家族”檔案)中由登記授權登記為code-point。對於在3GP檔案中存貯MPEG-4媒體,3GP規定參加了MP4和AVC檔案格式規範,它們也是基於ISO基礎媒體檔案格式。MP4和AVC檔案格式規範描述在ISO基礎媒體檔案格式中使用MPEG-4內容。 有些手機使用.mp4作為3GP視訊的擴充套件。

  3G2檔案格式可以存貯與3GP檔案格式相同的視訊流和覺得部分的音訊流。此外3G2可以存在音訊流還包括 EVRC,EVRC-B,EVRC- WB,13K(QCELP),SMV,和VMR-WR。3G2規範還定義了在3GPP帶時間檔案的某些貨站。3G2檔案格式不支援Enhanced aacPlus (HE-AAC v2) 和AMR-WB+ audiostreams。對於在3G2檔案中存在MPEG-4媒體(AAC音訊,MPEG-4 Part 2音訊,MPEG-4 Part 10/H.264/AVC),3G2規範提及了MP4 檔案格式和AVC檔案格式規範,在那裡描述瞭如果在ISO基礎媒體檔案格式中使用這些內容。對於在3G2中儲存H.263和AMR內容,3G2規範參見了 3GP檔案格式規範。

  3GP格式視訊有兩種解析度:

  • 解析度176×144,適合市面上所有支援3GP格式的手機。
  • 解析度320×240,清晰,適合高檔手機、MP4播放器、PSP以及蘋果iPod.

ANIM

  ANIM標準的多媒體檔案用於經典的Commodore Amiga的數字動畫。它遵循IFF ILBM主規範,他是第一個動畫格式被作業系統正式採納。

ASF

  微軟WMA和WMV的標準容器。

  WMV(Windows Media Video)是微軟公司開發的一組數字視訊編解碼格式的通稱,ASF(Advanced Systems Format)是其封裝格式。ASF封裝的WMV檔具有"數字版權保護"功能。副檔名:wmv/asf、wmvhd。

  ASF (Advanced Streaming format高階流格式)。ASF 是 MICROSOFT為了和現在的 Real player 競爭而發展出來的一種可以直接在網上觀看視訊節目的檔案壓縮格式。ASF使用了 MPEG4 的壓縮演算法,壓縮率和影象的質量都很不錯。因為 ASF 是以一個可以在網上即時觀賞的視訊"流"格式存在的,所以它的影象質量比 VCD 差一點點並不出奇,但比同是視訊"流"格式的 RAM 格式要好。

  • 副檔名 :.asf .wma .wmv
  • 網際網路媒體型別: video/x-ms-asf, application/vnd.ms-asf
  • 型別碼 : 'ASF_'
  • 唯一型別碼 :Identifier com.microsoft.advanced-systems-format
  • Magic number :30 26 b2 75
  • 開發者 :Microsoft
  • 格式型別 :Container format
  • 容器容納 :WMA, WMV, MPEG4 etc.

AVI

  AVI (the standard Microsoft Windows container, also based on RIFF)。AVI是英語Audio Video Interleave("音訊視訊交織"或譯為"音訊視訊交錯")的首字母縮寫,由微軟在 1992年11月推出的一種多媒體檔案格式,用於對抗蘋果Quicktime的技術。現在所說的AVI多是指一種封裝格式。

  比較早的AVI是Microsoft開發的。其含義是Audio Video Interactive,就是把視訊和音訊編碼混合在一起儲存。AVI也是最長壽的格式,已存在10餘年了,雖然釋出過改版(V2.0於1996年釋出),但已顯老態。AVI格式上限制比較多,只能有一個視訊軌道和一個音訊軌道(現在有非標準外掛可加入最多兩個音訊軌道),還可以有一些附加軌道,如文字等。AVI格式不提供任何控制功能。副檔名:avi。

  AVI能使用的編碼:

  • 視訊名稱(括號內表示的是此視訊的FourCC) 
    o MPEG-1/-2 (MPEG/MPG1/MPG2)
    o MPEG-4 (MP4V/XVID/DX50/DIVX/DIV5/3IVX/3IV2/RMP4)
    o MS-MPEG4 (MPG4/MP42/MP43)
    o WMV7/WMV8/WMV9 (WMV1/WMV2/WMV3)
    o DV(DVSD/DVIS)
    o Flash Video (FLV1/FLV4)
    o Motion JPEG (MJPG)
    o LossLess JPEG (LJPG)
    o H.264 (AVC1/DAVC/H264/X264)
    o H.263 (H263/S263)
    o H.261 (H261)
    o Huffyuv (HFYU)
    o AVIzlib (ZLIB)
    o AVImszh (MSZH)
    o Theora (THEO)
    o Indeo Video (IV31/IV32)
    o Cinepak (cvid)
    o Microsoft Video 1 (CRAM)
    o On2VP3 (VP30/VP31)
    o On2VP4 (VP40)
    o On2 VP6 (VP60/VP61/VP62)
    o VC-1 (WVC1)
  • 音訊 
    o PCM
    o MP3 (0x0055)
    o AC-3 (0x0092)
    o AAC 
      - HE-AAC
      - LC-AAC
    o FLAC
    o Indeo Audio
    o TrueSpeech
    o WMA
    o Vorbis

  編碼組合能根據以下的例子自由選擇。

  • (DivX或XviD+MP3).avi,
  • (H.264+MP3).avi
  • (WMV9+MP3).avi

  以XviD+MP3構成的AVI最為常見。

DVB-MS

  DVR-MS (Microsoft Digital Video Recording,微軟數字視訊錄製)是一種專用的視訊和音訊檔案容器格式,有微軟開發,用於儲存由Windows XPMedia Center Edition,Windows Vista和Windows 7錄製的電視內容。多個資料流(視訊和音訊)在帶有DVR-MS擴充套件的ASF容器中封裝。視訊使用MPEG-2標準編碼,音訊使用MPEG-1 Layer II或者杜比數字AC-3(ATSC A/52)。擴充套件的格式包括內容和數字版權管理的後設資料。這些格式的檔案有流快取引擎(SBE.dll)生成,這是一個在Windows XP Service Pack 1的DirectShow元件。

MPEG/MPG/DAT

  MPEG格 式:MPEG(Moving Picture Experts Group),是一個國際標準組織(ISO)認可的媒體封裝形式,受到大部份機器的支援。其儲存方式多樣,可以適應不同的應用環境。MPEG-4檔的檔容 器格式在Part 1(mux)、14(asp)、15(avc)等中規定。MPEG的控制功能豐富,可以有多個視訊(即角度)、音軌、字幕(點陣圖字幕)等等。MPEG的一個簡化版本3GP還廣泛的用於準3G手機上。副檔名:dat(用於VCD)、vob、mpg/mpeg、3gp/3g2(用於手機)等。

  MPEG也是Motion Picture Experts Group 的縮寫。這類格式包括了 MPEG-1, MPEG-2 和 MPEG-4在內的多種視訊格式。MPEG-1相信是大家接觸得最多的了,因為目前其正在被廣泛地應用在 VCD 的製作和一些視訊片段下載的網路應用上面,大部分的 VCD 都是用 MPEG1 格式壓縮的( 燒錄軟體自動將MPEG1轉為 .DAT格式 ) ,使用 MPEG-1 的壓縮演算法,可以把一部 120 分鐘長的電影壓縮到 1.2 GB 左右大小。MPEG-2 則是應用在 DVD 的製作,同時在一些 HDTV(高清晰電視廣播)和一些高要求視訊編輯、處理上面也有相當多的應用。使用MPEG-2 的壓縮演算法壓縮一部 120 分鐘長的電影可以壓縮到 5-8 GB 的大小(MPEG2的影象質量MPEG-1 與其無法比擬的)。

  MPEG-PS:MPEG節目流(programstream),是MPEG-1和MPEG-2基準流的標準容器,用於在可靠介質上,例如磁碟,也用於DVD-Video光碟。

  MPEG-TS:MPEG傳輸流,是數字廣播和在非可靠媒體傳輸的標磚容器,也在藍光光碟使用,通常攜帶多個視訊和音訊流以及一個電子節目指南。

n AVI

  如果你發現原來的播放軟體突然打不開此類格式的AVI檔案,那你就要考慮是不是碰到了n AVI。n AVI是 New AVI 的縮寫,是一個名為 Shadow Realm 的地下組織發展起來的一種新視訊格式。它是由MicrosoftASF 壓縮演算法的修改而來的(並不是想象中的 AVI),視訊格式追求的無非是壓縮率和影象質量,所以 NAVI 為了追求這個目標,改善了原始的 ASF 格式的一些不足,讓 NAVI 可以擁有更高的幀率。可以這樣說,NAVI 是一種去掉視訊流特性的改良型 ASF 格式。

注:上述材料來源於wiki的整理。

編解碼學習筆記(十四):容器(下篇)

Matroska(MKV)

  MKV ,不是任何的編解碼或者系統的標準,但實際上可封裝任何的東西。是一個開放以及開源的容器格式。

副檔名      .mkv .mka .mks 
網際網路媒體型別  video/x-matroska audio/x-matroska 開
發者       Matroska.org 
格式       視訊檔案格式 
專門屬      多媒體 
自由檔案格式?  Yes: GNU LGPL

  Matroska,很多人把它當作為MKV,其實MKV只 是Matroska媒體系列的其中一種檔案。Matroska是一種新的多媒體封裝格式,這個封裝格式可把多種不同編碼的視訊及16條或以上不同格式的音訊和語言不同的字幕封裝到一個Matroska Media檔內。它也是其中一種開放原始碼的多媒體封裝格式。

  多媒體封裝格式,簡稱MCF、多媒體容器,是一個開放(沒有身份規限,免費)及自由把資料存放的格式。開發者承諾大家可以自 由地使用這種格式和經這種格式所開發的軟體;又不會在這種格式普遍的時候變成一個商業的科研專案。

Matroska媒體定義了三種型別的檔:

  • MKV (Matroska Video File) :視訊檔,可以包含音訊和字幕;
  • MKA (Matroska Audio File) :單一的音訊檔,可以有多條及多種型別的音軌;
  • MKS (Matroska Subtitles) :字幕檔案。

  這三種檔案中以MKV最為常見。

  Matroska最大的特點就是能容納多種不同型別的視訊編碼、音訊編碼及字幕流,並且它能把非常高密的RealMedia及QuickTime文 件也容納在內,同時將它們的音訊和視訊重新組織起來,從而達到一個更好和鮮明的效果。

  Matroska的開發是對多種傳統媒體格式的一次大挑戰,雖則如此,Matroska也被開發成一個多功能的多媒體容器。

MP4

  MP4,是MPEG-4定義的標準音視訊容器,基於ISO基礎媒體檔案格式(在MPEG-4 Part 12以及JPEG 2000 Part 12中定義),在MPEG-4 Part 14中描述。是一種使用MPEG-4的多媒體電腦檔案格式,副檔名為.mp4,以儲存數碼音訊及數碼視訊為主。

副檔名     .mp4 
網際網路媒體型別 video/mp4, audio/mp4, application/mp4 
型別程式碼    mpg4 
開發者     ISO 
格式      視訊檔案格式 
專門屬     Audio, video, text
延伸自     QuickTime .mov and MPEG-4 Part 12 
標準      ISO/IEC 14496-14

MOD

  MOD格式是JVC生產的 硬碟攝錄機所採用的儲存格式名稱。

MOV

  MOV是評估公司的標準QuickTime視訊容器。QuickTime Movie是由蘋果公司 開發的容器,由於蘋果電腦在專業圖形領域的統治地位,QuickTime格式格式基本上成為電影製作行業的通用格式。1998年2月11 日,國際標準組織(ISO)認可QuickTime檔案格式作為MPEG-4標準的基礎。QT可儲存的內容相當豐富,除了視訊、音訊以外還可支援圖片、文字(文字字幕)等。副檔名:mov

  使用過Mac機的朋友應該多少接觸過QuickTime。QuickTime原本是Apple公司用於Mac計 算機上的一種影象視訊處理軟體。 Quick-Time提供了兩種標準影象和數字視訊格式 , 即可以支援靜態的PIC和JPG影象格式,動態的基於Indeo壓縮法的MOV和基於MPEG壓縮法的MPG視訊格式。

Ogg

  Ogg是Xiph.org音訊編解碼Vorbis和視訊編解碼Theora的標磚容器,Ogg Media一個完全開放性的多媒體系統計劃,OGM(Ogg Media File)是其容器格式。OGM可以支援多視訊、音訊、字幕(文字字幕)等多種軌道。副檔名:ogg。

OGM

  OGM(Ogg Media),是Xiph.ofg的視訊編解碼容器,已經不再支援,並不鼓勵使用。

RealMedia

  RealMedia是RealVideo和RealAudio的標準容器。Real Video或者稱Real Media(RM)檔是由RealNetworks開發的一種檔容器。它通常只能容納Real Video和Real Audio編碼的媒體。該檔帶有一定的互動功能,允許編寫指令碼以控制播放。RM,尤其是可變位元率的RMVB格式,體積很小,非常受到網路下載者的歡迎。 副檔名:rm/rmvb

 RM

  Real Networks公司所制定的音訊/視訊壓縮規範Real Media中的一種,Real Player能做的就是利用Internet資源對這些符合Real Media技術規範的音訊/視訊進行實況轉播。在Real Media規範中主要包括三類檔案:RealAudio、Real Video和Real Flash (Real Networks公司與Macromedia公司合作推出的新一代高壓縮比動畫格式)。REAL VIDEO (RA、RAM)格式由一開始就是定位就是在視訊流應用方面的,也可以說是視訊流技術的始創者。它可以在用 56K MODEM 撥號上網的條件實現不間斷的視訊播放,可是其影象質量比VCD差些,如果您看過那些RM壓縮的影碟就可以明顯對比出來了。

 RMVB

  這是一種由RM視訊格式升級延伸出的新視訊格式,它的先進之處在於RMVB視訊格式打破了原先RM格式那種平均 壓縮取樣的方式,在保證平均壓縮比的 基礎上合理利用位元率資源,就是說靜止和動作場面少的畫面場景採用較低的編碼速率,這樣可以留出更多的頻寬空間,而這些頻寬會在出現快速運動的畫面場景時被利用。這樣在保證了靜止畫面質量的前提下,大幅地提高了運動影象的畫面質量,從而影象質量和檔案大小之間就達到了微妙的平衡。另外,相對於DVDrip 格式,RMVB視訊也是有著較明顯的優勢,一部大小為700MB左右的DVD影片,如果將其轉錄成同樣視聽品質的RMVB格式,其個頭最多也就400MB 左右。不僅如此,這種視訊格式還具有內建字幕和無需外掛外掛支援等獨特優點。要想播放這種視訊格式,可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解碼器形式進行播放。

VOB

  VOB檔案(video Object)是一個DVD視訊媒體的容器格式。VOB可以包含視訊,音訊,字母和選單整合在一個流格式中。VOB是基於MPEG PS格式,但是有額外的限制和私有流的規範。MPEG PS提供非標準資料稱為私有流。VOB檔案是MEPG PS表站中非常嚴格的子集。經所有的VOB檔案都是MPEG PS,但不是所有的MPEG PS都遵守VOB檔案的定義。

  與MPEG的PS相似,VOB檔案可以包含H.262/MPEG-2 Part2或者MPEG-1 Part 2視訊,MPEG-1 Audio LayerII或者MOEG-2 Audio Layer II音訊,但是和MPEG PS相比,在VOB檔案中使用這些壓縮格式有某些限制。此外,VOB可以包括線性PCM,AC-3或者DTS視訊以及字母。VOB檔案不能包含AAC音訊(MPEG-2 Part 7),MPEG-4壓縮格式或者其他,而這些在MPEG PS標準中是允許的。

  副檔名 .VOB 
  開發者:  DVD Forum 
  型別:   媒體容器 
  包含:   音訊,視訊,字母 
  用於:   DVD-Video 
  從何擴充套件: MPEG program stream, ISO/IEC 13818-1 
  標準規範: DVD-Video Book

注:上述材料來源於wiki的整理。


相關文章