音視訊開發-全網最全常用音視訊編碼和格式彙總

肖品發表於2021-05-11

現在網上很多技術想學點東西太難了,要收錢才能看!技術是無界限的!惱火了我自己整理,全網最全、最厚道的技術開發者:

編碼格式彙總:

音訊編碼:AAC、AC-3、Revision A、ALAC、AMR、ATRAC 、APE、DTS、FLAC、MP3、Ogg、PCM、RealAudio、WMA

MPEG Audio Layer 1/2

MPEG Audio Layer 3(MP3)

MPEG2 AAC

MPEG4 AAC

Windows Media audeo v1/v2/v3/7/8/9M

RealAudio cook/sipro(real media series)

Real Audio AAC/AACPlus(real media series)

QDesign Music 2(apple series)( QDesign公司開發的用於高保真高壓縮率的編碼方式,類似於MP3,不過比MP3要先進。支援流式播放)

Apple MPEG-4 AAC(apple series)

ogg( ogg vorbis音訊)

AC3(DVD專用音訊編碼)

DTS(DVD專用音訊編碼)

APE( monkey's音訊)

AU(sun格式)

FLAC( fress lossless音訊)

M4A(mpeg-4音訊)(蘋果改用的名字,可以改成mp4)MP2( mpeg audio layer2音訊)

AWMA

音訊容器格式:很多,列舉常用和主流的:wav、mp3、m4a、amr、wma、ogg

 

主流視訊編碼:H.264、H.265、MPEG4、FLV

MPEGI(VCD)

MPEG2(DVD)

MPEG4(divx, xvid)

MPEG4 AVC/h.264

H.261

H.262

H.263

H.263+

H.263++

MPEG4 v1/v2/v3(微軟 windows media系列)

Windows Media Video 7/8/9/10

Sorenson Video3(用於QT5,成標準了)( apple series)

Real Video G2(real media series)

RealVideo 8/9/10(real media series)

Apple MPEG-4(apple series)

Apple H.264(apple series)

flash video

視訊容器格式:淘汰的就不說了、當前主流的有:mp4、wmv、avi、rvmb、wkv、flv、webm、mov、m4v

視訊格式mkv、mp4、avi、flv、mov、wmv、webm特點和區別

m4v和mp4兩種格式的區別
M4V 是一個標準視訊檔案格式,由蘋果公司創造。此種格式為 iPod 、 iPhone 和 PlayStation Portable 所使用,同時此格式基於 MPEG-4 編碼第二版。其視訊編碼採用H264或H264/AVC,音訊編碼採用AAC。採用H264高清編碼,相比於傳統On2 VP6、H263、Divx等,能夠以更小的體積實現更高的清晰度。 M4V格式也稱作蘋果的視訊Podcast 格式。是MP4的特殊型別,M4V是MP4格式高清的代表應用

MP4是一套用於音訊、視訊資訊的壓縮編碼標準,由國際標準化組織(ISO)和國際電工委員會(IEC)下屬的“動態影像專家組”(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網上流、光碟、語音傳送(視訊電話),以及電視廣播

 

如果我們不是專業搞影視類的,不用考慮太多容器格式,從後端、移動端、前端開發角度來說,考慮多端相容和通用,優先選擇多端能夠相容的通用編碼和容器格式,HTML5目前只支援:MP4、WebM、Ogg

對於前端來說、還要考慮瀏覽器相容性問題,請看html5 video標籤詳解,現在很多主流音視訊相關企業用的都是mp4, m4v,m4a

蘋果公司iPhone、iPad等,目前用的是 m4a、m4v、mp4、mov、wav格式, 蘋果官方多媒體開發文件

安卓也支援

音樂和音效等場景一般使用wav、mp3編碼,音質好、大量軟體支援;在視訊中的音軌編碼一般用AAC編碼更適合;在語音聊天場景中一般是用ogg編碼;

在視訊應用場景中,一般用mpeg4 和 H.264標準來做編碼,如果要支援4k等超高清之類的就用H.265編碼

 

音訊編碼格式詳解:

AACAdvanced Audio Coding)

高階音訊編碼是一種非常常見音訊編碼格式,出現於1997年,基於MPEG2的音訊編碼技術。由 Fraunhofer IIS、杜比實驗室、AT&T、Sony(索尼)等公司共同開發,目的是取代MP3格式2000年,MPEG-4標準出現後,AAC重新整合了其特性,加入了SBR技術和PS技術,為了區別於傳統的MPEG-2 AAC又稱為MPEG-4 AAC。相關的規範標準分別是 ISO/IEC13818-7, ISO/IEC14496-3作為一種高壓縮比的音訊壓縮演算法,AAC壓縮比通常為18:1,也有資料說為20:1,遠勝mp3;

 

在音質方面,由於採用多聲道,和使用低複雜性的描述方式,使其比幾乎所有的傳統編碼方式在同規格的情況下更勝一籌。AAC可以支援多達48個音軌,15個低頻(LFE)音軌,51多聲道支援,更高的取樣率(最高可達96kH,音訊CD為441kH)和更高的取樣精度(支援8it、16it、24bit、3bi,音訊CD為16t)以及有多種語言的相容能力,更高的解碼效率,一般來說,AC可以在對比MP3檔案縮小30%的前提下提供更好的音質AAC包含了如下9種規格:

1.MPEG2 AAC LC低複雜度規格( Low Complexity)

2.MPEG2 AAC Main主規格

3.MPEG2 AAC SSR可變取樣率規格( Scaleable Sample Rate)

4.MPEG-4 AAC LC低複雜度規格( Low Complexity),現在的手機比較常見的MP4檔案中的音訊部份就包括了該規格音訊檔案

5.MPEG4 AAC Main主規格

6.MPEG4 AAC SSR可變取樣率規格( Scaleable Sample Rate)

7.MPEG4 AAC LTP長時期預測規格( Long Term Predicition)

8.MPEG-4 AAC LD低延遲規格( Low Delay)

9.MPEG4 AAC HE高效率規格( High Efficiency)

 

AC-3Digital Audio Compression StandardRevision AATSC Doc. A/52A

音訊編碼格式,傳說中的杜比實驗室的傑作,著名的有損資料壓縮的多媒體儲存格式。可以包括多達6個獨立的聲道。最知名的是5.1聲道技術。在5.1聲道技術中,5代表著5個基本聲道,獨立連線至五個不同的喇叭(20至2000Hz),分別是右前(RF),中(C),左前(LF),右後(RR),左後(LR);而1則代表1個低頻聲效,連線至低音輔助喇叭(20至120Hz)每個AC-3的音訊幀都是以0x0B77為同步頭。開源庫解碼庫liba52。

 

ALACApple Lossless Audio Codec

蘋果的無損音訊壓縮編碼格式,ALAC與MP3的主要分別在於編碼過程中,MP3會取消小部分高頻及低頻部分的音訊資料,而ALAC則會如實記錄,不會刪除音訊中任何細節資料。由於資料無損,ALAC音訊檔案大小會比MP3大,通常每片音樂CD(約70至80分鐘)經ALAC編碼後,音訊檔案大小約300MB。

 

AMRAdaptive Multi-Rate)自適應多速率音訊壓縮

音訊編碼格式,是一個使語音編碼最優化的專利。AMR被標準語音編碼3GP在1998年10月選用,現在廣泛在GSM和UMTS中使用。它使用1-8個不同的位速編碼。之前的手機裡有很多amr的音訊檔案,可分成:

1.AMR-NB

2.AMR-WB, Adaptive Multi-Rate -Wideband Speech Codec

3.AMR-WB+, Extended Adaptive Multi-Rate -Wideband Speech Codec

 

ATRAC Adaptive Transform Acoustic Coding

Sony公司開發的一種相對老的音訊編碼格式,又細分成 ATRACI、 ATRAC2、ATRAC3、 ATRAC3plus,這些都是獨立的技術,後來Sony把這些技術統稱為ATRAC。在rmvb的封裝格式中也能看到這種音訊編碼格式。

 

APE

APE是 Monkey's Audio提供的一種無失真壓縮格式APE可以無損失高音質地壓縮和還原。APE的壓縮率相當高,並且音質保持得很好獲得了不少發燒使用者的青睞

 

DTS(Digital Theater Systems)

大名鼎鼎的DTS(數碼影院系統)是由DTS公司開發,一種多通道的音訊技術,低損,環繞立體聲,被廣泛的應用在DVD等高清片源上。同樣也需要授權,與杜比公司是競爭對手。最常見的是DTS5.1:儲存5條音訊通道的資料用於環繞立體聲分別是 center, left-front, right-front left-rear, and right-rear除此之外DTS公司還開發了DTS70mm、DTS70ES、 DTS NEO:6、DTS9624、 DTS-HD MasterAudio、 DTS-HD High Resolution Audio、 DTS Connect、 DTS Surround Sensation等技術。由於版權比較嚴格,而且文件很難從網上找到。

 

FLACFree Lossless Audio Codec

是一款開源的無失真壓縮的音訊編碼格式,它不會破壞任何原有的音訊資訊,所以可以還原音樂光碟音質。現在它已被很多軟體及硬體音訊產品所支援,FLAC計劃首頁http://flac.sourceforge.net/

 

MP3MPEG-1 or MPEG-2 Audio Layer III)

MPEG1 or MPEG2 Audio LayerⅢ經常被稱作MP3,是目前最流行的音訊編碼格式,有失真壓縮,相關的規範標準在 ISO/EC11723, ISOAIEC13818-3。它是在1991年,由位於德國埃爾朗根的研究組織 Fraunhofer-Gesellschaft的一組工程師發明和標準化的,它設計用來大幅度地降低音訊資料量,將音樂以1:10甚至1:12的壓縮率,壓縮成容量較小的檔案。

bit rates對MP3來說是可變的,原則是 bit rates越高聲音檔案中包含的原始聲音資訊越多,這樣回放時聲音品質也越高。

 

bit rates來說MP3可以分為2種

MP3CBR Constant Bit Rate在MP3編碼的早期,整個檔案使用一個固定的位元率

MP3VBR Variable Bit Rate可以讓MP3檔案的每一段甚至每一幀都可以有單獨的 bitrate,這樣做的好處就是在保證音質的前提下最大程度的限制了檔案的大小。這個方法類似於聲音控制的磁帶錄音機不記錄靜止部分節省磁帶消耗。

 

Ogg 

Ogg是一個自由且開放標準的容器格式,由 Xiph. org基金會所維護,“ogg意指種檔案格式,可以納入各式各樣自由和開放原始碼的編解碼器,包含音效、視訊、文字(像字幕)與後設資料的處理。

1 Ogg_vorbis:這就是我們們常見的ogg結尾的音訊檔案, Vorbis是一種有損音訊壓縮格式,由 Xiph。 Org基金會所領導並開放原始碼。 Vorbis通常以ogg作為容器格式,所以常合稱為 Ogg Vorbis

 

PCM Pulse Code Modulated Audio

目前計算機應用中,最高保真水平的音訊編碼格式。PCM約定俗成了無損編碼能做到最大程度的無限接近絕對保真。被廣泛用於素材儲存及音樂欣賞,CD、DVD以及我們常見的WAV檔案中均有應用,優點是音質好,缺點是體積大。做嵌入式音視訊產品時,一般情況的音視訊都是晶片負責解碼。如果遇到版權問題,例如AC3DTS,有些時候晶片廠商要求很嚴格,使用者會採取軟解的方法,軟解也就是把AC3 DTS等音訊解成PCM,然後在送給晶片。

 

RealAudio

網路中非常常見,在rmvbrm封裝格式中,或者是 .ra .ram音訊檔案,由RealNetworks發展的一種多媒體音訊檔案格式,目前已有很多版本:

1、lpc14-4IS-54 VSELPRealAudio 1

2、28-8G728 LD-CELP RealAudio 2

3、dnetDolby AC3RealAudio 3

4、siprSipro Lab Telecom ACELP-NETRealAudio 4/5

5、cookG2/Cook CodecRealAudio 6

6、atrcSony ATRAC3RealAudio 8

7、raacMPEG-4 LC-AAC RealAudio 9

8、racpMPEG-4 HE-AAC RealAudio 10

9、ralfRealAudio Lossless FormatRealAudio 10

 

WMA Windows Media Audio

是微軟公司開發的一種數字音訊壓縮格式,WMA7之後的WMA支援證書加密,未經許可(即未獲得許可證書),即使是非法拷貝到本地,也是無法收聽的。目前比較流行的是WMA9

WMA9Windows Media 9 Audio Codec

WMA9 PROWindows Media 9 Professional Audio Codec

WMA9_ LLWindows Media 9 Lossless Audio Codec

相關文章