PCM (Pulse Code Modulation)
原理與工作機制
模擬訊號取樣:PCM 的工作流程始於對模擬訊號的取樣。在固定的時間間隔內,對模擬訊號的幅度進行測量,這個過程稱為取樣。取樣的頻率稱為取樣率。
量化:將每個取樣點的幅度值轉化為一個離散的數字值。量化過程中會引入一定的誤差,稱為量化誤差。量化位數越高,誤差越小。
編碼:將量化後的值轉換為二進位制碼,以便進行儲存或傳輸。
詳細要素
取樣率(Sample Rate):
44.1kHz:常用於CD音質,每秒鐘取樣44100次。
48kHz:常用於專業音訊和影片製作。
96kHz及以上:用於高解析度音訊,提供更高的音質細節。
量化位數(Bit Depth):
8位:每個樣本使用8個二進位制位,動態範圍有限。
16位:每個樣本使用16個二進位制位,提供CD質量的音訊。
24位及以上:每個樣本使用24個或更多的二進位制位,用於專業音訊製作,動態範圍更大。
聲道數(Channels):
單聲道(Mono):只有一個聲道。
立體聲(Stereo):有兩個聲道(左聲道和右聲道)。
多聲道(Surround Sound):用於家庭影院和環繞聲系統,有更多的聲道,如5.1、7.1等。
PCM的應用
音訊CD:CD音訊通常使用44.1kHz取樣率和16位量化。
專業音訊裝置:錄音裝置和數字音訊工作站(DAW)通常使用更高的取樣率和量化位數。
傳輸協議:如電話系統中的PCM編碼,通常使用8kHz取樣率和8位量化。
WAV(Waveform Audio File Format)
詳細結構
WAV 檔案是一種基於RIFF(資源互換檔案格式)的檔案結構,包含多個塊(chunks),每個塊都有特定的功能和資料。
RIFF頭:
ChunkID:標識為 "RIFF"。
ChunkSize:整個檔案的大小減去8位元組(不包括ChunkID和ChunkSize本身)。
Format:標識為 "WAVE"。
格式塊(fmt chunk):
Subchunk1ID:標識為 "fmt "。
Subchunk1Size:16位元組(PCM格式)。
AudioFormat:音訊格式程式碼,1表示PCM。
NumChannels:聲道數(1=單聲道,2=立體聲)。
SampleRate:取樣率(如44100)。
ByteRate:每秒鐘傳輸的位元組數(SampleRate * NumChannels * BitsPerSample/8)。
BlockAlign:每個取樣塊的位元組數(NumChannels * BitsPerSample/8)。
BitsPerSample:每個樣本的位數(如16)。
資料塊(data chunk):
Subchunk2ID:標識為 "data"。
Subchunk2Size:音訊資料的大小(檔案總大小減去44位元組)。
Data:實際的音訊樣本資料。
WAV檔案的優缺點
優點:
高質量:由於通常儲存未壓縮的PCM音訊資料,音質極高。
簡單的結構:容易解析和處理,相容性強。
靈活性:可以儲存不同取樣率和量化位數的音訊資料。
缺點:
檔案大:未壓縮的PCM資料導致檔案非常大,不適合網路傳輸或便攜裝置儲存。
不適合長時間錄音:大檔案尺寸不適合長時間的音訊錄製和儲存。
實際應用示例
- CD音訊格式
取樣率:44.1kHz
量化位數:16位
聲道數:立體聲 - 專業錄音
取樣率:96kHz或192kHz
量化位數:24位或32位
聲道數:立體聲或多聲道 - 語音通話
取樣率:8kHz
量化位數:8位
聲道數:單聲道
結論
PCM和WAV在音訊技術中扮演著重要角色。PCM是基礎的數字音訊編碼技術,提供了高質量的音訊表示方法,而WAV是廣泛使用的音訊檔案格式,利用PCM技術儲存音訊資料,具有高音質和相容性的優點。兩者的結合在許多音訊應用中廣泛使用,從音樂製作到語音通話,都能見到它們的身影。