訊號處理基本引數

Galois發表於2020-05-29

time series

時間序列,通常音訊訊號 y 是一維浮點值陣列 numpy.adarray
y[t] 對應於這個陣列中位於 t 點的幅度值。

sampling rate

時間序列每秒的取樣數(正整數),用 sr 表示。

frame

用於分析目的的時間序列的一小段,這通常對應於頻譜圖矩陣的單個列。

window

在計算頻譜圖時用於對一幀內的樣本甲醛的向量或函式。

frame length

分析視窗或框架中樣本的數量(正整數),這由一個整數變數表示 n_fft

hop length

視窗每部滑動距離(跳長)連續幀(例如聲譜圖的列)之間的樣本數。這被表示成正整數 hop_length

window length

視窗功能(如 Hann 窗)的長度(寬度)。注意,它可以小於短時傅立葉變換中使用的幀長度,通常表示為整數變數 win_length

spectrogram

頻譜圖,一個矩陣 S,其中行索引(頻點),列索引(時間)。頻譜圖可以是實值或復值。按照慣例,實值頻譜表示為 numpy.ndarray 小寫 s,而複數 STFT 矩陣表示為 D

onset (strength) envelope

起始(強度)包絡,onset_env[t] 用來衡量框架音符起始的強度 t。通常儲存為浮點值的一維 numpy.ndarrayonset_envelope

chroma

音級,也稱為 pitch class profile (PCP)。表示測量給定幀/時間下每個音調類別(例如,色階中的12個音符)的相對能量。

本作品採用《CC 協議》,轉載必須註明作者和本文連結
不要試圖用百米衝刺的方法完成馬拉松比賽。

相關文章