time series
時間序列,通常音訊訊號 y
是一維浮點值陣列 numpy.adarrayy[t]
對應於這個陣列中位於 t
點的幅度值。
sampling rate
時間序列每秒的取樣數(正整數),用 sr
表示。
frame
用於分析目的的時間序列的一小段,這通常對應於頻譜圖矩陣的單個列。
window
在計算頻譜圖時用於對一幀內的樣本甲醛的向量或函式。
frame length
分析視窗或框架中樣本的數量(正整數),這由一個整數變數表示 n_fft
。
hop length
視窗每部滑動距離(跳長)連續幀(例如聲譜圖的列)之間的樣本數。這被表示成正整數 hop_length
。
window length
視窗功能(如 Hann 窗)的長度(寬度)。注意,它可以小於短時傅立葉變換中使用的幀長度,通常表示為整數變數 win_length
。
spectrogram
頻譜圖,一個矩陣 S
,其中行索引(頻點),列索引(時間)。頻譜圖可以是實值或復值。按照慣例,實值頻譜表示為 numpy.ndarray
小寫 s
,而複數 STFT 矩陣表示為 D
。
onset (strength) envelope
起始(強度)包絡,onset_env[t]
用來衡量框架音符起始的強度 t
。通常儲存為浮點值的一維 numpy.ndarray
的 onset_envelope
。
chroma
音級,也稱為 pitch class profile (PCP)。表示測量給定幀/時間下每個音調類別(例如,色階中的12個音符)的相對能量。
本作品採用《CC 協議》,轉載必須註明作者和本文連結