基於節拍同步的 IF PCP 特徵提取

Galois發表於2020-05-26

IF PCP 特徵提取

PCP 作為一種中層特徵,充分保留了歌曲的旋律資訊。
IF PCP透過使用瞬時頻率,而非使用傅立葉變換後的頻率進行頻譜對映,有效地解決了傅立葉變換帶來的「頻譜模糊」問題。

根據求得的頻譜,將每一幀的能量壓縮到與 8 度無關的 12 個半音上,頻譜對映公式為:

\displaystyle p(k) = \mathrm{round}(12\log_2(\frac{f_s(k)}{f_{ref}})\mathrm{mod}\ 12

其中f_{ref}為參考頻率,可以取鋼琴上的標準 A 對應的 440 Hz。
f_s(k)對應頻譜中第k個分量的頻率。

f_s(k)<f_{ref}的情況下,取模運算為負數取模問題。

p(k)=0,1,\cdots,11為第k個頻率分量對應的音級,將一幀中與某一特定的音級相對應頻率的能量壓縮到這個音級上,可以得到12維的 PCP 特徵。

\displaystyle h_{p,n}=\sum_{k:p(k)=p}|X(k)|^2,\ p=0,1,\cdots,11

X(k)為頻譜幅度。
h_{p,n}為第n幀 PCP 特徵在音級p上的強度。

本作品採用《CC 協議》,轉載必須註明作者和本文連結
不要試圖用百米衝刺的方法完成馬拉松比賽。

相關文章