短時傅立葉變換原理理解

Galois發表於2020-05-27

短時傅立葉變換原理

兩年前經常做這些,不過很久沒弄生疏了,最近接到這樣的需求,有必要讓我回憶一下,所以在此記錄一下原理知識點。

短時傅立葉變換是最常用的一種時頻分析方法,它透過時間窗內的一段訊號來表示某一時刻的訊號特徵。在短時傅立葉變換過程中:

  • 窗的長度決定頻譜圖的時間解析度和頻率解析度。
  • 窗長越長,擷取的訊號越長。
  • 訊號越長,傅立葉變換後的頻率解析度越高,時間解析度越差。
  • 相反,窗長越短,擷取的訊號就越短,頻率解析度越差,時間解析度越好。

這個可以用海森堡不確定性原理來解釋,時間和頻率是一對不可兼得的矛盾體,所以絕對意義的瞬時頻率是不存在的,只能分時段。

在短時傅立葉變換中,時間解析度和頻率解析度之間不能兼得,應該根據具體需求進行取捨。

簡單來說,短時傅立葉變換就是先把一個函式和窗函式進行相乘,然後再進行一維的傅立葉變換。並透過窗函式的滑動得到一系列的傅立葉變換結果,將這些結果豎著排開得到一個二維的表象。

傅立葉變換後,橫軸為頻率,縱軸為幅值
短時傅立葉變換後,橫軸為時間,縱軸為頻率

短時傅立葉變換(Short Time Fourier Transform,STFT)公式為:

\displaystyle X(t,f)=\int_{-\infty}^\infty w(t-\tau)x(\tau)e^{-j2\pi f\tau}d\tau

角頻率表示法:

\displaystyle X(t,\omega)=\int_{-\infty}^\infty w(t-\tau)x(\tau)e^{-j\omega\tau}d\tau

X(t,\omega)w(t,\omega)x(\tau)的傅立葉變換。

特性

積分特性\\{}\\ \displaystyle \int_{-\infty}^\infty X(t,f)df=\int_{t-B}^{t+B}x(\tau)\int_{-\infty}^\infty e^{-j2\pi f\tau}dfd\tau=\left\{ \begin{aligned} x(0);\ |t|\leqslant B\\ 0;\ |t|>B \end{aligned} \right.\\{}\\ 位移特性(時間軸方向的移動)\\{}\\ \int_{t-B}^{t+B}x(\tau+\tau_0)e^{-j2\pi f\tau}d\tau=X(t+\tau_0,f)e^{j2\pi f\tau_0}\\{}\\ 調製特性(頻率軸方向的移動)\\{}\\ \int_{t-B}^{t+B}x(\tau)e^{j2\pi f_0\tau}d\tau=X(t,f-f_0)

窗函式

為了減少頻譜能量洩漏,可採用不同的擷取函式對訊號進行截斷,截斷函式稱為窗函式,簡稱為窗。

矩形窗函式\\{}\\ \displaystyle \omega(n)=R_M(n)=\left\{\begin{aligned}1,\ 0\leqslant n\leqslant M-1\\0,\ 其它\end{aligned}\right.\\{}\\ 三角窗函式\\{}\\ \omega(n)=0.5\left[1-\cos\left(\frac{2\pi n}{M+1}\right)\right],\ 1\leqslant n\leqslant M\\{}\\ hamming窗函式\\{}\\ \omega(n)=\left[0.54-0.46\cos\left(\frac{2\pi n}{M-1}\right)\right]R_M(n)

窗函式的主要型別

  • 冪窗,採用時間變數某種冪次的函式,如矩形、三角形、梯形或其它時間 t 的高次冪。
  • 三角函式窗,應用三角函式,即正弦或餘弦函式等組合成複合函式,例如 hanning、hamming 窗等。
  • 指數窗,採用指數時間函式,例如高斯窗等。

頻譜(Spectrogram)

Spectrogram 即短時傅立葉轉換後結果的絕對值平方,兩者的本質上是相同的,在文獻上也經常出現 Spectrogram 這個名詞。

\displaystyle SP_x(t,f)=|X(t,f)|^2=\bigg|\int_{-\infty}^\infty w(t-\tau)x(\tau)e^{-j2\pi f\tau}d\tau\bigg|^2

本作品採用《CC 協議》,轉載必須註明作者和本文連結
不要試圖用百米衝刺的方法完成馬拉松比賽。

相關文章