作者:桂。
時間:2017-05-24 08:06:45
主要是《Speech enhancement: theory and practice》的讀書筆記,全部內容可以點選這裡。
1.語音增強(speech enhancement)主要從攻/防兩面入手:quality + intelligibility,quality希望噪聲儘可能抑制; intelligibility希望語音訊號失真不嚴重,很多演算法只從quality角度去分析問題.
2.語音增強的影響因素很多:
- 應用場景
- 比如空曠的原野,可以認為是加性,房間有混響則更接近卷積模型;這本書討論的是加性噪聲模型。
- 噪聲源
- 白噪聲、說話人,不同源的特性不同
- 目標訊號與噪聲的關係
- 如噪聲與目標訊號,可能統計相關也可能統計無關;這本書關注的是統計無關的模型。
- 感測器數量
- 多個感測器的陣列訊號處理技術,又比如有兩個mic:一個接近噪聲源,可以藉助adaptive filter技術處理;本書關注的是單mic的模型。
3.語音增強演算法分類
- Spectral subtractive algorithms:譜減法
- Statistical-model-based algorithms:基於統計模型的演算法
- Subspace algorithms:子空間演算法
- Binary mask algorithms:二元掩模演算法,可以理解成音訊的分割演算法