Chapter 1:Introduction

weixin_34054866發表於2017-05-24

作者:桂。

時間:2017-05-24  08:06:45

主要是《Speech enhancement: theory and practice》的讀書筆記,全部內容可以點選這裡


 

1.語音增強(speech enhancement)主要從攻/防兩面入手:quality + intelligibility,quality希望噪聲儘可能抑制; intelligibility希望語音訊號失真不嚴重,很多演算法只從quality角度去分析問題.

2.語音增強的影響因素很多:

  • 應用場景
    • 比如空曠的原野,可以認為是加性,房間有混響則更接近卷積模型;這本書討論的是加性噪聲模型
  • 噪聲源
    • 白噪聲、說話人,不同源的特性不同
  • 目標訊號與噪聲的關係
    • 如噪聲與目標訊號,可能統計相關也可能統計無關;這本書關注的是統計無關的模型
  • 感測器數量
    • 多個感測器的陣列訊號處理技術,又比如有兩個mic:一個接近噪聲源,可以藉助adaptive filter技術處理;本書關注的是單mic的模型

3.語音增強演算法分類

  • Spectral subtractive algorithms:譜減法
  • Statistical-model-based algorithms:基於統計模型的演算法
  • Subspace algorithms:子空間演算法
  • Binary mask algorithms:二元掩模演算法,可以理解成音訊的分割演算法

相關文章