有關語音方面的深度學習資料合集

bbzz2發表於2017-06-12

把一些深度學習在語音上的應用的開原始碼收集起來,如果你遇到,可以告訴我,我也收集在這裡。方便大家查閱和做實驗。

 1.audio feature extraction with deep belief network:    http://www.liacs.nl/~dmus/api2011.html

   這個主要是用dbn來做個語音的分類。

 2.Unsupervised feature learning for audio classification using convolutional deep belief networks : http://web.eecs.umich.edu/~honglak/

  Honglak Lee的主頁,這篇論文主要做一些音樂的分類和說話人識別等等。論文和程式碼都有連結。

3.Recurrent neural network training for noise reduction in robust automatic speech recognition :https://github.com/amaas/rnn-speech-denoising

  rnn在語音去噪上的應用。你值得看看。

4.Deep Recurrent Neural Networks for Source Separation:https://github.com/posenhuang/deeplearningsourceseparation

 rnn和dnn在語音分離上的應用,最近才公佈出來的哦。

5.深度學習模型在語音識別上的應用,當然是kaldi,這個提供深度學習的框架。主頁:http://kaldi.sourceforge.net/index.html

6.cmu的苗博士的kaldi+pdnn,大家可以看看:http://www.cs.cmu.edu/~ymiao/kaldipdnn.html ,裡面提供很多的模型。

7.微博上有人收集的:https://github.com/memect/hao/blob/master/awesome/speech-recognition.md

8.http://research.microsoft.com/en-us/events/fs2013/agenda_collapsed.aspx

9.中科大博士生,用dnn做語音增強:http://home.ustc.edu.cn/~xuyong62/demo/SE_DNN.html


相關文章