有這5款開源軟體,語音轉文字很簡單!
來自:開源最前線(ID:OpenSourceTop)
連結:https://fosspost.org/lists/open-source-speech-recognition-speech-to-text
語音文字轉換(STT)系統,一種能夠將語音單詞轉換成文字的方法,用途十分廣泛,比如我們經常在用的微信聊天中語音轉文字功能。
過去,語音轉文字技術由專有軟體和庫控制;開源替代方案不存在或存在極端侷限,如今這種形勢已經發生變化,今天你可以使用許多開源的語音轉文字工具和庫,今天,我們就舉5個好用的開源語音識別庫。
1、DeepSpeech專案
該專案由Mozilla開發,這是一個100%免費的開源語音轉文字庫,它使用了 TensorFlow 機器學習框架實現去功能。
你可以使用它自己構建訓練模型,以增強語音轉換到文字的效果,你還可以根據自己的需要引入其他語言,甚至可以輕鬆把它整合到TensorFlow上的其他機器學習專案中。唯一可惜的是,該專案目前預設情況下僅支援英語。
它也支援多種語言,例如Python(3.6)。執行十分簡單:
pip3安裝deepspeech
deepspeech --model模型/output_graph.pbmm --alphabet模型/alphabet.txt --lm模型/lm.binary --trie模型/ trie --audio my_audio_file.wav
你也可以使用npm安裝它:
npm安裝deepspeech
近日,DeepSpeech還登上Github Trending周榜:
Github地址:https://github.com/mozilla/DeepSpeech
2、Kaldi
Kaldi是用C++編寫的開源語音識別軟體,遵循Apache公共許可協議,支援Windows,macOS和Linux,2009年就已經發布了。
與其他語音識別軟體相比,Kaldi的主要功能是可擴充套件和模組化。社群提供了大量的第三方模組,Kaldi還支援深度神經網路,並在其網站上提供了完整的使用文件。
雖然程式碼主要是用C++編寫的,但是它通過 Bash 和 Python 指令碼進行了封裝。因此,如果你只是想實現基本的語音轉換成文字功能,那通過Python或Bash就可以輕鬆實現這一點。
專案主頁:http://kaldi-asr.org/
3、Julius
這可能是有史以來最古老的語音識別軟體之一;京都大學在1991年的時候開發的,然後於2005年將它移交給一個獨立的專案團隊。
Julius 的主要特點包括了執行實時 STT 的能力,低記憶體佔用(20000 單詞少於 64 MB),能夠輸出最優詞N-best word和詞圖Word-graph,能夠作為伺服器單元執行等等。這款軟體主要為學術和研究所設計。它是由C 語言寫成,並且可以執行在 Linux、Windows、macOS 甚至 Android(在智慧手機上)。
目前,它僅支援英語和日語,該軟體可能很容易安裝在Linux發行版的倉庫中。只需在軟體包管理器中搜尋julius包即可。
專案主頁:https://github.com/julius-speech/julius
4、Wav2Letter ++
Wav2Letter ++是一款開源語音識別軟體,在今年由Facebook的AI研究團隊釋出。該程式碼在BSD許可下發布。Facebook將其倉庫描述為“當下最快、最先進的語音識別系統”,預設情況下,構建此工具所基於的概念使其針對效能進行了優化,Wav2Letter ++是基於FlashLight構建,它也是Facebook最新的機器學習庫。
使用Wav2Letter ++,你首先需要為你自己想要的語言構建訓練模型,以便於訓練演算法,沒有任何一種語言(包括英語)的預訓練模型,它僅僅是個機器學習驅動的文字語音轉換工具,它用 C++ 寫成,因此被命名為 Wav2Letter++。
專案主頁:https://github.com/facebookresearch/wav2letter
5、DeepSpeech2
百度的研究人員也在研究自己的語音轉文字引擎DeepSpeech2。這是一個端到端的開源引擎,它使用“ PaddlePaddle”深度學習框架將英語和普通話的語音轉換為文字。該專案在BSD許可下發布。
該引擎可以針對任何模型和所需的任何語言進行培訓。模型不隨程式碼一起釋出;就像其他軟體一樣,你必須自己構建它們。DeepSpeech2的原始碼是用Python編寫的;因此,如果這是你使用的語言,你應該很快就能使用上手
專案地址:https://github.com/PaddlePaddle/DeepSpeech
語音識別類別主要還是由專有軟體巨頭(例如Google和IBM)來主導(它們確實為此提供了自己的閉源商業服務),但是開源替代方案是有希望的。這5個開源語音識別引擎讓你可以自己著手構建應用程式,不知道有沒有你用過的呢?
- END -
如果看到這裡,說明你喜歡這篇文章,請轉發、點贊。掃描下方二維碼或者微信搜尋「perfect_iscas」,新增好友後即可獲得10套程式設計師全棧課程+1000套PPT和簡歷模板,向我私聊「進群」二字即可進入高質量交流群。
送幾本書《Pytorch深度學習入門》《演算法交易員》等
↓掃描二維碼進群↓
喜歡文章,點個在看
相關文章
- 文字轉語音軟體 VPot v2411
- 語音轉文字工具,語音轉文字怎樣轉?
- 開源軟體沒有這麼脆弱
- 有沒有support這樣的開源軟體
- 5 款不錯的開源語音識別/語音文字轉換系統
- pdf轉換成ppt,這樣操作很簡單
- iOS---語音轉文字iOS
- Python 文字轉語音Python
- chrome語音文字互轉Chrome
- 中英文混讀,文字轉換到MP3的語音軟體 (轉)
- i人的福音!一個強大開源的文字轉語音工具!
- pdf線上轉換免費,這樣做很簡單!
- 想作一個很簡單的HA cluster軟體
- [js常用]文字轉化成語音JS
- 這樣看java記憶體模型其實很簡單Java記憶體模型
- 如何用Python語音合成,以及文字轉語音~Python
- Linux的語音識別軟體(轉)Linux
- 蘋果手機文字轉語音方法蘋果
- C# TTS-文字轉語音C#TTS
- Swift語音和文字的轉換Swift
- AVFoundation 文字轉語音和音訊錄製 播放音訊
- C語言入門很簡單pdfC語言
- 萬事開頭難——軟體立項不簡單(轉)
- 前端語音轉文字實踐總結前端
- Windows部署語音轉文字專案_WhisperWindows
- 不用任何軟體!PDF轉Word用微信這個功能,簡單又方便!
- 直播軟體開發,Android自定義簡單的音訊波譜viewAndroid音訊View
- 國內“開源軟體”許可方式有違開源精神
- 軟體開發中的矛盾——一個簡單的例子 (轉)
- 開源專案管理軟體有哪些?分享7個實用開源專案管理軟體專案管理
- web端文字轉語音的幾種方案Web
- 文字語音互相轉換系統設計
- 怎麼把語音檔案轉為文字,這個方法你需要知道
- 開源是什麼意思?開源軟體優缺點有哪些?
- 文字到語音(tts)TTS
- 語音簡訊API有哪些好處?API
- 【轉載】軟體開發模式簡介模式
- Bing Speech微軟必應語音認知服務-文字語音互轉微軟