Mozilla “Common Voice” 開源語音識別專案

weixin_34127717發表於2017-07-31

語音識別技術可能會徹底改變我們與機器的互動方式，但通常技術開發代價昂貴，而且有專利上的使用限制。大多數語音識別技術都被封鎖在少數的大公司內。Mozilla認為這樣會阻礙創新，因此它發起了“Common Voice”這一開源語音識別專案。

在“Common Voice”專案中，你可以捐獻語音到一個大型資料庫裡，這些語音會被用於構建開源的語音識別引擎，任何人都可以訪問這些資料從而輕鬆又快速地訓練基於語音的應用程式。通過“Common Voice”，程式設計師們可以開發很多有趣的應用程式，如實時語音翻譯、基於語音的管理助手等等。使用者也可以幫助驗證語音，根據顯示的文字判斷聽到的語音是否正確，該判斷結果也會被用於改進語音識別模型。

Mozilla計劃從2017年六月份開始收集總時長約10,000個小時的語音（這是訓練一個語音文字轉換系統所需要的資料量），之後會開源語音資料庫。目前的源文字來自人們的捐獻，以及一些公開的電影劇本，如電影“風雲人物”（It's a Wonderful Life）。考慮到實際生活中人們的語音變化多樣，Mozilla希望能收集到多樣化的語音，讓語音識別引擎能夠準確無誤地處理不同場景下的語音，比如帶有背景對話聲、汽車噪音、風扇噪音的場景。在將來，Mozilla有可能會將該語音識別引擎整合到Firefox中。

該專案在Github上的連結：https://github.com/mozilla/voice-web

檢視英文原文： Project Common Voice

感謝蔡芳芳對本文的審校。

給InfoQ中文站投稿或者參與內容翻譯工作，請郵件至editors@cn.infoq.com。也歡迎大家通過新浪微博（@InfoQ，@丁曉昀），微信（微訊號：InfoQChina）關注我們。

語音識別開源專案
2017-11-17
Fish Agent：多語言 Voice-to-Voice 開源語音模型；Runway 推出攝像機運鏡功能丨 RTE 開發者日報
2024-11-04
模型開發者日報
5 款不錯的開源語音識別/語音文字轉換系統
2019-06-22
開源專案剖析之apache-common-pool
2014-01-08
Apache
人臉識別相關開源專案彙總
2018-11-30
JavaScript的語音識別
2018-08-25
JavaScript
語音識別技術
2018-03-04
思否開源專案推介丨smartParsePro：基於地址的智慧識別專案
2020-07-03
基於React-Native0.55.4的語音識別專案全棧方案
2018-10-24
React全棧
橫向對比5大開源語音識別工具包，CMU Sphinx最佳
2017-06-26
Facebook 開源語音識別工具包wav2letter（附實現教程）
2018-01-01
Facebook開源端到端自動語音識別系統wav2letter
2018-01-05
初識華為開源專案 ServiceComb
2019-03-04
樹莓派語音互動--語音輸入識別
2020-11-24
樹莓派
人工智慧 (08) 語音識別
2019-12-22
人工智慧
Swift-語音識別、翻譯
2019-03-20
Swift
語音識別----音高的處理
2016-11-18
語音識別方向的資料
2014-07-13
ASR-使用whisper語音識別
2024-10-23
用python呼叫百度語音識別api批量處理本地語音檔案
2020-11-08
PythonAPI
文字識別（OCR）介紹與免費開源專案使用測評
2024-06-05
語音識別開源工具PyTorch-Kaldi：兼顧Kaldi效率與PyTorch靈活性
2019-07-30
開源工具PyTorch
人工智慧之語音識別(ASR)
2019-08-07
人工智慧
[譯] 使用 WFST 進行語音識別
2019-05-12
百度API---語音識別
2020-12-19
API
Python語音識別終極指南
2018-04-11
Python
Windows XP語音識別技術(轉)
2007-08-11
Windows
Kaldi搭建語音識別系統—發音詞典相關檔案準備
2022-05-17
Win7系統怎麼開啟語音識別功能
2016-11-21
Win7
谷歌開放語音識別API 釋出機器學習雲平臺
2016-03-24
谷歌API機器學習
怎麼關閉win10語音識別 win10如何關閉電腦的語音識別
2020-10-13
Win10
從專利視角看語音識別產業的趨勢與風險
2016-03-02
產業
值得學習的C語言開源專案
2017-01-14
C語言
百度語音識別cordova外掛
2018-02-01
安裝百度語音識別sdk
2017-11-08
語音識別進入IVR系統 (轉)
2007-12-04
VR
Linux的語音識別軟體(轉)
2007-08-11
Linux
Win10系統如何啟動語音識別 win10啟動語音識別的兩種方法
2016-02-18
Win10

Mozilla “Common Voice” 開源語音識別專案

相關文章