Mozilla “Common Voice” 開源語音識別專案

weixin_34127717發表於2017-07-31

語音識別技術可能會徹底改變我們與機器的互動方式,但通常技術開發代價昂貴,而且有專利上的使用限制。大多數語音識別技術都被封鎖在少數的大公司內。Mozilla認為這樣會阻礙創新,因此它發起了“Common Voice”這一開源語音識別專案。

\\

在“Common Voice”專案中,你可以捐獻語音到一個大型資料庫裡,這些語音會被用於構建開源的語音識別引擎,任何人都可以訪問這些資料從而輕鬆又快速地訓練基於語音的應用程式。通過“Common Voice”,程式設計師們可以開發很多有趣的應用程式,如實時語音翻譯、基於語音的管理助手等等。使用者也可以幫助驗證語音,根據顯示的文字判斷聽到的語音是否正確,該判斷結果也會被用於改進語音識別模型。

\\

Mozilla計劃從2017年六月份開始收集總時長約10,000個小時的語音(這是訓練一個語音文字轉換系統所需要的資料量),之後會開源語音資料庫。目前的源文字來自人們的捐獻,以及一些公開的電影劇本,如電影“風雲人物”(It's a Wonderful Life)。考慮到實際生活中人們的語音變化多樣,Mozilla希望能收集到多樣化的語音,讓語音識別引擎能夠準確無誤地處理不同場景下的語音,比如帶有背景對話聲、汽車噪音、風扇噪音的場景。在將來,Mozilla有可能會將該語音識別引擎整合到Firefox中。

\\

該專案在Github上的連結:https://github.com/mozilla/voice-web

\\

檢視英文原文: Project Common Voice

\\

感謝蔡芳芳對本文的審校。

\

給InfoQ中文站投稿或者參與內容翻譯工作,請郵件至editors@cn.infoq.com。也歡迎大家通過新浪微博(@InfoQ@丁曉昀),微信(微訊號:InfoQChina)關注我們。

相關文章