隨著語音技術在各領域應用的迅速擴充套件,全球語言與口音的多樣性成為技術進一步突破的重大挑戰。為了應對這一難題,來自卡內基梅隆大學(CMU)、史丹佛大學(Stanford University)、喬治梅森大學(George Mason University)、臺灣大學與芝加哥豐田技術學院(TTIC)的研究團隊連手,在即將舉行的 INTERSPEECH 2025 國際會議上推出了 ML-SUPERB 2.0 挑戰賽(Multilingual SUPERB 2.0 Challenge)。該挑戰旨在推動多語言語音技術邁向新高度,為語音科技的全球化應用奠定堅實基礎。
語言數量規模
ML-SUPERB 2.0 提供了包含大量不同語言的語音資料集。
●訓練集:涵蓋 141 種語言的豐富語音資料,從主流語言到稀有方言,為參賽者提供多元化的語言資源以訓練模型。
●開發集:包含訓練集中的141種語言,和另外的56 種方言與口音,為模型效能的全面評估提供支援。
這些資料反映了全球語言的多樣性,確保技術不僅服務於主流語言,更覆蓋小眾語言。
新型評估機制
ML-SUPERB 2.0 在評估機制上進行了創新,模型評估指標除了傳統的語音識別和語言識別錯誤率外,還強調模型在每種語言上都具備穩定效能,真正做到對所有語言的友好支援,激勵研究者關注小眾語言與弱勢語言的平等支援,最終實現“No Language Left Behind”。
主辦方提供算力進行推論
為提升參賽體驗,降低參賽門坎,挑戰賽引入了線上實時排名系統。參賽者只需提交模型,即可由主辦單位提供算力進行推論,實現快速評估與實時反饋。
引領語音科技的未來
ML-SUPERB 2.0 挑戰賽不僅是一場技術比拼,更是推動語音科技邁向新紀元的重要一步。透過凝聚全球研究者與開發者的力量,挑戰賽將加速多語言語音技術的創新與普及,為語音技術的應用場景帶來更多可能性。參賽者可前往官方網站 (https://multilingual.superbbenchmark.org/) 獲取詳細資訊,並在 2025 年 2 月 7 日前提交結果。讓我們攜手參與這場語音技術的盛會,見證語音科技未來的開啟!