思必馳xiaochi獲2020 AESR“口音種類識別“冠軍和“口音英語語音識別”亞軍

思必驰AISpeech發表於2020-11-03

原文網址 : https://www.jiqizhixin.com/articles/2020-11-02-6

2020 AESR，即“INTERSPEECH 2020口音英語語音識別挑戰賽（Interspeech2020 Accented English Speech Recognition)”，向參賽者開放八種口音英文資料，設定了“Track1-口音種類識別”和“Track2-口音英語語音識別”兩個賽道。由思必馳組建的“xiaochi”隊伍表現優異，分別獲得“口音種類識別”第一名（全球共30個隊伍參賽），和“口音英語語音識別”第二名（全球42個隊伍參賽）。

在“Track1-口音種類識別”技術挑戰賽中，參賽隊伍需要使用官方提供的各種口音英文的訓練資料，訓練語種分類模型。xiaochi隊伍的準確率高出第二名11個百分點，最終摘得冠軍。

資料策略上，xiaochi對8種口音訓練音訊進行變語速資料增強，利用kaldi工具模擬噪聲和遠場，使用8種口音訓練資料+librispeech資料訓練TTS合成器，並生成8種口音訓練音訊，最後對測試音訊採用sox變語速後與原始音訊拼接。模型訓練時，採用了多機多卡的並行訓練策略，有效降低了模型迭代和實驗速度。最終我們採用深層的TDNN模型，結合AAM loss等進行最佳化，來訓練8種口音的8分類模型。

經過多個不同策略組合的實驗測試，最終發現，“利用PPG等特徵，結合基於tts的資料生成，多嵌入多層聯合最佳化”等方法，能夠最高效快速識別不同口音種類。這也為未來業界進行多語種混合識別提供了很好的參考策略。

AR-Net: 一種口音識別（分類）網路（keras版本）
2020-09-25
Keras
阿里AI獲影象識別冠軍百萬影象識別演算法可跑在手機上
2019-07-31
阿里AI演算法
語音識別模型
2024-10-29
模型
谷歌再獲語音識別新進展：利用序列轉導來實現多人語音識別和說話人分類
2019-08-28
谷歌
JavaScript的語音識別
2018-08-25
JavaScript
語音識別技術
2018-03-04
語音情感識別--RNN
2021-09-09
RNN
蘋果滑鼠有望加入 AI 語音控制功能；Accent Oracl ：準確識別你口音的 AI 丨 RTE 開發者日報
2025-01-02
蘋果AI開發者日報
網易 AI Lab 斬獲全球頂級聲紋識別競賽冠軍
2020-07-23
AI
Swift-語音識別、翻譯
2019-03-20
Swift
Python語音識別終極指南
2018-04-11
Python
人工智慧 (08) 語音識別
2019-12-22
人工智慧
ASR-使用whisper語音識別
2024-10-23
樹莓派語音互動--語音輸入識別
2020-11-24
樹莓派
2018影片人物識別挑戰賽冠軍是如何養成的？
2019-03-28
人工智慧之語音識別(ASR)
2019-08-07
人工智慧
[譯] 使用 WFST 進行語音識別
2019-05-12
百度API---語音識別
2020-12-19
API
語音識別2 -- Listen,Attend,and Spell (LAS)
2020-11-25
2018視訊人物識別挑戰賽冠軍是如何養成的？
2019-03-28
怎麼關閉win10語音識別 win10如何關閉電腦的語音識別
2020-10-13
Win10
python語音識別入門及實踐
2018-07-16
Python
使用AI識別語音和B站影片並透過GPT生成思維導圖
2024-08-25
AIGPT
新一代 Kaldi: 支援 JavaScript 進行本地語音識別和語音合成啦！
2024-03-17
JavaScript
30分鐘實現小程式語音識別
2018-11-24
語音識別CTC演算法原理解釋
2018-05-18
演算法
科大訊飛，不只是智慧語音識別
2018-09-12
語音識別技術竟然發展如此迅速
2019-04-19
海南話語音識別模型——模型訓練(一)
2024-11-02
模型
阿里AI語音鑑黃反垃圾服務上線公測可識別多種外語和方言
2020-01-14
阿里AI
使用 SpeechT5 進行語音合成、識別和更多功能
2023-03-14
分享一個自然語言漢語時間語義識別的工具類
2020-11-09
5 款不錯的開源語音識別/語音文字轉換系統
2019-06-22
Windows10系統如何禁用語音識別功能
2019-04-30
Windows
揭秘語音識別演算法的神奇之處
2024-08-28
演算法
語音識別技術有哪些應用場景？
2023-01-10
OpenAI 釋出新語音系統「Whisper 」，英文識別能力可接近人類水平
2022-09-23
OpenAI
11月程式語言排行冠軍揭曉，穩
2021-11-16

思必馳xiaochi獲2020 AESR“口音種類識別“冠軍和“口音英語語音識別”亞軍

相關文章