同聲傳譯,Skype完勝99.9%地球人
Skype前幾天推出了實時語音翻譯的預覽版,讓使用者可以跨越語言的障礙暢快交流。今天我們就來聊聊微軟是如何做到這一點的。
Skype 的翻譯系統主要分三步:首先,把你的實時語音轉換成文字;然後,再把文字翻譯成另一種語言的文字;最後,把文字轉換成語音。其中,識別實時語音並轉換成文字一直是最棘手的部分。
影像處理和語音識別是深度學習發展的兩個主要方向。近幾年來,由於深度學習的進步,語音識別依靠深度神經網路(deep neural networks)也取得了不少進展。神經網路在八十年代就已出現,但真正開始煥發光芒是在 2012 年,Google 讓計算機能夠“自我修養”——在一堆視訊裡自主學習並總結出貓的概念。
微軟研究員 John Platt 在接收wired採訪時曾表示,微軟其實很早之前就開始利用神經網路改善平板電腦的手寫識別精確度了。而 Skype 實時語音翻譯系統真正的突破在於識別不同使用者間的不同語言不同口音的說話方式。
這一突破發生在 2009 年的聖誕節,當時微軟在英國哥倫比亞贊助了一個小型研討會,來自多倫多大學的演講嘉賓 Geoff Hinton 介紹了自己研究的一種模仿腦神經工作原理的機器學習模型,這一模型依靠多層次的人工神經元,讓機器逐漸理解更加複雜的概念。微軟聽完介紹後,隨即砸下一筆鉅款,讓 Hinton 的模型可以利用最新的圖形處理器單元進行測試。測試的結果很棒,語音識別的精確度提升了 25%。
Skype 的機器學習原型通過預覽階段的大量資料進行訓練,並優化語音識別(SR)和自動化機器翻譯(MT)任務,這些優化包括去除語句中的不流利成分(比如“ahs”、“umms”和重複性的語言)、把文字分段成句子、增加標點符號、文字的大小寫等等。
其中,語音識別和機器翻譯的訓練集資料主要有多個來源,包括已翻譯的網頁、帶字幕的視訊、翻譯轉錄的一對一對話內容等。此外,很多志願者向微軟貢獻出的語音對話也是一個非常重要的訓練集資料來源。同時,Skype 的翻譯系統還會記錄使用者的對話內容,實現二次利用,以進行資料分析,加以學習。
在資料進入系統之後,機器學習軟體會為對話中的單詞建立統計模型,當你說到某一個東西時,系統會在統計模型裡尋找類似的單詞,並響應之前做過的類似的翻譯。實時語音翻譯對使用者對話的環境很敏感,稍有噪音干擾可能準確度就會降低很多。這一方面,深度神經網路有效的減少識別錯誤率,改善了系統的健壯性,讓實時翻譯能夠有更大的應用範圍。
至於不同語言的文字翻譯,Skype 利用的則是和Bing翻譯一樣的引擎技術:語法和統計模型的結合使用,同時為特定語言進行特殊的訓練。普通的文字翻譯往往要求使用規範正確的書面語言,而 Skype 翻譯系統不僅包括 Bing 翻譯的引擎技術,還額外增加了一層口語化的語言業務。
此外,Skype 還建立了一套自定義的串連整個流程的架構,以協調系統裡多個部分間的運作。如何簡單又高效的運作整個系統,也是一門不小的學問。
Skype 的實時語音翻譯系統還面臨著很多挑戰,比如語言的變化的速度很快,每個人說話的方式又很獨特,這些都會為實時翻譯造成不少的麻煩。微軟研究院總監 Vikram Dendi 說,截止到星期一,總共已經有 5 萬個使用者註冊了預覽版 Skype 翻譯,而一天後,這個數字變成了兩倍。對於這一種可能會真正改變人們交流方式的科技產品,越來越多的人為之感到激動。
原文釋出時間為:2015-01-21
本文來自雲棲社群合作伙伴“大資料文摘”,瞭解相關資訊可以關注“BigDataDigest”微信公眾號
相關文章
- 微軟黑科技:Skype同聲翻譯背後還有什麼微軟
- 如何註冊Win10/Win8.1版Skype同聲翻譯預覽?Win10
- Skype同聲翻譯預覽版登陸Win10/Win8.1商店Win10
- 位元組大模型同傳智慧體,一出手就是媲美人類的同聲傳譯水平大模型智慧體
- 微信小程式使用同聲傳譯實現語音識別功能微信小程式
- PC端免費高效的同聲翻譯
- HMS Core機器學習服務實現同聲傳譯,支援中英文互譯和多種音色語音播報機器學習
- HMS Core 機器學習服務打造同傳翻譯新“聲”態,AI讓國際交流更順暢機器學習AI
- 中文主播也能海外帶貨!同聲傳譯助直播類應用開拓海外市場
- Android 完勝 iOS?開什麼玩笑AndroidiOS
- Web服務效能測試:Node完勝JavaWebJava
- 免費且離線的同聲翻譯利器「GitHub 熱點速覽」Github
- 微軟釋出商用版Skype可供萬人同時開會微軟
- JavaScript 的 Async/Await 完勝 Promise 的六個理由JavaScriptAIPromise
- 為什麼Linux的htop命令完勝top命令Linux
- FreeLearning 安全譯文集翻譯完畢
- 使用這個報表工具,一張模板完勝百張ExcelExcel
- 完勝人類之後,AlphaGo猝不及防的宣佈“退役”Go
- SKYPE -- Public database projectsDatabaseProject
- 遠端協同辦公平臺哪家勝出機會大?
- 同為分散式快取,為何 Redis 更勝一籌?分散式快取Redis
- win10系統skype訊息不推送怎麼辦_win10系統skype不傳送訊息如何解決Win10
- 2015:開源已經完勝,但這並不是結束
- 谷歌CEO:Android手機日啟用量130萬部 完勝iOS谷歌AndroidiOS
- .net和java串列埠通訊壓力測試對比, java完勝Java串列埠
- 元件:非父子間傳值(同級傳值)元件
- TCP連線——愛的傳聲筒TCP
- MIT、IBM聯合打造AI配音師:檢測動作自動新增音效,影片「無聲」勝「有聲」MITIBMAI
- 同程藝龍接連盈利:勝利與壓力並行並行
- 榮耀和小米手機同時進軍美國 勝算幾何?
- 從這四個設計角度分析,LYFT可以完勝UBER和滴滴叫車
- Kotlin 官方參考文件翻譯完畢Kotlin
- [譯] 同中有異的 Webpack 與 RollupWeb
- README:協同翻譯說明
- Appannie:應用商店大PK Apple Store完勝Google Play–資料資訊圖APPGo
- (譯)win32asm教程-12-完結 (轉)Win32ASM
- Fedora Core 4 基礎教程 (上傳完畢)(轉)
- 百度為AI界打造“同傳高手”或將緩解同傳人員稀缺問題AI