百度為AI界打造“同傳高手”或將緩解同傳人員稀缺問題

pythontab發表於2018-10-24

原文網址 : https://www.pythontab.com/html/2018/ITzixun_1024/1367.html

人工智慧領域，兩種語言的“即時互譯”是一項難以攻克的技術問題，其主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。近日，百度研發了具備預測能力和可控延遲的即時機器翻譯系統，可實現兩種語言之間的高質量、低延遲翻譯。這是自然語言處理方面的重大技術突破，將對機器即時筆譯和口譯的發展起到極大地推動作用。

　　機器同傳利用語音識別技術自動識別演講者的講話內容，將語音轉化為文字，然後呼叫機器翻譯引擎，將文字翻譯為目標語言，顯示在大螢幕或者通過語音合成播放出來。相比人類譯員，機器最大的優勢是不會因為疲倦而導致譯出率下降，能將所有“聽到”的句子全部翻譯出來，這使得機器的“譯出率”可以達到100%，遠高於人類譯員的60%-70%。同時，在價格上也佔有優勢。

　　在機器同傳領域，百度聯合語音技術、機器翻譯技術，從語音識別、翻譯質量、時延、融合領域知識等方面推出了“一攬子”解決方案。

　　在語音識別方面，區別於傳統的上下文相關建模技術，百度提出了上下文無關音素組合的中英文混合建模單元，包含1749個上下文無關中文音節和1868個上下文無關英文音節。該方法具有泛化效能好、對噪聲魯棒、中英文混合識別等特點。

　　在翻譯質量方面，提出了“語音容錯”的對抗訓練翻譯模型，根據語音識別模型常犯的錯誤，在訓練資料中有針對性的加入噪聲資料，使得模型在接受到錯誤的語音識別結果時，也能夠在譯文中糾正過來。比如，語音識別系統將“大堂”錯誤的識別為“大唐”，這一對噪聲詞將被自動收錄到訓練資料中，並將源語言句子“我們在酒店大堂見面吧”替換為“我們在酒店大唐見面吧”，而保持目標語言翻譯不變“Let's meet at the lobby of the hotel”，同時將這兩個中文句子用於訓練，進而獲得具有更強的容錯能力模型。

　　為了降低時延提升翻譯質量，人類譯員通常對演講內容進行合理預測，百度開發人員從人類譯員身上獲得啟示，研發了“wait-k words”模型，可以根據歷史資訊，直接預測翻譯中目標語言詞彙。該模型在翻譯質量和翻譯延遲之間做出了很好的平衡，使用者可通過根據實際需求設定延遲時間(例如延遲1(k=1)詞或延遲5(k=5)詞)。比如，法語和西班牙語這種較為接近的語言，延遲可設定在比較低的水平;但是，對於英語和漢語這種差異較大的語言，以及英語和德語這種詞序不同的語言，延遲應當設定為較高水平，以便於更好的應對差異。

　　在同聲傳譯時，經常會遇到不同領域的專業知識，這就要求同傳人員在短時間內吸收大量相關領域的內容，這對他們也是極大地挑戰。基於此，百度模仿人類同傳的準備過程，提出了快速融合領域知識策略。該策略依託百度海量的網際網路大資料，訓練得到的具有通用翻譯能力的模型;當它接到某一個領域的同傳翻譯任務時，系統會收集該領域資料並在通用模型的基礎上進行增強訓練，得到相應領域增的強模型;最後對該領域術語庫進行強制解碼，使專業術語翻譯得準確可靠，且提升翻譯效率。

　　作為對外開放和商業國際化的需求之一，同聲傳譯被廣泛應用於政府間的峰會、多邊談判和其他商業場合，但是同傳人員稀缺也成為了當前的棘手問題。為了解決全球範圍內同傳譯員人數少、費用高等難題，越來越多開發者專注於機器同傳的研發，百度也希望通過研發高質量機器同傳技術和系統解決即時翻譯難題。

　　雖然機器同傳有了新的突破，但它與經驗豐富的同傳人員相比，依然存在一定差距。百度翻譯技術負責人表示，同傳的目的並不在於取代人類譯員，而是為了降低同傳成本，讓同傳的應用範圍更加廣泛，也希望世界各地的人在AI的助力下早日實現“無障礙”交流。

webuploader在同頁面初始化多個上傳元件問題
2018-08-07
Web元件
元件：非父子間傳值（同級傳值）
2018-09-22
元件
將函式作為引數傳遞解決非同步問題
2018-11-08
函式非同步
Confluence 6 協同編輯問題解決
2020-04-05
解決Gradle下載緩慢的問題，將-bin改為-all
2024-11-22
Gradle
位元組大模型同傳智慧體，一出手就是媲美人類的同聲傳譯水平
2024-07-25
大模型智慧體
HMS Core 機器學習服務打造同傳翻譯新“聲”態，AI讓國際交流更順暢
2022-07-06
機器學習AI
同構——分紅包問題
2019-05-24
react同級元件傳值,使用pubsub.js
2020-11-08
React元件JS
移動端操作同傳有人搞過麼
2024-09-23
運營人員如何快速地將事件傳送到Google Analytics？
2021-05-08
事件Go
Python為什麼不是傳值或傳引用？ - mathspp
2021-11-12
Python
vue 新增axios解決post傳引數為null問題
2020-12-25
VueiOSNull
傳參問題
2020-11-01
Confluence 6 協同或限制
2020-11-01
百度宣佈AI同傳最新突破，釋出高質量低延遲即時機器翻譯系統
2018-10-29
AI
端雲協同，打造更易用的AI計算平臺
2021-12-22
AI
騰訊回應博鰲AI同傳：系謠言，承認出現失誤
2018-04-18
AI
百度雲打造“最落地”AI解決方案釋出業界唯一AI to B平臺
2018-09-04
AI
數字化時代，純前端表格控制元件或將成為協同辦公的解決方案
2021-11-23
前端控制元件
華為帳號多端協同，打造美好互聯生活
2022-06-30
[文件教程]解決sae下文件縮圖上傳問題及外掛上傳問題
2019-05-11
python中傳值和傳地址問題
2018-11-21
Python
開放世界遊戲中的原路返回問題或直接傳送問題分析
2022-06-24
遊戲
Android 覆蓋安裝會同時傳送remove和replace的解決方案
2018-11-26
AndroidREM
英特爾&百度：協同創新打造高效節能資料中心
2021-12-08
遺傳演算法解決TSP問題
2020-04-06
演算法
元件複用傳值（待解決問題）
2019-03-12
元件
8Manage SRM解決傳統採購管理問題打造資訊化時代
2023-02-09
府縣放傳況會壓溫文熱群同pfw
2022-03-04
作為運維人員，如何在遠端辦公的同時保障運維效率？
2020-02-04
運維
二維陣列作為引數傳遞問題
2020-04-06
陣列
新冠狀病毒疫情或將有所緩解部分復工人員無醫用口罩如何防護
2020-02-07
同時使用mybatis和mybatis-plus時，pageHelper失效問題解決
2020-11-02
MyBatis
怎樣成為解決問題的高手？——關於問題解決的關鍵4步驟
2018-03-30
人才即時代：百度AI傳燈錄
2019-08-25
AI
同時訪問內外網解決方案
2020-11-20
傳輸軟體如何幫助外貿人解決檔案傳輸難題？
2020-03-05

百度為AI界打造“同傳高手”或將緩解同傳人員稀缺問題

相關文章