日前,亞馬遜雲科技宣佈通過與光環新網和西雲資料的緊密合作,在北京區域和寧夏區域正式上線Amazon Transcribe Streaming實時流式語音轉錄功能。Amazon Transcribe是一項自動語音識別(ASR)服務,可為使用者提供方便快捷的語音轉文字服務,使用場景包括轉錄客服電話、自動新增字幕、生成會議紀要,以及為媒體資產生成後設資料、建立完全可搜尋的存檔等。Amazon Transcribe根據轉錄的音訊時長、按實際使用量付費,客戶無需花費昂貴的轉錄費用,便能讓開發人員輕鬆地為其應用程式新增語音轉文字功能。欲瞭解更多Amazon Transcribe資訊,可訪問: https://www.amazonaws.cn/transcribe/。

Amazon Transcribe能夠快速準確地將語音轉換為文字,使用者只需投入很少的時間和費用,便可以達到幾乎與手動轉錄相媲美的轉錄效果。使用者可以將它應用於實時音訊流或批量音訊內容,建立包含音訊檔案內容的應用程式。Amazon Transcribe採用深度學習功能自動新增標點符號和格式,生成時間戳;並且,使用者可以通過轉錄控制檯自定義詞彙列表和語言模型,從而為特定領域的詞和片語生成更準確的轉錄,例如產品名稱、技術術語等。此外,Amazon Transcribe可以識別和修訂敏感的個人身份資訊來保護使用者隱私安全,並通過詞彙表篩選掩蔽或刪除轉錄結果中不文明用語,為客戶提供更好的轉錄效果和使用者體驗。

目前,Amazon Transcribe支援多種語言,在批量音訊內容處理中支援多達31種語言,在實時流失轉錄場景下支援包括中文普通話、澳大利亞英語、英國英語、美國英語、法語、加拿大法語、德語、義大利語、日語、韓語、巴西葡萄牙語和美國西班牙語等在內的12種語言。

首汽約車是首汽集團為推動傳統計程車行業轉型升級而打造的網約車出行平臺。在首汽約車的“智慧語音解決方案”專案中,亞馬遜雲科技幫助客戶一起建立了語音降噪和導航音分離演算法模型,先是利用Amazon SageMaker機器學習服務進行模型構建、訓練、調優和部署,再利用Amazon Transcribe人工智慧語音服務將行程錄音自動轉化為文字,從而實現通過場景化的關鍵詞識別分析觸發安全預警,結合後臺安全監控人員的人工判斷,讓實時的行程安全監控從“可能”變成“現實”。首汽約車副總裁閆磊表示“我們與亞馬遜雲科技技術團隊緊密合作,利用Amazon SageMaker、Amazon Transcribe等服務,實現了智慧語音解決方案,將客服人工稽核工作量降低了35%、客服人工聽音稽核時長縮短了20%,且智慧客戶投訴處理的準確率達90%以上,改善了司乘體驗和滿意度,提高了企業運營效率。”

美國全國運動汽車競賽協會 (NASCAR) 是一家美國汽車競賽審批和運營公司,以賽車而聞名。NASCAR 發展部高階總監Patrick Carroll表示:“我們選擇使用 Amazon Transcribe,在我們覆蓋195個國家或地區以及29 種語言的多站點網站上為 NASCAR 的點播內容提供字幕。利用 Amazon Transcribe,我們建立了一個自動化的系統,這個系統幾乎不需要我們的團隊進行操作,同時讓我們能夠自定義自己需要的語音識別功能。應用了 Amazon Transcribe 之後,我們為 99% 的點播內容自動新增了字幕,並且費用比我們最初的估計少97%。”

Audioburst 是一家擁有超前思維,極富創新力的技術提供商,他們讓談話音訊的發現、分發和個性化發生了轉變,Audioburst 聯合創始人兼技術長Gal Klein說:“每天,我們分析225,000 分鐘的實時電臺訪談,以形成數以千計的關於播放列表和搜尋的短主題片段。我們選擇 Amazon Transcribe 是因為它作為出色的語音識別引擎,可幫助我們轉錄實時視訊內容,用於下游內容製作工作流。”