華為機器學習服務語音識別功能,讓應用繪“聲”繪色

HMSCore發表於2022-06-24

隨著人們對生活的儀式感的追求,移動裝置、可穿戴裝置、智慧家居裝置、車載資訊娛樂系統也變得越來越流行。在這些應用上,滑鼠、鍵盤這樣的互動方式不再便捷,而語音作為人類之間最自然的交流方式,語音識別技術儼然已成為各大應用的“標配”。語音識別場景應用十分廣泛,如語音輸入法、語音搜尋、實時字幕、遊戲娛樂、社交聊天、人機互動、駕駛模式等。因此,App裡整合語音識別功能不僅能解放雙手,也能得到很好的人機互動體驗。

1. 業務簡介

HMS Core機器學習服務實時語音識別服務支援將實時輸入的短語音(時長不超過60秒)轉換為文字,可實時識別60秒內的語音。該服務使用行業領先的深度學習技術,隨著演算法和資料的不斷迭代,目前在通用理想環境下的識別準確率可達95%以上。目前支援中文普通話(包括中英文混說)、英語、法語、德語、西班牙語、義大利語、阿拉伯語、俄語、泰語、馬來語、菲律賓語的識別。

DEMO演示

2 . 場景介紹

HMS Core機器學習服務實時語音識別服務覆蓋日常生活及工作中的眾多領域,並且深度優化了購物搜尋、影視搜尋、音樂搜尋以及導航等場景中的識別能力,進一步提高這幾類場景的識別準確率。在使用購物類App搜尋商品時,可以將語音描述的商品名稱或特徵識別為文字從而搜尋到目標商品。同樣,在使用音樂類App時,可以將語音輸入的歌名或歌手識別為文字進而搜尋歌曲。另外,司機在駕駛過程中不方便輸入文字時,可以將輸入的語音轉換為文字繼而搜尋目的地,讓行車更加安全。

3 . 功能特點

• 支援實時出字

• 提供拾音介面、無拾音介面兩種方式

• 支援端點檢測,可準確定位開始和結束點

• 支援靜音檢測,語音中未說話部分不傳送語音包

• 支援數字格式的智慧轉換,例如語音輸入“二零二零年”時,能夠智慧識別為“2020年”。

如何接入華為機器學習服務?

華為機器學習服務官網為您提供詳細的文件指導

瞭解更多詳情>>

訪問華為開發者聯盟官網
獲取開發指導文件
華為移動服務開源倉庫地址:GitHubGitee

關注我們,第一時間瞭解 HMS Core 最新技術資訊~

相關文章