應用與互動,智慧電話的幾個重要模組
在資訊交流的方式和語言上面,對於人類來說是一件很容易做的事。然而,於機器而言語音識別就不會那麼簡單了,其中涉及的技術以及邏輯都很繁瑣。
語音識別,又稱為自動語音識別(AutomaticSpeechRecognition,ASR),指計算機可以自動將人類的語音內容轉換成相應的文字,然後呈現給人類的技術。語音識別技術已有50多年的歷史。近年來,語音識別技術得到了廣泛的應用才剛剛開始。隨著移動裝置、可穿戴裝置、智慧家居裝置、智慧電話機器人或系統的日益普及,對話互動逐漸成為人機互動的焦點。
1、語音識別的組成部分
語音識別主要由以下基本模組組成:資訊處理與特徵處理、聲學模型(AM)、語言模型(LM)、發音(語音)字典和解碼器。
訊號處理和特徵提取。
它是系統語音識別的第一個步驟,也是第一個部分。在接受原始的音訊訊號的同時還要為後續的升學模型提取適當的的代表性特徵向量,就是由它來完成。在訊號的處理方面,它能夠在比較嘈雜的環境下把人聲識別率提到最優解。
聲學模型。
提到聲學,就不得不提到大名鼎鼎隱馬爾科夫模型,通常的語音識別系統都能透過這個模型對詞、音節、音素等基本聲學單元進行建模,然後生成模型。簡單來講就是對發聲建模,把語言輸出轉換為聲學輸出。
語言模型。
語言模型用於對系統需求辨認的語言進行建模。各種語言模型,包括和上下文無關語句,都能夠用作言語模型。現在,大多數語音辨認體系普遍採用計算N-gram模型及其變體。它能夠透過訓練學習單詞和單詞之間的聯絡來估量假設單詞序列的可能性。
發音詞典。
發音詞典包含系統所能處理的單詞的集合及其發音。發音詞典得到了聲學模型建模單元和語言模型建模單元之間的對映關係,將兩者連線起來,組成一個搜尋的狀態空間用於解碼器進行解碼工作。
發音詞典包含系統可以處理的單詞及其發音的集合。語音字典獲取聲學模型構建單元與語言模型構建單元之間的對映關係,並將它們連線起來形成一個搜尋狀態空間,有了兩者的相互結合就可以用於解碼器解碼工作。
解碼器。
這是一個語音識別系統的最核心部分之一,一款合格的電話機器人好不好用就要看這裡,作為語音識別系統的核心之一,其任務主要負責讀取輸入的語音訊號的特徵序列,再根據聲學模型、語言模型及發音詞典,解碼出以最大機率輸出該訊號的詞串。
語音識別就是一個先編碼後解碼的過程,訊號處理和特徵提取就是編碼的過程,由原始的語音得到語音向量。後面即是對語音向量的解碼,而解碼需要上面提到的聲學模型和語言模型。
2、機器如何識別語音
對於計算機室視覺來說,語音識別更為純粹,因為只有一個核心的任務,就是講人類的語言轉化為機器人能夠編譯的資料然後轉化為文字然後呈現出來。簡單來說這些文字就是將聲音幀切成音素再組合成單詞,也就使語音轉化成了文字。
3、語音識別的應用及發展
因為上訴技術逐漸成熟,催生出了電話機器人,這是近幾年興起的人工智慧產品,以歐能智慧機器人為例子,它主要透過電話群呼潛在客戶,溝通進行資訊篩選,幫助企業選擇意向客戶。企業使用電話機器人可以減少人工成本,提高工作效率。這些方面的應用能極大的減少人工上面的成本,很多企業的發展也不會拘泥。
從大的方向上面來說,雖然語音識別技術仍然還有許多亟待提高的地方,比如方言的語音識別、高噪音環境下的語音識別等方面還有一段路要走。但不可否認的是,隨著資訊科技的不斷髮展,語音識別技術也將不斷獲得突破,有著更加廣闊的發展空間。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69925861/viewspace-2648195/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- iOS VoIP電話:CallKit與PushKit的應用iOS
- QT QML模組與C++的互動QTC++
- 體感互動大屏的功能與應用
- 對話每日互動CEO方毅:資料智慧應用的過去、現在和未來
- 智慧家居下一站:互聯與應用?
- 人工智慧電話的應用場景有哪些方面?人工智慧
- 實時語音互動,打造更加智慧便捷的應用
- 推動PLM應用升級的幾個要素
- IBM幾個電話面試問題IBM面試
- 用sql,shell來描述生活中要電話號碼的幾個場景SQL
- (重要)關於效能的幾個主要動態檢視
- 互動式推薦在外賣場景的探索與應用
- 幾個重要的svg網頁SVG網頁
- AI金融「互動應用」的窘境與進擊的獨角獸AI
- 如何應用多媒體互動展廳的互動技術
- Flex與後臺互動的幾種方法詳解Flex
- Nginx的HTTP模組與Stream模組:區別與應用場景NginxHTTP
- Android -- 與WEB互動在同一個會話Session中通訊AndroidWeb會話Session
- 進入與退出應用 / 會話重用與自動登入會話
- 機器學習中比較重要的幾個概念機器學習
- 幾個重要的內建函式函式
- 資料智慧應用加速落地,每日互動鞏固發展新動能
- FRAM在智慧電子式電錶中的應用
- 體感互動的多方面應用
- 口袋中的應用:互動介面重思考
- iOS應用自動撥打電話,開啟攝像頭缺陷iOS
- 分散式智慧微電網的建設方案與應用場景分散式
- 分享幾個重要的Android面試題Android面試題
- 互動投影的應用都具備哪些特性
- 投影互動牆在廣告行業的應用行業
- 互動投影的應用都有哪些形式及用途
- BOSHIDA DC電源模組的工作原理及應用
- 影響資料庫效能與穩定性的幾個重要引數資料庫
- 智慧斷路器應用方案之智慧消防用電
- 【MySQL】MySQL主從配置幾個重要的啟動選項含義MySql
- 關於手機應用消費者互動策略的5個建議
- 這些成功的人工智慧應用,你見過哪幾個?人工智慧
- 字元陣列的幾個應用函式字元陣列函式