語音識別進入IVR系統 (轉)
楊阿昭 2000/12/07
最近,關於IVR系統最流行的話題無疑是語音識別的引進,它一方面提高了IVR系統的,另一方面又大大豐富了IVR系統的介面。
最初,IVR系統(自動語音應答系統)引起了呼叫中心的注意,是因為它使利用按鍵式電話的鍵盤對提示做出響應,就能夠無需坐席代表的幫助而獲取資訊。在將呼叫傳送到坐席之前,IVR系統也能幫助呼叫中心識別使用者與其請求的性質。這樣,透過使這些電話呼叫自動化,IVR系統為呼叫中心節約了不少資金。
按鍵式IVR受多方侷限
在傳統的IVR系統中,使用者與系統互動的方式是透過電話的鍵盤。通常,使用者在進入IVR系統後,會聽到相關的語音提示選單,根據自己的需要可以按下鍵盤上相關的按鍵。系統透過DTMF訊號傳送使用者按下的鍵,同時也將使用者的請求傳送給系統,從而觸發相關的語音資訊。這樣,對於一些常見的使用者請求,呼叫中心繫統就可以透過IVR系統來處理,而不需要透過坐席代表的干預,極大地提高了呼叫中心的效率。
然而,按鍵式IVR系統的侷限也是顯而易見的。特別對於使用者來說,在實際使用時更會感覺到諸多的不方便。首先,在聽完了大段的語音提示選單後,使用者需要特地停下來,按動電話上有限的數字按鍵,進行相應的選擇,然後繼續聽下一段的語音提示。如果遇到簡單的查詢還可以忍受;如果是多層次的查詢,使用者則需要不停地聽提示,再選擇按鍵,再聽提示,再選擇……多次選擇,才可以得到所需的資訊。這對於以“客戶服務”為核心的呼叫中心來說,顯然是背道而馳的。
其次,我們都知道,傳統的電話僅能透過DTMF訊號,傳送有限的幾個數字及符號按鍵。這使得使用者與系統的互動介面受到很大的限制,同時也就使得IVR系統的資訊查詢範圍變得相當狹窄,只能是事先錄好的各種提示音和資訊。使用者一旦有一些小的請求,但不是事先預錄資訊所涵蓋的內容,就只好求助於坐席代表了。因此,傳統的按鍵式IVR系統在減少呼叫中心繫統的坐席代表的工作量、提高工作效率方面也很有限。
用語音給IVR發請求
正因為按鍵式IVR系統的多方侷限,近幾年來IVR系統的一個發展趨勢就是:採用語音識別(ASR)技術,透過語音來輸入使用者請求,這也成為呼叫中心的一個富有吸引力的選擇。
將語音識別技術引入到IVR系統的優勢是顯而易見的。一方面,用於IVR系統的語音識別能夠加快事物處理的速度,而這些事物處理起來往往相對複雜,以致不能在傳統的按鍵式IVR系統中實現自動化。例如,在預訂飛機票時,在按鍵式IVR系統中,要求航空公司列出所有可能的出發和到達的城市是不現實的。但如果不列出所有航班的相關資訊,使用者卻無法接受這種服務。當有了語音識別系統以後,使用者只需說出他們的起點和終點的城市名字就可以了。
同時,語音識別技術的引進,也大大豐富了人機互動介面,使使用者和IVR系統的互動方式變得靈活而方便,使用者可以直接用語音進行有關的互動工作。由於使用語音和自然語言,使用者在使用IVR系統時,就像與服務員一樣進行直接交流一樣,連續地說出自己的請求和選擇,而避免了在按鍵式IVR系統中頻繁按鍵的過程。
另外,引入語音識別技術也有利於呼叫中心的運營管理。透過語音識別技術,呼叫中心繫統將大量的重複性問題分流到IVR系統中。一方面,充分發揮了IVR系統的潛力;另一方面,透過將呼叫中重複性的請求自動化,坐席代表可以處理更多特性化的請求,就不會感到枯燥無味,因為不需要再一遍一遍地重複處理相同的問題。
涉足語音識別IVR
因為看到IVR系統引入語音識別技術後的巨大市場,ASP也開始提供這方面的解決方案。這對於沒有技術和財力支援,或者不願用這些資源來購買解決辦法的公司來說,是非常有利的。但ASP面臨的一項挑戰就是,要盡力保證語音識別應用在任何時間都能夠調整和升級。語音識別是一項複雜的技術,它需要投入大量的維護以確保其執行在最佳狀態。
以Voci為代表,它的Sereno語音識別平臺可使用Nuance的語音識別軟體、Edify的IVR應用軟體和 NMS的語音板。Voci提供了能被用於跨越許多垂直產業,如目錄公司、旅遊公司和公用事業的應用程式。一些應用程式還具有讓使用者下定單並檢查定單處理情況的功能。Voci時常關注著語音識別應用程式應用得如何以及與使用者的互動作用如何。Voci的語音識別應用程式按照呼叫的個數來計算成本,每個呼叫價格在0.5美元到1.25美元之間。
在必要時,ASP能夠將呼叫傳送回呼叫中心,這一點對ASP和呼叫中心來說,都是非常必要的。不論使用者決定購買還是租用語音識別系統,應確保所選擇的銷售商具有人機介面方面和對話設計方面的專業技術,這一點和使用者密切相關。不需要考慮隱藏在介面背後的技術,最關鍵的是要有一個清晰流暢的對話。
應用有待完善
經過多年技術的發展和完善,語音識別引入到IVR系統終於慢慢進入了商用。但不可否認,該系統還有待進一步完善。
筆者曾經有過親身經歷,在今年年初語音識別大舉進入商用時,饒有興趣地撥通了電話,在聽完提示音後非常謹慎標準地說出了自己的請求,卻不曾想系統沒了反應,好歹就是不能識別筆者的發音。想到自己是南方人,可能發音不夠標準,於是趕緊拽過了旁邊的一位北京人,希望他能被語音識別系統接納。很不幸,他的遭遇不比本人強。因此,要想真正地將語音識別IVR系統推廣,語音識別還需要多方面的加強。
目前的語音識別技術,還存在許多的技術難點。英語方面研究較多,也比較成熟,有些方面已經可以進行商用。但在漢語方面,還有很多的工作要做,主要包括識別自然語句、適應各種不同的發音等。此外,由於語音識別技術還比較新,因此在CTI產業中還沒有形成影響力,缺乏一支相應的產業化隊伍進行推動。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752043/viewspace-987770/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 5 款不錯的開源語音識別/語音文字轉換系統
- 樹莓派語音互動--語音輸入識別樹莓派
- [譯] 使用 WFST 進行語音識別
- Windows10系統如何禁用語音識別功能Windows
- 谷歌再獲語音識別新進展:利用序列轉導來實現多人語音識別和說話人分類谷歌
- 語音識別--kaldi環境搭建(基於Ubuntu系統)Ubuntu
- 基於語音識別的會議記錄系統
- python語音識別入門及實踐Python
- 語音識別模型模型
- Kaldi搭建語音識別系統—發音詞典相關檔案準備
- 語音識別技術與政務資訊系統結合
- JavaScript的語音識別JavaScript
- 語音識別技術
- 語音情感識別--RNNRNN
- 新一代 Kaldi: 支援 JavaScript 進行本地語音識別和語音合成啦!JavaScript
- 極速進化,光速轉錄,C++版本人工智慧實時語音轉文字(字幕/語音識別)Whisper.cpp實踐C++人工智慧
- 文字語音互相轉換系統設計
- win10系統下語音識別打不開的解決方法Win10
- OpenAI 釋出新語音系統「Whisper 」,英文識別能力可接近人類水平OpenAI
- Swift-語音識別、翻譯Swift
- Python語音識別終極指南Python
- 人工智慧 (08) 語音識別人工智慧
- ASR-使用whisper語音識別
- win10系統語音聲音小怎麼設定 win10系統語音聲音特別小處理方法Win10
- 使用 SpeechT5 進行語音合成、識別和更多功能
- 是誰在說話?谷歌多人語音識別新系統錯誤率降至2%谷歌
- 人工智慧之語音識別(ASR)人工智慧
- 百度API---語音識別API
- 語音識別2 -- Listen,Attend,and Spell (LAS)
- 危險區域闖入識別系統
- 語音直播系統原始碼開發語音直播系統部署搭建原始碼
- win10如何使用語音輸入_win10系統實現語音輸入的方法Win10
- 別急著進入智慧語音行業,先看看市場趨行業
- C# 10分鐘完成百度語音技術(語音識別與合成)——入門篇C#
- 帶你玩轉OpenHarmony AI:打造智慧語音子系統AI
- 語音轉文字工具,語音轉文字怎樣轉?
- 怎麼關閉win10語音識別 win10如何關閉電腦的語音識別Win10
- 聽懂未來:AI語音識別技術的進步與實戰AI
- 醫院影像科室PACS系統原始碼,預載入窗、音影片技術、影像識別原始碼