簡單剖析智慧語音互動技術

發光的房子君發表於2019-06-19


機器學習和自然語言處理技術的進步為語音與人工智慧的互動提供了可能。人們可以透過對話獲得資訊,並與機器互動,而機器將不再只存在於科幻小說中。語音互動是未來的發展方向。智慧揚聲器是語音互動著陸的第一代產品。


以市面上面流行的智慧電話機器人為例,他的AI模組主要包含了4部分自動語音識別(Automatic Speech Recognition, ASR),自然語言理解(Natural Language Understanding, NLU)

,自然語言生成(Natural Language Generation, NLG),文字轉語音(Text to Speech, TTS)



要想完整完整的完成語音互動,必須要弄懂流程,這是一款電話機器人好不好用的關鍵,以歐能智慧機器人中的語音互動流程圖為例子,一次成功的語音互動流程,主要涉及以下4個階段,且環環相扣。


意圖

表示使用者在使用應用時所做的動作(譬如:問一個問題或傳送一條指令),這些意圖代表了應用的核心功能。如果應用成功地識別了使用者意圖,則需要在完成業務動作後,將結果反饋給使用者。


識別意圖—語義解析

對語音識別結果進行分析理解,簡單來說就是將使用者語音輸入對映到機器指令。它可能定義了一組包含指定的單詞或短語的語法結構,使用者透過說出滿足這種結構的語句,來呼叫意圖。


處理意圖—雲端互動

呼叫意圖的結構化請求,向伺服器請求處理後做出反饋響應。 通俗來講該流程主要處理使用者的請求,解決使用者問題的答案。


語言合成模組 – 組織語言

根據解析模組得到的內部表示,在對話管理機制的作用下生成自然語言句子。 同時將生成模組生成的句子轉換成語音輸出。(把回答的機器語言再轉換成 口語語言)


整個流程雖然看起來較為簡單,但是中間的自然語言處理的關鍵技術是必須要掌握的。


詞法分析

詞彙分析包含形態和詞彙。一般來說,形態素主要反映在單詞的字首和字尾的分析上,詞彙反映在整個詞彙體系的控制上。在中文全文檢索系統中,在中文資訊、即中文自動單詞分割技術的單詞分割中,詞彙分析主要出現。利用該技術,能夠正確解析使用者輸入資訊的特性,完成正確的搜尋過程。是中文全文檢索技術的重要發展方向。


句法分析

句法分析是對使用者輸入的自然語言進行詞彙短語的分析,目的是識別句子的句法結構,實現自動句法分析過程。其基本方法有線圖分析法、短語結構分析、完全句法分析、區域性句法分析、依存句法分析等。


語義分析

語義分析是基於自然語言語義資訊的一種分析方法,其不僅僅是詞法分析和句法分析這樣語法水平上的分析,而是涉及到了單詞、片語、句子、段落所包含的意義。其目的是從句子的語義結構表示言語的結構。中文語義分析方法是基於語義網路的一種分析方法。語義網路則是一種結構化的,靈活、明確、簡潔的表達方式。


語用分析

語用分析相對於語義分析又增加了對上下文、語言背景、環境等的分析,從文章的結構中提取到意象、人際關係等的附加資訊,是一種更高階的語言學分析。它將語句中的內容與現實生活的細節相關聯,從而形成動態的表意結構。


語境分析

語境分析主要是指對原查詢語篇以外的大量“空隙”進行分析從而更為正確地解釋所要查詢語言的技術。這些“空隙”包括一般的知識,特定領域的知識以及查詢使用者的需要等。它將自然語言與客觀的物理世界和主觀的心理世界聯絡起來,補充完善了詞法、語義、語用分析的不足。


 智慧電話機器人對話目前存在的問題

在人與機器的會話過程中,使用者必然會犯表達錯誤,導致使用者語言機械理解的偏離。此時,錯誤修正機構對於機器來說非常重要。如果這個機制不能利用,使用者顯然需要花費很長時間來說明他們的意圖,並且對應的使用者經驗非常壞吧。另一方面,能夠很好地認識語音,但是不能理解對話的目的,有理解意義的偏頗。因此,語音對話中應解決的問題是模糊消除和未知語言現象的處理。


智慧語音助手背後的生態服務

一個好的智慧電話機器人要想落地開花,它不僅僅是簡單的語音識別那麼簡單,還有整合服務,一整套的中文生態、內容、服務等配套設施,是一種涵蓋很多基礎能力的生態系統。

未來基於語音互動的語義技能,必須要能夠達到幾萬、幾十萬甚至上百萬種的時候,才能促使語音互動時代作業系統真正走向成熟,未來語音互動產品的形態和樣式也將越來越豐富。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69925861/viewspace-2648112/,如需轉載,請註明出處,否則將追究法律責任。

相關文章