人工智慧的3種人機語義形式

AIBigbull2050發表於2019-10-25

人工智慧的發展走過了從機器智慧到感知智慧的階段,正在邁向認知智慧的階段。然而由於人類複雜的語言系統,一問一答形式的人機互動已經滿足不了使用者的真實需求,機器必須學會處理人類複雜的語言。

隨著語音識別、NLP等技術的成熟,多輪對話互動系統將成為人機互動的重要紐帶和橋樑。

目前市場上人機對話互動主要分為三種型別:任務型、問答型、閒聊型。

任務型主要目的就是根據使用者描述的問題,收集必要的引數資訊以完成使用者的任務;問答型主要透過模型的解析,匹配知識庫的答案並提供給使用者;閒聊型主要以調節情緒,在使用者當下的使用場景,以貼近使用者情感為目的,拉近使用者的距離。

人機對話互動中,機器處理自然語言時需要用到不同的語義表達形式來處理。主要有分散式語義、框架式語義、模型式語義。

01 分散式語義

可以簡單的理解為相似句模型解析。分散式語義需要標註大量的訓練資料,大量的知識點會形成一個向量空間。當使用者問題過來時,機器先將使用者的問句進行分詞,根據分詞結果匹配詞庫,也可以將語義理解成向量,機器根據空間向量分佈判斷給出最優解。

日常在進行模型調優時,我們主要從資料和演算法兩個方面進行調優,再根據模型的正確率和召回率,找到最優的f值,給定模型的閾值。

目前大量的機器學習都用的是分散式語義,依靠資料來處理語義間的關係,但分佈語義理解比較淺,很難處理深層的語義。

02 框架式語義

現在市場上有很多的語音助手產品,透過獲取使用者問題中的關鍵引數,然後將引數填入協議中,完成使用者的任務操作。

例如“查一下7月1日上海到洛杉磯的航班”,這句話中我們需要獲取到使用者的四個資訊槽位:

  • 首先我們明確使用者的場景,使用者是想查飛機的航班資訊,所以結果裡肯定不能出現汽車、火車等場景;
  • “7月1日”對應的肯定是時間的引數time,所以查詢的結果裡肯定是7月1日當天的一個航班資訊;
  • 使用者的出發地是上海,目的地是洛杉磯,分別對應引數裡的origin、destination,所以這邊兩個引數不能顛倒,不然查詢的結果就不是使用者真實想要的資訊了。

可以看到框架式語義最重要的就是要識別語義中的引數資訊,缺一個都不能完成使用者的真實需求。所以在框架式語義中,框架識別和引數識別是非常重要的。

但用框架語義處理一些指代詞等高階的語言或需要結合上下文理解的時候,會因為缺少某一個槽位,而丟失使用者資訊,所以現在很多框架語義配置時用了“平行槽位”。

首先明確在某一場景下,我們需要獲取哪些槽位資訊,當配置了平行槽位後,使用者語義中缺少哪一個槽位資訊,透過配置追問話術,將槽位資訊補全,以完成使用者的最終目的。

03 規則式語義

規則式語義就是將使用者問句透過表示式的形式進行匹配,當滿足規則要求時,給出結果回覆。

要讓使用者問句能透過規則匹配問題,首先要明確走規則匹配邏輯要優先於相似句匹配。規則也需要獲取問句中的實體資訊,滿足要求後,即可匹配上。

下面就舉一個例子:

我們看這條規則由 () {} . & | : # 等標點符號,也有欄位等資訊組成的一條規則。看這規則會覺得比較亂,但細細分析,其實還是很簡單的一條規則。

首先明確這個規則的意圖,是一個開啟動作,說明是一個指令。後面需要填寫的槽位資訊就是A股、港股、美股的槽位資訊、最後一個就是欄目。所以可以確定這條規則就是一個“開啟某隻股票的個股資料”。

因為每個標點代表的意思是不同的,這就不細細說明了。所以當使用者問句滿足這個規則要求,就滿足了這個規則對應的標準句,那使用者就能得到該標準句對應的答案了。

不同的語義處理形式邏輯都不同,但最終的目的還是為了能完成使用者下達的任務或操作。隨著分詞技術、實體抽取、NLU等技術的成熟,人機互動會更加和諧,處理效率會越來越高。

 



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2661393/,如需轉載,請註明出處,否則將追究法律責任。

相關文章