“小會話，大學問”：如何讓聊天機器人讀懂對話歷史？

PaperWeekly發表於2017-07-07

作者 | 吳俁，武威，星辰，李舟軍，周明（北航&微軟研究院）

特約記者 | 曹東巖（哈爾濱工業大學）

人工智慧現在的火熱程度大家有目共睹，凱文凱利在《必然》中預測未來時代的人工智慧可能會重新定義人類的意義，但時下的人工智慧發展水平顯然還沒有大家想象得那麼美好，仍然需要我們不斷地探索。目前眾多研究人員正深耕其中，作為其中代表的聊天機器人（Chatbot），已然成為科研界研究的熱點。

通常來說聊天機器人實現方式有兩種：一種是基於生成式，即機器人“自己說話”，一個字一個字創作出回覆語句來。另外一種是基於檢索式，即機器人“轉發”別人的話。從網際網路大家的話語中尋找到合適的回答予以轉發。

現有的生成結果由於技術所限，或多或少都存在語句不流暢的問題，但能夠做到“有問必答”偶爾還能蹦出“彩蛋”。檢索的模型一般流暢性方面無須擔心，不過隨著目前網路資源的日益豐富，語料規模也越來越大，如何從眾多語句中選擇合適的句子作為回覆是檢索式聊天機器人的核心問題。

雖然目前市場上的聊天機器人眾多，但我們見到的那些貌似都不是那麼聰明。最直觀的一個體現就是前後不連貫，上下難銜接，因此在進行檢索的時候考慮歷史資訊則顯得尤為重要。那麼如何讓機器人理解對話歷史資訊從而聰明地進行回覆呢？微軟亞洲研究院的研究員們提出了一個模型 Sequential Matching Network（SMN）。相關論文的作者吳俁談到“SMN 模型可以讓聊天機器人準確的理解當前和使用者的對話歷史，並根據歷史給出最相關的回覆，與使用者進行交流，達到人機對話的目的。”

但這在實現的過程中也遇到不少難點，“精準計算聊天曆史和候選回覆的語義相似度十分困難，主要的挑戰有兩個方面：（1）由於聊天曆史資訊繁多，如何將歷史中重要的詞語、短語以及句子選擇出來，並通過這些重要部分刻畫聊天曆史，是一個亟待解決的問題；（2）如何對聊天曆史中的各輪對話進行建模，如何判斷對話歷史中的跳轉，順承等關係，也是一個棘手的問題。” 那麼論文作者提出的 SMN 模型又是如何解決這兩個問題的呢，接下來我們將為您解讀。

▲ 圖1：SMN網路架構

SMN 模型一共分為三層。第一層為資訊匹配層，對之前的歷史資訊和待回覆的句子進行匹配度計算：同時進行詞語（embedding 向量）和短語級別（GRU 表示）的相似度計算。然後再把這兩個矩陣分別作為卷積神經網路的一個 channel，利用 CNN 的 max-pooling 進行特徵抽象，形成一個匹配向量。第二層為匹配積累層，利用一個 GRU 神經網路，將每一句話和回覆所計算出的匹配資訊進一步融合。第三層為匹配結果預測層，利用融合的匹配資訊計算最終的匹配得分，在預測時他們使用三種策略，分別是隻利用 GRU2 最後一個隱藏層（SMN_last），靜態加權隱藏層（SMN_static），和動態加權隱藏層（SMN_dynamic）。在進行檢索的時候，他們將最後一句的資訊結合上文歷史資訊中的 5 個關鍵詞（歷史資訊中用 tf-idf 進行篩選，選擇 Top 5 關鍵詞）在系統中進行檢索，然後用上述 SMN 網路對候選結果打分從而選出回覆句。

作者分別在 Ubuntu 語料（大型公開計算機相關求助與解答語料）和豆瓣語料（作者從豆瓣小組的公開資訊中爬取並在論文中公佈）上進行了實驗，分別以 Rn@K 和 MAP、MRR、P@1 為評價指標，取得的結果均為目前最好。

作者表示“SMN不同以往的模型，第一步不進行上下文的建模學習，而是讓每句話和回覆進行匹配度計算，這樣可以儘可能多的保留上下文的資訊，以避免重要資訊在學習上下文的向量表示時丟失。而且 SMN 在對上下文句子關係建模時，考慮了當前回復的影響，使得回覆成為一個監督訊號，這樣可以更準確的對上下文歷史進行建模。”並且吳俁向我們透露“據我們所知，我們公佈的豆瓣語料是第一個人工標註的中文多輪對話語料。”

在談及目前的方法還有哪些不足之處時，作者表示“目前我們的檢索方式有時找不到正確的候選句，所以第一步的檢索方法還有待改善，另外雖然我們的模型可以建模當前回覆和歷史資訊的關係，但還是無法避免一些邏輯上的問題，不過這也是我們未來工作的重點，我們將繼續提高候選回覆在邏輯上的連貫性”，讓我們共同期待他們的未來工作。

✎ 文末福利

論文中公佈的豆瓣語料和程式碼連結：

github.com/MarkWuNLP/M…

歡迎點選檢視論文：

Sequential Match Network: A New Architecture for Multi-turn Response Selection in Retrieval-based Chatbots

關於PaperWeekly：

PaperWeekly 是一個推薦、解讀、討論、報導人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域，歡迎在公眾號後臺點選「交流群」，小助手將把你帶入 PaperWeekly 的交流群裡。

微信公眾號：PaperWeekly

新浪微博：@ PaperWeekly

如何讓聊天機器人懂情感
2017-04-27
機器人
智慧聊天對話機器人的對比
2018-12-18
機器人
人機對話，不再尬聊：聊天機器人的未來
2019-02-13
機器人
電話機器人是如何實現對話的？
2021-07-29
機器人
兩個機器人聊天對話實現原始碼
2015-02-10
機器人原始碼
用圖靈機器人實現的兩個機器人對話聊天
2015-11-18
圖靈機器人
電話機器人普及會讓電銷人員失業嗎？
2021-08-05
機器人
打造一個window桌面應用：線上聊天對話機器人
2021-07-21
機器人
[oracle] 查詢歷史會話、歷史執行計劃
2021-01-29
Oracle會話
如何最佳化產品設計，讓對話機器人更智慧？
2020-06-09
機器人
讓人工智慧學會幽默，人機對話不尷尬
2019-04-03
人工智慧
檢視歷史會話等待事件對應的session資訊
2017-09-12
會話事件Session
對話機器人ChatBot綜述
2018-07-09
機器人
深入學習History物件管理瀏覽器會話歷史
2017-04-25
物件瀏覽器會話
對話式服務思考，如何在 Messenger 用聊天機器人做好客戶服務
2020-12-01
Messenger機器人
LeWIS：中國聊天機器人 -對話式商務的興起（附下載）
2022-01-01
機器人
查詢oracle歷史最大連線[會話]數
2010-07-06
Oracle會話
讀懂智慧對話系統（1）任務導向型對話系統
2018-11-23
DeepPavlov：一個訓練對話系統和聊天機器人的開源庫
2018-02-27
機器人
對話業務報告：聊天機器人將重塑網路體驗（附報告）
2017-07-07
機器人
電話銷售人員會被機器人取代嗎
2018-08-23
機器人
回顧·智慧導購對話機器人實踐
2018-08-26
機器人
智慧對話機器人實戰視訊教程
2018-11-16
機器人
揭祕任務型對話機器人（上篇）
2018-06-14
機器人
揭祕任務型對話機器人（下篇）
2018-06-14
機器人
智慧對話機器人如何設計產品主流程框架？
2020-06-11
機器人框架
電話機器人好用嗎？
2021-08-06
機器人
如何看待電話機器人的利與弊？
2021-08-12
機器人
如何和技術人員對話
2013-06-01
python語音智慧對話聊天機器人，linux&&樹莓派雙平臺相容
2016-08-19
Python機器人Linux樹莓派
未來電話機器人會取代人工坐席嗎？
2021-07-21
機器人
Figure首發OpenAI機器人可與人類全面對話
2024-03-14
OpenAI機器人
IBM對話設計指南：對話聊天框設計挑戰
2018-12-24
IBM
為什麼電話機器人回答不上問題？
2021-07-14
機器人
電話機器人的話術怎麼製作效果好
2021-07-13
機器人
智慧電話機器人的好處
2021-07-14
機器人
智慧電話機器人怎麼樣？
2021-08-06
機器人
使用電話機器人有哪些便利？
2021-07-28
機器人

“小會話，大學問”：如何讓聊天機器人讀懂對話歷史？

相關文章