ACL 2019對話系統論文綜述，一文帶你縱覽16篇前沿研究

机器之心發表於2019-08-14

原文網址 : https://www.jiqizhixin.com/articles/2019-08-14-5

自然語言處理的國際頂級會議 ACL2019 剛在文藝復興的發源地-義大利的佛羅倫薩落下帷幕，最佳論文等各獎項也都名花有主。本文概述了ACL對話與互動系統中的報告論文，16 篇優秀論文看這篇文章就行。

這次會議共接收到投稿 2905 篇，比 2018 的 1544 近乎翻倍，接收文章數為 660 篇，接收率為 22.7%，與 2018 年的 24.9%，2017 年的 23.3% 差別不大。

這次會議包含了 22 個主題，中國學者表現出色，長文投稿 567 篇，被接收 118 篇，接收率在 20.8%，僅次於美國的 154 篇，並且斬獲了本次會議的最佳論文獎項。

我們對對話系統比較關注，因而梳理了會議中 Dialog and Interactive Systems（對話和互動系統）下的文章，該主題共接收長文 38 篇，有 16 篇在會議中做了報告。下面介紹報告中的相關論文。

本次會議中，Dialog and Interactive Systems 分了三個 p，分別是 Neural Conversation Models, Task-Oriented Dialog, 和 New Task。

神經網路對話模型（Neural Conversation Models）

這個 p 的工作，是在給定對話歷史的情況下，如何通過模型來選擇對話中最優的回答：

ACL 2019對話系統論文綜述，一文帶你縱覽16篇前沿研究

論文 1：Boosting dialog response generation
作者：WenChao Du，Alan W Black
論文連結：https://www.aclweb.org/anthology/P19-1005

文章針對對話系統中容易出現的通用和一般性回答，做了些優化來提升生成對話文字的相關性和多樣性。其工作，是基於 RAML（Reward-augmented Maximum likelihood learning, Norouzi 2016）模型：該模型的目標是最大化預測的分佈 y*在模型中條件概率分佈 p（y|x），並在模型迭代中採用連乘的 boosting，使每一輪迭代能更好的模擬分佈。

本文的優化，是在模型迭代中假設訓練資料的分佈服從均勻分佈，來簡化 boosting 的過程，並把這個假設擴充套件到 RAML 模型的指數回報分佈（exponential payoff distribution）中：

ACL 2019對話系統論文綜述，一文帶你縱覽16篇前沿研究

在實驗中，作者發現通用的回答也不一定總是有低混淆度 Perplexities（Li 2017b），而高混淆度會在迭代中增強對應的回答的權重，導致通用回答在後面的迭代中出現的頻率越來越高。普通的區分模型，是通過學習人產生的回答與生成式回答的差異，但在這，生成式回答數量太少，模型能輕易記住所有人類的回答，導致模型不好泛化。

作者採用了一個基於規則的區分模型：在每次迭代中，保留一個最常出現的生成式回覆的列表，並用一個簡單的二分函式來判斷兩個回覆是否相似，用這個相似得分去更新資料的權重。最後在 Persona Dataset（zhang 2018）上做了實驗驗證，表明模型在 BLUE 上和現有的模型接近，ROUGH 值有時會變差，但是在多樣性的指標上，比如不同 n-gram 的個數，則有明顯的提升。

論文 2：：Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study
作者：Chinnadhurai Sankar，Sandeep Subramanian，Christopher Pal，Sarath Chandar，Yoshua Bengio
論文連結：https://www.aclweb.org/anthology/P19-1004

Bengio 大神署名的文章，主要是研究現有的神經網路模型是否有效利用了對話歷史，其方法，是在對話歷史中加入一點擾動，比如，改變對話資料的先後順序，或者改變詞的順序，然後看模型計算的條件概率是否有變化。需要注意的是，擾動只是發生在預測階段，而訓練階段，是沒有對資料做修改的。

文章在 4 個資料集上（bAbI dialog，Persona Chat，Dailydialog，MutualFriends），加入了 10 種不同的擾動（隨機打亂句子序列，去掉某個整句，句子截斷，去掉句子中的名詞或動詞等），發現 seq2seq 的 model（Bahdanau 2015），以及 transformer 的 model（Vaswani 2017）等對這些擾動都不敏感。

【讀論文】 -- 推薦系統研究綜述
2024-04-10
對話系統綜述
2018-04-25
綜述：一文帶你瞭解情感分析的方法有幾種
2022-02-05
一文讀懂資料庫最新技術趨勢：TDSQL帶你深度縱覽VLDB 2019
2019-09-16
資料庫SQL
7 Papers | KDD2019最佳論文；AutoML SOTA 綜述
2019-08-23
TOML
NLP相關論文綜述
2018-11-26
一文帶你吃透作業系統
2023-03-14
作業系統
對話機器人ChatBot綜述
2018-07-09
機器人
一文帶你看透kubernetes 容器編排系統
2019-01-07
聯邦學習綜述性論文
2024-08-08
聯邦學習
大模型綜述來了！一文帶你理清全球AI巨頭的大模型進化史
2023-05-17
大模型AI
入侵檢測系統綜述文獻研讀
2024-06-01
【長圖】一文百圖縱覽 DTCC 2022
2022-12-26
【論文筆記】A review of applications in federated learning（綜述）
2022-05-01
筆記ViewAPP
不容錯過！ACL 2019論文解讀合集！
2019-08-23
擴散模型首篇綜述+論文分類彙總，谷歌&北大最新研究
2024-03-12
模型谷歌
ACL 2018：一文帶你看自然語言處理領域最新亮點
2018-08-24
自然語言處理
如何入門論文閱讀&綜述小解答
2021-01-02
[譯] 一文帶你看完 2019 開年瀏覽器之爭的最新進展
2019-01-21
瀏覽器
對話論文總結
2018-07-08
綜述論文：當前深度神經網路模型壓縮和加速方法速覽
2019-03-02
神經網路模型
一文帶你搞懂 SSR
2022-06-08
一文帶你搞懂RPC
2021-05-31
RPC
一文帶你帶你瞭解企業如何有效推進ERP系統的實施？
2022-11-30
NLP帶來的“科幻感”超乎你的想象 - ACL2020論文解讀（一）
2020-04-30
ACL 2022 SWCC 論文拆解
2024-08-23
一文帶你搞懂 Kafka 的系統架構（深度好文，值得收藏）
2022-05-20
Kafka架構
Attention模型方法綜述 | 多篇經典論文解讀
2018-06-11
模型
【論文筆記】Federated Learning for Wireless Communications: Motivation, Opportunities, and Challenges（綜述）
2022-05-03
筆記
94頁論文綜述卷積神經網路：從基礎技術到研究前景
2018-04-07
卷積神經網路
一文帶你快速掌握AQS
2019-03-15
AQS
一文帶你學習SpringBoot
2019-10-31
Spring Boot
一文帶你入門Linux
2020-02-08
Linux
一文帶你入門Transformer
2022-12-27
ORM
一文帶你搞定AOP切面
2021-08-03
一文帶你瞭解 chatgpt
2023-02-22
ChatGPT
一文帶你入門 Golang
2020-11-29
Golang
一文帶你認識Docker
2021-02-07
Docker

ACL 2019對話系統論文綜述，一文帶你縱覽16篇前沿研究

相關文章