AAAI 2020 提前看 | 三篇論文解讀問答系統最新研究進展
wujiy發表於2020-01-31
在本篇提前看中,我們重點聚焦 AAAI 2020 中與問答系統(Q&A)相關的文章。問答系統是自然語言處理領域的一個重要研究方向,近年來各大國際會議、期刊都發表了大量與問答系統相關的研究成果,實際工業界中也有不少落地的應用場景,核心演算法涉及機器學習、深度學習等知識。問答系統(Q&A)的主要研究點包括模型構建、對問題/答案編碼、引入語義特徵、引入強化學習、內容選擇、問題型別建模、引入上下文資訊以及實際應用場景問題解決等。在本次 AAAI2020 中,直接以「Question/Answer」作為題目的論文就有 40 餘篇。本文選取了其中三篇進行詳細討論,內容涉及語義特徵匹配、模型構建和醫學場景應用等。1、Improving Question Generation with Sentence-level Semantic Matching and Answer Position Inferring論文地址:https://arxiv.org/pdf/1912.00879.pdf本文介紹的是佛羅里達大學吳大鵬教授組的工作,主要聚焦問答系統(Q&A)的反問題---問題生成(Question Generation,Q&G)。問題生成的目的是在給定上下文和相應答案的情況下生成語義相關的問題,問題生成在教育場景、對話系統、問答助手等應用領域具有巨大的潛力。問題生成任務可分為兩類:一類是基於規則的方法,即在不深入理解上下文語義的情況下手動設計詞彙規則或模板,將上下文轉換成問題。另一類是基於神經網路的、直接從語句片段中生成問題詞彙的方法,包括序列-序列模型(seq-to-seq)、編碼器解碼器(encoder-decoder)等。本文討論的是後一種基於神經網路的問題生成方法。目前,基於神經網路的問題生成模型主要面臨以下兩個問題:(1)錯誤的關鍵詞和疑問詞:模型可能會使用錯誤的關鍵詞和疑問詞來提問(見表 1);(2)糟糕的複製機制:模型複製與答案語義無關的上下文單詞(見表 2)。表 1 和表 2 中使用的基線演算法為 NQG++[1] 和 Pointer-generator[2]。