賽爾推薦 | 第25期

哈工大SCIR發表於2018-06-15

本欄目每週將推薦若干篇由師生精心挑選的前沿論文,分週三、週五兩次推送。

本次推薦了三篇關於跨語言,情感分類,詞向量,事件檢測,文字問答、視覺問答、記憶網路、關係推理的論文。

1、推薦組:SA

推薦人:吳洋(研究方向:情感分析)

論文題目:Bilingual Sentiment Embeddings: Joint Projection of Sentiment Across Languages

作者:Jeremy Barnes, Roman Klinger, and Sabine Schulte im Walde

出處:ACL 2018

論文主要相關: 跨語言,情感分類,詞向量

簡評:

該論文探討了如何利用有限的語料資源解決跨語言的情感分類問題。其中提出的BLSE(Bilingual Sentiment Embeddings)模型僅需三種資源,從源語言到目標語言的小型雙語詞典,源語言端帶有情感標籤的情感語料庫,源語言和目標語言的詞向量。BLSE模型一方面透過學習合適的語義對映使得源語言和目標語言中具有相似語義的詞在對映後能夠距離較近(引數M’,M),另一方面透過在情感語料上進行有監督學習來使得對源語言的對映能夠保留情感資訊(引數M,P),最後透過兩方面的學習來得到有效的跨語言情感分類模型(M’,M,P)。實驗結果表明,BLSE模型在二分類上比使用相似的資源的SOTA模型平均高出14個百分點,在四分類上高出4個百分點。 

論文連結:

https://arxiv.org/pdf/1805.09016.pdf

原始碼連結:

https://github.com/jbarnesspain/blse

2、推薦組:SP

推薦人:張文博(研究方向:社會預測)

論文題目:Graph Convolutional Networks with Argument-Aware Pooling for Event Detection

作者:Thien Huu Nguyen, Ralph Grishman

出處:AAAI 2018

論文主要相關:事件檢測

簡評:

隨著網際網路資訊爆炸式的增長,從非結構化的資訊中提取出有用的結構化資訊顯得尤為迫切和重要。事件檢測作為資訊抽取系統中的一個關鍵任務,受到了很多研究者的關注,然而,以往大部分做事件檢測的工作都只是考慮句子的線性表示,忽視了句法結構能夠直接聯絡資訊上下文的優勢。該論文提出一個基於句法依存樹的圖卷積神經網路模型用於事件檢測,解決了長距離非連續的資訊依賴問題,在公開資料集ACE2005上取得了非常好的效果。這個模型最大的創新點是首次在神經網路中引入句法結構特徵,在句法依存圖上執行卷積操作。句法依存圖是透過句法依存樹轉換得到的——有向邊變為無向邊且新增自迴圈邊,然後在句法依存圖上建模圖卷積網路(GCN)進行觸發詞的識別和分類。GCN模型大致有兩種結構:一是先做圖embedding轉化成序列格式,然後執行傳統的平面卷積操作;二是借鑑卷積核區域性加權求和的思想,對圖中的任一頂點及其鄰域進行加權求和,以達到抽取特徵的目的。本文采用的是第二種結構的GCN模型,透過對候選詞及其句法鄰域詞進行卷積操作,建模最直接的資訊依賴。此外,本文還提出了基於實體提及的池化操作,進一步提升了事件檢測的效果。

論文連結:

https://ix.cs.uoregon.edu/~thien/pubs/graphConv.pdf

3、推薦組:TG

推薦人:龔恆(研究方向:文字生成)

論文題目:Working Memory Networks: Augmenting Memory Networks with a Relational Reasoning Module

作者:Juan Pavez, Héctor Allende, Héctor Allende-Cid

出處:ACL 2018

論文主要相關:文字問答、視覺問答、記憶網路、關係推理

簡評:

這篇文章主要針對文字問答資料集bAbI-10k和視覺問答資料集NLVR中涉及到的比較複雜的需要關係推理的問題,在Memory Networks(記憶網路)中引入了NIPS 2017上DeepMind發表的一篇針對CLEVR資料集中關係推理問題的論文《A simple neural network module for relational reasoning》中提出的Relation Networks(關係網路)。為了解決在處理長文字時Relation Networks的時間複雜性較大的問題,這篇文章用Relation Network在Memory Networks的每個hop得到的表示之間兩兩進行推理。這樣,Relation Network需要進行推理的次數只與Memory Networks的跳數有關。透過固定Memory Networks的跳數,可以提高Relation Networks面對長文字時的可擴充性。在bAbi-10k資料上相比之前的state-of-the-art有超過2個點的提升,在位置推理(positional reasoning)和路徑尋找(path finding)任務上有較好的提升。NLVR資料集上,在不使用句法資訊的情況下,達到了與Module Neural Networks可比的結果。

論文連結:

https://arxiv.org/abs/1805.09354

相關文章