自然語言處理領域的前沿技術:EMNLP 2017最佳論文公佈

機器之心發表於2017-08-18

EMNLP 是自然語言處理領域的頂級會議,EMNLP 2017 將於 9 月 7 日至 9 月 11 日在丹麥哥本哈根召開。本次 EMNLP 共錄用 323 篇論文,包括 216 篇長論文和 107 篇短論文。今日,EMNLP 2017 最佳論文出爐,在這篇文章中我們對獲獎論文進行了摘要介紹。

8 月 16 日,由中國中文資訊學會青年工作委員會主辦,搜狗搜尋承辦的「自然語言處理前沿技術研討會暨 EMNLP 2017 論文報告會」在中科院軟體所舉行。報告會邀請了國內部分被錄用論文的作者報告其研究成果,探討自然語言處理領域的前沿技術。

18 位來自中科院、清華、北大、哈工大等科研機構和高校的研究人員、老師、同學分享和展示了他們的論文(論文列表附在文後)。整場報告會分為四個部分:文字摘要及情感分析、機器翻譯、資訊抽取及自動問答、文字分析及表示學習。演講者和臺下觀眾進行了很好的互動,共同探討自然語言處理領域的新技術。

自然語言處理領域的前沿技術:EMNLP 2017最佳論文公佈

現場論文展示


除了國內展示的這些精彩論文,EMNLP 2017 也於今日公佈了最佳論文,包括最佳長論文、最佳短論文和最佳資源論文三個獎項。機器之心對獲獎論文進行了編譯介紹。

最佳長論文:

論文: Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints

作者:Jieyu Zhao、Tianlu Wang、Mark Yatskar、Vicente Ordonez 和 Kai-Wei Chang

地址:https://arxiv.org/abs/1707.09457 

論文:Depression and Self-Harm Risk Assessment in Online Forums

作者:Andrew Yates, Arman Cohan 和 Nazli Goharian. 

最佳短論文:

論文:Natural Language Does Not Emerge ‘Naturally’ in Multi-Agent Dialog

作者:Satwik Kottur, José Moura, Stefan Lee 和 Dhruv Batra

地址:https://arxiv.org/abs/1706.08502 

最佳資源論文:

論文:Bringing Structure into Summaries: Crowdsourcing a Benchmark Corpus of Concept Maps

作者:Tobias Falke 和 Iryna Gurevych. 

地址:https://arxiv.org/abs/1704.04452 

最佳長論文:Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints

自然語言處理領域的前沿技術:EMNLP 2017最佳論文公佈

摘要:支援從網上收集影象的自然語言越來越多地用於定義豐富的視覺識別問題。這些任務使用結構化預測模型以利用視覺輸入和同現標籤的關聯性,但是這種關聯性經常編碼了網站語料庫中的社會偏見。在本論文中,我們研究了與多標籤目標分類和視覺語義角色標註(visual semantic role labeling)相關聯的資料和模型。我們發現(a)這些任務的資料集包含嚴重的性別偏見,(b)在這些資料集上訓練的模型放大了這些偏見。例如,在訓練集中,做飯涉及到女性的概率要比男性高33%,而訓練後的模型在測試集上將這一概率放大到了68%。我們建議可以注入用於校準現有結構化預測模型的語料庫級約束,並基於拉格朗日鬆弛設計一種演算法以進行群體推斷。我們的方法幾乎在識別任務上沒有效能損失,但是降低了偏見放大的數量級,在多標籤分類和視覺語義角色標註任務上分別降低了47.5%和40.5%。

最佳短論文:Natural Language Does Not Emerge ‘Naturally’ in Multi-Agent Dialog

自然語言處理領域的前沿技術:EMNLP 2017最佳論文公佈

摘要:近期大量研究提出適用於合作多智慧體群(cooperative multi-agent population)通訊協議的端到端學習技術,同時還發現智慧體開發的協議中出現基礎的人類可翻譯的語言,這種語言是在無人類監督的情況下學得的!

在本論文中,我們將 Task & Talk reference 遊戲作為對兩個智慧體進行測試的平臺,展示了一串「負」結果最終生成了一個「正」結果,這證明儘管智慧體創造的大部分語言是有效的(即可獲取近乎完美的任務獎勵),但這些語言顯然不可翻譯或合成。本質上,我們發現自然語言不是「自然」出現的,儘管人們可能從近期文獻中獲取自然語言的出現很容易的假象。我們討論的是如何使創造出的語言隨著兩個智慧體更多的交流限制而變得越來越像自然語言。

最佳資源論文:Bringing Structure into Summaries: Crowdsourcing a Benchmark Corpus of Concept Maps

自然語言處理領域的前沿技術:EMNLP 2017最佳論文公佈

摘要:概念圖(concept map)可用於準確呈現重要資訊和理清大型文件集的結構。因此,我們研究了一種多文件摘要的方法,它以概念圖的形式生成摘要。但是,目前仍缺乏適用於該任務的評估資料集。為了填補這個鴻溝,我們展示了一個新建的概念圖語料庫,它概述了教育主題的異質網頁文件集。該語料庫使用新型的眾包方法建立,該方法幫助我們高效確定大型文件集中的重要元素。除語料庫外,我們還發布了一個基線系統,並提出一項評估協議,以促進該領域的進一步研究。

自然語言處理前沿技術研討會暨EMNLP 2017論文報告會展示論文列表:

論文:Multi-modal Summarization for Asynchronous Collection of Text, Image, Audio and Video

作者: Haoran Li, Junnan Zhu, Cong Ma, Jiajun Zhang and Chengqing Zong

論文:Affinity-Preserving Random Walk for Multi-Document Summarization

作者: Kexiang Wang, Tianyu Liu, Zhifang Sui and Baobao Chang

論文:A Question Answering Approach for Emotion Cause Extraction

作者: Lin Gui, Jiannan Hu, Yulan He, Ruifeng Xu, Lu Qin and Jiachen Du

論文:Towards a Universal Sentiment Classifier in Multiple languages

作者: Kui Xu and Xiaojun Wan

論文:Sentiment Lexicon Construction with Representation Learning Based on Hierarchical Sentiment Supervision

作者: Leyi Wang and Rui Xia

論文:Translating Phrases in Neural Machine Translation

作者: Xing Wang, Zhaopeng Tu, Deyi Xiong and Min Zhang

論文:Neural Machine Translation with Word Predictions

作者: Rongxiang Weng, Shujian Huang, Zaixiang Zheng, XIN-YU DAI and Jiajun CHEN

論文:Towards Bidirectional Hierarchical Representations for Attention-based Neural Machine Translation

作者: Baosong Yang, Derek F. Wong, Tong Xiao, Lidia S. Chao and Jingbo Zhu

論文:EarthMover's Distance Minimization for Unsupervised Bilingual Lexicon Induction

作者:Meng Zhang, Yang Liu, Huanbo Luan and Maosong Sun

論文:Incorporating Relation Paths in Neural Relation Extraction

作者: Wenyuan Zeng, Yankai Lin, Zhiyuan Liu and Maosong Sun

論文:End-to-End Neural Relation Extraction with Global Optimization

作者: Meishan Zhang, Yue Zhang and Guohong Fu

論文:Reasoning with Heterogeneous Knowledge for Commonsense Machine Comprehension

作者:Hongyu Lin, Le Sun and Xianpei Han

論文:Learning to Predict Charges for Criminal Cases with Legal Basis

作者: Bingfeng Luo, Yansong Feng, Jianbo Xu, Xiang Zhang and Dongyan Zhao

論文:Neural Response Generation via GAN with an Approximate Embedding Layer

作者: Zhen Xu, Bingquan Liu, Baoxun Wang, Chengjie SUN, Xiaolong Wang, Zhuoran Wang and Chao Qi

論文:Part-of-Speech Tagging for Twitter with Adversarial Neural Networks

作者:Tao Gui, Qi Zhang, Haoran Huang, Minlong Peng and Xuanjing Huang

論文:Chinese Zero Pronoun Resolution with Deep Memory Network

作者:Qingyu Yin, Yu Zhang, Weinan Zhang and Ting Liu

論文:Ngram2vec: Learning Improved Word Representations from Ngram Co-occurrence Statistics

作者:Zhe Zhao, Tao Liu, Shen Li, Bofang Li and Xiaoyong Du

論文:Idiom-Aware Compositional Distributed Semantics

作者:Pengfei Liu, Kaiyu Qian, Xipeng Qiu and Xuanjing Huang

相關文章