復旦大學邱錫鵬教授:詞法、句法分析研究進展綜述

PaperWeekly發表於2019-05-22

本文為第十六屆自然語言處理青年學者研討會 YSSNLP2019 報告《詞法、句法分析研究進展綜述》的簡要文字整理,本報告主要回顧詞法、句法領域的最新研究進展

關於報告人:

邱錫鵬,復旦大學電腦科學技術學院副教授,博士生導師。於復旦大學獲得理學學士和博士學位。主要從事自然語言處理、深度學習等方向的研究,在 ACL、EMNLP、IJCAI 等計算機學會 A/B 類期刊、會議上發表 50 餘篇學術論文,引用 1600 餘次。開源中文自然語言處理工具 FudanNLP 作者。2015 年入選首屆中國科協人才託舉工程,2017 年 ACL 傑出論文獎,2018 年獲中國中文資訊學會“錢偉長中文資訊處理科學技術獎—漢王青年創新獎”。


復旦大學邱錫鵬教授:詞法、句法分析研究進展綜述大家好,我是邱錫鵬。今天非常榮幸給大家簡要分享一下 NLP 中詞法和句法分析領域的最新研究進展。

復旦大學邱錫鵬教授:詞法、句法分析研究進展綜述

首先,我們來看一下詞法和句法分析中的任務定義。我們一般認為詞是語言中的最小語義單位,所以在進行後續的很多 NLP 任務的時候,需要先進行(中文)分詞,標註它的詞性,並分析句子的句法結構。像這裡給的一個句子“上海計劃發展金融業”,首先需要將其進行分詞,然後進行詞性標註和句法分析。這裡我們的句法分析主要以依存句法分析為主進行介紹,建立詞與詞之間的依賴關係。因此我們這裡主要涉及三個任務:中文分詞,詞性標註和依存句法分析。

復旦大學邱錫鵬教授:詞法、句法分析研究進展綜述

目前用來解決這三個任務的基本方法可以分為序列標註方法,基於轉移的方法和基於圖的方法三種。為了解決錯誤傳播問題,一般來說,我們可以將這三個任務進行聯合建模,比如中文分詞和詞性標註的聯合模型、詞性標註和句法分析的聯合模型、以及三個任務的全聯合模型。

復旦大學邱錫鵬教授:詞法、句法分析研究進展綜述

這三個任務的最新研究進展和 SOTA 模型都可以從 NLP-Progress 這個網站進行查詢。

相關文章