復旦大學黃萱菁:自然語言處理中的可理解分析

AMiner學術頭條發表於2020-11-11

2020年11月6日,“第五屆語言與智慧高峰論壇”以線上直播的形式召開。本次論壇由中國中文資訊學會和中國計算機學會主辦,邀請到了周明、黃萱菁等多位國內外學界和業界翹楚作報告。
復旦大學黃萱菁:自然語言處理中的可理解分析

首屆“語言與智慧高峰論壇”於 2016 年在北京舉行,每年舉行一次,至今已成功舉辦四屆。社會對於代表著“未來”、“高科技”、“前沿領域”的人工智慧一直有著一個期望——“讓機器理解人類語言”,對於這個行業的研究現狀與未來趨勢也有著諸多好奇。

“語言與智慧高峰論壇”旨在向社會公眾介紹語言與智慧的前沿動態和創新成果,推動我國相關領域快速發展。論壇邀請國內外資深學者擔任特邀講者,設立青年科學家論壇、圓桌討論和技術評測論壇,就語言與智慧的前沿課題進行思想碰撞與深度交流。

復旦大學的黃萱菁教授針對深度學習推廣中的可理解性和可解釋性問題做了報告。以下為學術君根據演講實錄整理的文稿,略有刪減——

自然語言處理中的可理解分析
復旦大學黃萱菁:自然語言處理中的可理解分析

自然語言處理中的可理解性是指我們希望對學習系統有更多的瞭解,主要包括三點內容:一是理解模型部件內部的功能屬性;二是解釋其行為的預決策行為;三是對系統進行診斷,判斷其優缺點。

為什麼要做可理解分析呢?黃萱菁教授指出,深度學習把我們從特徵挖掘時代帶到了結構工程時代,但是也帶來了新的問題——“如何選擇適配特殊任務特殊資料集的結構?”可理解分析可以增加模型的可信賴性;可以判斷模型是否過擬合;可以指出模型不足,便於繼續最佳化。正是這些作用,所以我們需要繼續最佳化運用它。

這兩張圖展示的是,涉及到 interpret ability,explanation這兩個關鍵詞,過去若干年被錄用的會議論文的數目的發表趨勢。x軸代表年份,y軸代表該年被錄用的論文的數量。可以看到,最近兩年的研究都呈現出了明顯的一個增長趨勢。可理解分析這個方向最近兩年還是有較多人關注到的。
復旦大學黃萱菁:自然語言處理中的可理解分析

對於自己近期的研究工作,黃萱菁教授說,主要是兩個部分:第一部分是理解模型部件的功能屬性,另外一個部分是關於模型診斷。在理解模型部件的功能屬性方面,黃教授介紹了以下三個方面的工作:

一、LSTM架構的認知解釋。希望瞭解兩個問題,一是“人閱讀和機器閱讀時的神經元活動是否可以相互預測?”,二是“LSTM架構在認知角度是否合理?”。

二、序列模型的認識。這裡的研究動機主要是兩個,一是“主流的幾種基於神經網路模型的詞表示,究竟編碼了哪些語言學特徵?”二是“神經元的行為模式是否可解釋?”。

三、抽取式摘要中各個元件的作用分析,也就是不同配置的模型到底差異在哪裡。

黃萱菁教授還在報告中介紹了今年自己團隊已發表的魯棒性分析的相關工作。
復旦大學黃萱菁:自然語言處理中的可理解分析

第一個是關於對抗分析的,神經網路容易受到對抗樣本的干擾,所以在實地實際落地使用的時候會容易一些問題。所謂的對抗樣本指的是對輸入做微小的難以察覺的擾動,導致機器學習模型預測錯誤的樣本。這裡需要注意的是語義的一致性以及冠詞介詞這類功能詞不進行改變,避免引起句法歧義。

第二個是依存句法任務的攻擊效能。基於依存句法對抗樣本探究了句法任務模型的魯棒性,透過利用對抗樣本,提高了模型的魯棒性。

第三個是基於情感分析(ABSA)的方面。黃萱菁教授的團隊提出了一種簡單有效的資料生成方法來測試模型的魯棒性,構建了ARTS測試資料集來評測模型魯棒性;繼而提出了新的評測指標Aspect Robustness Score;並且透過探測9個現有的ABSA模型,提出了提升現有模型的魯棒性的方法。

在報告的最後,黃萱菁教授對於可理解性分析的未來作出了研究展望;希望有一個統一的指標與資料集能夠對可理解、可解釋模型進行評價,並且有了這種統一評價之後,能夠有一個通用的可互動的可解釋工具,進行系統化平臺化的分析。

另外,分析的目的是真正是改進現有系統的效能,幫助理解更好系統的輸出,所以希望能夠探索更多應用場景,透過可理解分析的結果去改變現有系統的效能。

黃萱菁個人介紹

復旦大學黃萱菁:自然語言處理中的可理解分析黃萱菁,復旦大學電腦科學技術學院教授、博士生導師,主要從事自然語言處理資訊檢索和社會媒體分析研究。兼任中國中文資訊學會常務理事、社會媒體專委會副主任,中國計算機學會自然語言處理專委會副主任、學術工作委員會委員。在高水平國際學術期刊和會議上發表了百餘篇論文,負責的多個科研專案受到國家自然科學基金、科技部、教育部、上海市科委的支援。入選由清華—中國工程院知識智慧聯合研究中心和清華大學人工智慧研究院聯合釋出的“2020年度人工智慧全球女性”,“2020年度AI 2000人工智慧全球最具影響力提名學者”及“福布斯中國2020科技女性榜”。

參考資料:
http://conference.cipsc.org.cn/lis2020/reports/huangxuanjing.html

相關文章