CCL 2017最佳論文公佈,看全國計算語言學前沿研究

邱陸陸發表於2017-10-16

10 月 14 日、15 日,由中國中文資訊學會(CIPS)舉辦的第十六屆全國計算語言學會議(CCL 2017)暨第五屆自然標註大資料的自然語言處理國際學術研討會(NLP -NABD 2017)於江蘇南京召開。

本次會議共收到 264 篇投稿,錄用 105 篇論文,錄用率為 39.77%,共有超過 700 名計算語言學研究者和其他領域的專家學者參與本屆會議,參會人數為歷屆最多。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

大會主席,中國工程院院士倪光南在開幕式上致辭。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

他表示,語言是資訊最重要的載體,只有計算機有處理語言的能力時,計算機才能透過圖靈測試,實現人工智慧。因此語言智慧是人工智慧的核心。而資訊時代以來,數字資訊有效利用成為資源資訊科技發展的一個全域性性的瓶頸問題,語言資訊處理已經成為資訊科學技術長期發展新的戰略制高點。而全國計算機語言學學術會議,為研討和傳播我們中文資訊處理,尤其是計算語言學最新的技術和學術成果,提供了高水平的深入交流平臺。2017 年,我國政府將人工智慧升到國家戰略高度,對 2030 年之前的中國人工智慧產業進行了系統部署。在新的歷史條件下,中文資訊處理領域能否抓住這個重大機遇,對長期的研究和發展沉澱的基礎上勇於創新產生重大突破,是我國中文資訊處理裡面必須回答的一個重大問題。希望此次大會能推動我國科技科學者在自然語言處理方面取得更多的成果,為我國中文資訊處理事業開展新的發展階段。

西安交通大學人工智慧與機器人研究所教授、 IEEE Fellow、中國工程院院士鄭南寧做了以《受腦認知和神經科學啟發的人工智慧》為主題的主旨報告。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

鄭教授認為,只有瞭解大腦,才能發展出更「健壯」的 AI。想要實現這類不僅在智力上超過一般人類,也在人類習以為常的複雜場景任務中取得卓越的表現的 AI,還應該從腦認知,神經科學,以及人與環境互動的過程中尋找新的方法。經典的人工智慧基本理論,以演繹邏輯、語義描述以及形式化的方法來應對問題。換言之,只要能夠形式化的任務,都可以用當今馮諾依曼架構的計算機以及當今的人工智慧方法來解決。但是,由於條件問題(無法舉出一個問題的所有條件)和分析問題(無法給出一個問題的所有分析),研究者無法對所有物件建立模型,也就無法用演繹邏輯和形式化的方法來解決複雜的、處於動態變化環境中的問題。人工智慧的侷限性,表現在以下五個方面:無法將問題抽象成有精確數學意義的模型,無法對已建立的數學模型設計出確定的演算法或計算過於複雜,無法表現出真實世界的脆弱性和不確定性,只能進行可遞迴化的計算、處理可向量化的資料。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

因此要向大腦中尋求人比機器強的地方,例如想象力、創造性、複雜性和動態性,找到將其融入人工智慧系統的方法,建立中國新一代人工智慧規劃中提到的「混合增強智慧」框架。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

清華大學社會科學學院院長、清華大學心理學系系主任彭凱平教授則從心理學角度介紹了人的智慧的優越性。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

他坦陳如今傳統心理學範疇內的人類智慧,如學習、記憶、判斷、分析、決策等認知能力都在逐漸被人工智慧超越,然而除了「Brain」之外,人類還有「Mind」,即腦所產生的意識、心理、活動狀況等。新興的積極心理學,從達爾文以「自然選擇,適者生存」與「性選擇,美者生存」為核心觀點的進化論出發,發現人類的進化歷史幾千萬年的組織形態學變化,選擇的都是人的一些獨一無二的天性,這些天性現在看來可能是人比其他的生物要優越的地方,也可能是人迄今為止比機器優秀的地方。這些天性並不是我們傳統上認為的認知加工能力的優勢,而是進化選擇出來的人類獨一無二的積極心理能力。積極心理能力包括:從兩歲半左右開始獲得的與間接學習相關的同理心,從五歲左右開始獲得的延遲滿足的自控力,六個月就已經具有的天然道德意識,以及本能的對未來憧憬和計劃的前瞻意識。積極心理學家認為這就是人類的智慧優越之所在,以及這也許是人工智慧的研究未來的探索方向。

香港科技大學計算機系新明工程學講座教授,大資料研究所主任及計算機系主任楊強做了《從深度學習到遷移學習》報告,探討了深度學習在小資料、可靠性等方面的弱點,介紹了近期遷移學習的進展,以及一些可能彌補深度學習不足的研究方向。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

北京大學數學科學學院教授耿直以《從相關到因果:因果推斷》為題,介紹了相關關係與因果關係的概念及形式化,如何由部分變數推斷因果作用,如何確定替代目標的準則及問題,以及因果網路的分解學習方法、主動學習方法,並探討了如何評價因果作用和挖掘因果網路的統計方法。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

搜狗公司 CEO,前搜狐高階副總裁、技術長王小川介紹了搜狗公司基於「讓表達與獲取資訊更簡單」的使命,發展以輸入法和搜尋為核心的資訊處理技術,並在「自然互動知識計算」的理念下,在對話、問答和機器翻譯方面探討產品需求和技術難題的實踐。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

除此之外,還有 20 位研究者就機器翻譯中的分詞、未登入詞問題,知識圖譜的關係抽取和推理問題等多個方向給出了四場口頭報告。近 10 家公司在會場進行了系統展示。

CCL 2017最佳論文公佈,看全國計算語言學前沿研究

15 日,大會公佈了評選出的兩篇 CCL 2017 最佳論文獎和一篇 NLP -NABD 2017 最佳論文獎,以下是獲獎論文的介紹:

CCL 2017 最佳論文獎

  • 論文:基於 E-CNN 的情緒原因識別方法
  • 作者:慕永利,李暘,王素格
  • 地址:http://www.cips-cl.org/static/anthology/CCL-2017/CCL-17-058.pdf

摘要:文字情緒原因識別作為一個新型的研究方向在文字情緒分析領域佔據重要地位。本文結合卷積神經網路,提出了一種基於整合卷積神經網路的情緒原因識別方法。該方法透過詞向量、卷積、池化等操作充分融合了句子的語義資訊,利用多個 CNN 整合降低資料不平衡性對情緒原因識別的影響,克服了傳統情緒原因識別方法的繁瑣規則制定、特徵抽取、特徵空間降維等過程。實驗結果表明,本文的方法在情緒原因識別方面取得了較好的效果,對於情緒歸因的方法研究具有一定的指導作用。

  • 論文:融合概念對齊資訊的中文 AMR 語料庫的構建
  • 作者:李斌,聞媛,宋麗,卜麗君,曲維光,薛念文
  • 地址:http://www.cips-cl.org/static/anthology/CCL-2017/CCL-17-034.pdf

 摘要:作為一種新的句子語義表示方法,抽象語義表示(AMR)將一個句子抽象為單根有向無環圖,已經建立 了較大規模的英文語料庫。然而,句子中的詞語和 AMR 圖的概念對齊資訊缺失,使得自動分析效果和語料標註 質量受到影響,同時中文尚無較大規模的 AMR 語料庫。本文介紹了中文 AMR 語料庫的構建工作,針對漢語特 點調整了 AMR 的標註體系,增加對複句關係的標註,提出了融合概念對齊的一體化標註方案,解決了中英文輸 入法頻繁切換的問題,增加了錯別字糾正和未標註詞高亮功能,提高了標註效率。然後,從 CTB 中選取了 6923 句進行人工標註,形成中文 AMR 語料庫,統計得到圖和環的比例分別為 48% 和 1%,以及利用對齊資訊才能獲 取的非投影句的比例 32%,為中文 AMR 的理論和自動分析研究奠定基礎。

NLP -NABD 2017 最佳論文獎

  • 論文:Using Cost-Sensitive Ranking Loss to Improve Distant Supervised Relation Extraction
  • 作者:Daojian Zeng, Junxin Zeng, Yuan Dai

相關文章