匯聚6年思想變遷:知識圖譜報告幻燈片大全

AI科技大本營發表於2019-02-07

本文彙總了中文知識圖譜計算會議CCKS報告合集,涵蓋從2013年至2018年,共48篇,從中可以看出從Google 2012年推出知識圖譜以來,中國學術界及工業界這6年來知識圖譜的主流思想變遷。

640?wx_fmt=jpeg

作者 | 劉煥勇

來源 | CSDN部落格

編輯 | apddd


專案介紹


懂語言者得天下,“自然語言處理是人工智慧皇冠上顆明珠”這句話,大家都耳熟能詳。確實不錯,相比三大資訊流(影像、語音、文字)前兩個資訊流都已經取得了較大突破,而由於自然語言的不確定性根本特徵,雖然在某些任務上超越了人類(尤其是2018年11月份的BERT模型出世,吊打人類水準),但總體來說,都集中在判別和分類問題上,在推理、文字生成上還有很長一段路要走。


知識圖譜,與以深度神經網路為首連線主義不同,作為符號主義,從一開始提出就註定了要從知識表示、知識描述、知識計算與推理上不斷前行。知識圖譜是年老的,從最初的邏輯語義網(semanticnet),到語義網路(semantic-web),到Linked-data,再到現在的知識圖譜,知識圖譜從一開始到現在,說長的話,已經經歷了將近50年的時間。

知識圖譜又是年輕的,知識圖譜真正作為一個突出熱點走進大家眼球的,還是在2012年收購FreeBase的Google,終於在受不了傳統的文件搜尋,而尋求一種更為簡潔、人性化的搜尋方式後以簡潔答案、知識卡片的方式形成了大家現在一直提到的知識圖譜(還記得蒙娜麗莎月達芬奇的經典圖),從這個時間算起,也就7年的時間,所以知識圖譜又是年輕的。

640?wx_fmt=jpeg

在這前前後後7年的時間裡,知識圖譜得到了全面的發展,從知識的組織,知識的構建(包括知識抽取、融合、連結、補全[缺失知識補充,既定知識辨識])等技術得到了快速的發展,雖然目前的效能還遠沒有達到可以完全實用的地步,但這種繁榮跡象承載著廣大科研人員的辛勤勞動和整個知識時代的推動。

從CCKS的舉辦議題和懂特邀報告來看,我們可以看到知識圖譜話題的演變,從2013年偏向概念與本體的知識圖譜構建到2014年的知識連結,再到2015年的領域知識學習與深度學習引入,再到2016年的工業界知識圖譜出現,再到2017年的中文開放知識圖譜openkg的提出與知識圖譜的體現化,再到2018年的工業界知識圖譜全面開花,我門可以看到這個領域的進步。

學術界與工業界自打從孃胎裡出來後,就註定了兩者之間存在著一直為世人所詬病的gap,前者往往會在一個資料小,乾淨的環境下去從事基礎科學研究,而以經濟效益和實際價值的工業界所面臨的壓力卻要強的多。我覺得CCKS做得很好的一點,就是有意識的縮小這種天然的gap,這是值得推崇的,有利於推進知識圖譜既作為基礎科學,又作為知識技術得到全面的發展。

640?wx_fmt=jpeg

總而言之,知識圖譜,前路需考量,知識圖譜就自身的架構和自身的技術而言還存在一些問題,一門科學技術的成敗,與其自身的定義(或者叫體系)和自身的技術水平以及與現實問題的結合度息息相關,這就註定了知識圖譜未來必須要針對其描述體系,對現實人類社會知識的描述框架進行審視和調整(比如引入事件、做事件圖譜、事理圖譜)。

在技術上,可能深度學習技術會越來越強,新的語言模型和編碼器也會越來越好。第三就是與現實問題,如具體業務的緊密度,可解決程度(我們為什麼當初要提出知識圖譜這個概念,用它來做什麼,現在是否跑偏?)。只有從這三個方面一同發力,才能前路可望。

作為自然語言處理界的一顆小螺絲釘,希望可以從點滴做起,做好一點知識圖譜的事情。所以,與之前的程式碼專案不同,本專案貢獻一下文件。


知識圖譜會議報告合集


CCKS從2013年開始舉辦,每年舉行一次,目前已經舉辦6屆,作者通過網上收集,最終收集形成6年共48個CCKS 2018報告集合。這些報告都十分精彩,相信能夠給大家帶來幫助。


640?wx_fmt=png


獲取方式


由於檔案較多且較大,筆者將以上檔案上傳至百度網盤,供大家下載。


下載連結(密碼 ibxj):

 https://pan.baidu.com/s/11FA2Qimm3_OuXOLxn2AFSw

總結

  1. 本專案通過個人對CCKS資料的收集,完成了從2013年至2018年共6年的知識圖譜報告的簡介與開源。

  2. 本專案中所涉及到的報告內容均來源於網上公開資源,對此免責宣告。

  3. 本專案中所公開的資源只供學習使用,切不可用於商用(用於換取積分等)。

  4. 知識是用來共享的,希望大家一起行動起來,為自然語言處理敬一份力量。

如有自然語言處理、知識圖譜、事理圖譜、社會計算、語言資源建設等問題或合作,可通過以下方式聯絡我:

  • GitHub專案介紹:https://liuhuanyong.github.io

  • CSDN部落格:https://blog.csdn.net/lhy2014

  • 郵件地址:lhy_in_blcu@126.com

作者:劉煥勇,語言學碩士,目前就職於中國科學院軟體研究所。主要從事資訊抽取、知識圖譜、情感分析、社會計算等自然語言處理研發工作,興趣包括:語言資源構建、資訊抽取與知識圖譜、輿情監測與社會計算。

(本文為 AI科技大本營轉載文章,轉載請微信聯絡原作者。

徵稿

640?wx_fmt=png


推薦閱讀:

點選“閱讀原文”,開啟CSDN APP 閱讀更貼心!

相關文章