8月24日至27日,由中國中文資訊學會語言與知識計算專業委員會主辦,浙江大學承辦的2019年全國知識圖譜和語義計算大會(CCKS:China Conference on Knowledge Graph and Semantic Computing)在杭州召開。本屆大會以“知識智慧”為主題,吸引了近千名國內外高校、研究院以及企業相關領域的學者和研究人員參會,圍繞知識圖譜、語義計算和語言理解的關鍵技術和應用等話題展開了深入探討。
CCKS是由中國中文資訊學會語言與知識計算專委會定期舉辦的全國年度學術會議。CCKS源於國內兩個主要的相關會議:中文知識圖譜研討會The Chinese Knowledge Graph Symposium (CKGS)和中國語義網際網路與Web科學大會Chinese Semantic Web and Web Science Conference (CSWS)。
全國知識圖譜與語義計算大會致力於成為國內知識圖譜、語義技術、連結資料等領域的核心會議,聚集了眾多知識表示、自然語言理解、智慧問答、知識抽取、圖資料庫等相關技術領域的學者和研究人員,力求為我國語言與知識計算領域的學術研究和產業發展,為從事相關理論和應用研究的學者、機構和企業提供廣泛交流的平臺。
大咖雲集 共論未來發展
CCKS2019分為講習班和主會兩個部分。在8月24-25日舉辦的《前沿技術講習班》——知識圖譜專題(CIPS ATT16)論壇中,六名中外知名青年學者與企業代表帶來了精彩的學術前沿和應用技術報告。加州大學聖巴巴拉分校教授嚴錫峰,南加州大學助理教授任翔,密歇根州立大學助理教授Jiliang Tang ,新澤西州立大學助理教授張永峰,以及騰訊微信模式識別中心高階研究員林衍凱,深度好奇創始人呂正東,分別以“自然語言介面、知識圖譜構建和推理、圖深度學習、知識指導的自然語言理解、可解釋推薦和閱讀理解”等為主題作了分享。
在8月26日召開的CCKS2019開幕式上,中文資訊學會理事長方濱興院士為大會開幕式致辭,清華大學李涓子教授代表語言與知識計算專委會致辭,CCKS2019大會主席清華大學朱小燕教授、程式委員會主席哈爾濱工業大學秦兵教授分別為大會致辭並介紹大會情況,本次大會承辦方主席、浙江大學陳華鈞教授主持了開幕式。
在特邀報告環節,英國南安普頓大學電腦科學教授Wendy Hall作了題為《Web Science, AI and Future of the Internet》的報告,她從人工智慧發展帶來的潛在威脅入手,指出必須採用社會技術方法分析網際網路的發展,以確保未來的網際網路能夠幫助人們創造一個理想生活的世界。伊利諾伊大學香檳分校Heng Ji 教授帶來了題為《PaperRobot: Scientific Knowledge Graph Construction and Paper Writing》的報告,分享了她們在利用知識圖譜進行論文閱讀理解、發現新研究思路以及自動構寫論文摘要等方面的研究成果。加拿大滑鐵盧大學李明教授以《第三代聊天機器人》為題作了精彩分享,他介紹了現有聊天機器人存在的不足,提出第三代聊天機器人架構和可行的實現方法。百度技術長王海峰博士作了《知識圖譜與語義理解》的報告,介紹了百度在知識圖譜與語義理解技術及應用方面的工作,並對其未來發展方向做了進一步探討。
最佳中英論文出爐
本屆大會收錄論文53篇,其中Oral論文13篇,Poster論文40篇。《基於簡介文字的中文人物關係圖譜屬性補全與糾錯》獲得了本次大會的中文最佳論文,作者是蘇州大學電腦科學與技術學院的楊一帆、馬進、 王海濤、 何正球、陳文亮、張民。
該文描述了從百科類資料構建人物關係圖譜的過程,作者對人物屬性和關係進行了歸一化處理,為提高圖譜的覆蓋率和正確率,從文字中進行自動學習知識的糾錯和補全,最終獲得了包含百萬級人物實體和千萬級三元組的人物關係圖譜。該文采用模式匹配和統計模型相結合的策略從文件資料中自動學習補全和糾錯屬性,最終提高了知識圖譜的正確率和覆蓋率。
《Copy-Enhanced Contextual Information Learning for Dialogue State Tracking》獲得了本次大會的英文最佳論文獎,作者是 Qingbin Liu、 Shizhu He、 Kang Liu、 Shengping Liu 、Jun Zhao,來自中國科學院自動化研究所模式識別國家實驗室和北京雲知聲資訊科技有限公司。
該文提出了一個複製增強的異構資訊學習模型,該模型具有多個編碼解碼器用於DST(CEDST),透過複製異構文字中的值,可以有效地生成所有可能的值,包括未知值。同時,CEDST可以透過多個編碼器將大狀態空間有效地分解為多個小狀態空間,並利用多個解碼器充分利用減少的空間生成值。多編碼器-解碼器體系結構可以顯著提高效能。實驗表明,CEDST可以有效地減少空間生成值,同時CEDST在WoZ2、bAbI和他們構建的資料集上都實現了最優效能。
知識圖譜評測競賽獎項花落各家
CCKS每年都會面向公眾釋出評測任務,這一系列評測旨在為研究人員提供測試知識圖譜與語義計算技術、演算法及系統的平臺和資源,促進國內知識圖譜領域的技術發展,以及學術成果與產業需求的融合和對接。
經過前期的評測任務徵集和評測組委會篩選,CCKS 2019共設立6個相關主題評測任務,分別是:面向中文電子病歷的命名實體識別、面向中文短文字的實體鏈指任務、人物關係抽取、面向金融領域的事件主體抽取、公眾公司公告資訊抽取以及開放領域的中文問答。專委會為每個任務前三名設立了獎金並頒發證書,同時組委會針對不同任務特別評選出了“創新技術獎”,專門用於鼓勵創新性技術的使用。
據統計,今年共有1666支隊伍報名參加了評測任務,參賽隊伍數量是去年的6倍(2018年,288支),最終有698支隊伍提交結果。同時,本次大會還收到39篇評測論文投稿,錄用論文30篇,口頭報告12篇,海報展示28篇。
評測任務一:面向中文電子病歷的命名實體識別,阿里健康的Alihealth團隊獲得了子任務1的一等獎,國防科技大學計算機學院的NUDT-YH團隊獲得子任務2一等獎。技術創新獎由清華-訊飛聯合實驗室MSIIP隊獲得。
評測任務二:面向中文短文字的實體鏈指,第一名獲得者是東北大學的FREE團隊;技術創新獎由同濟大學煙霧彈大師法棍諾團隊獲得。
評測任務三:人物關係抽取,Sent-Track和Bag-Track的一等獎分別由國雙科技的格物致知團隊和Lenove Research的LEKG團隊獲得,技術創新獎則被東北大學NEU_DM1收入囊中。
評測任務四:面向金融領域的事件主體抽取,第一名被哈工大(深圳)-圖靈聯合實驗室的糯米餈團隊拿下,技術創新獎由廣東外語外貿大學GDUFSER獲得。
評測任務五:公眾公司公告資訊抽取,一等獎和技術創新獎均被美能華智慧科技包攬。
評測任務六:中文知識圖譜問答,第一名被百度智珠尹存祥團隊收穫,技術創新獎由華為SUDA團隊獲得。
主會還包括知識圖譜頂級會議回顧及研究進展報告,優秀學術論文報告,學術論文口頭報告,Poster Spot Highlight,知識圖譜工業界論壇等環節,邀請了國內外專家學者講授相關領域的最新進展、發展趨勢和實戰經驗。作為本次大會的亮點,知識圖譜工業界論壇設立了企業知識圖譜、金融知識圖譜、工業及公安知識圖譜、醫療知識圖譜四個分論壇,華為、滴滴、美團、小米、阿里等產業界的研發人員帶來了16場精彩報告,分享了他們在知識圖譜構建、應用和測評方面的實踐經驗,促進產學研的合作。
CCKS2020將於明年在江西南昌舉辦,江西師範大學計算機資訊工程學院作為大會的承辦方將為我們帶來更為精彩的學術與技術盛宴,讓我們共同期待明年盛會的到來。