AMiner基於論文資料整理了自然語言處理華人專家庫,其中包括了來自NUS、HKUS、THU、PKU、FDU等知名高校以及百度、科大訊飛、微軟等公司的367位專家學者。
AMiner官方網站:https://www.aminer.cn/
下面基於自然語言處理華人庫中的資料對其進行分析。
AMiner自然語言處理華人庫專家全球分佈
自然語言處理領域中華人專家在中國最多,美國次之。
AMiner自然語言處理華人庫專家國內分佈
AMiner自然語言處理華人庫專家地區統計
從地區來看,中國大陸是自然語言處理華人人才的最主要聚集地。尤其是北京、哈爾濱及東南沿海地區等具有自然語言處理學術基礎的地區。美國東部和西部等其他地區排在其後。
AMiner自然語言處理華人庫專家遷徙圖
由上圖可以看出,華人專家在中國流出量大於流入量,美國則正好相反,這也說明就自然領域而言,中國對人才的吸引力要小於美國。
AMiner自然語言處理華人庫專家h-index統計
注:h-index指數
國際公認的能夠比較準確地反映學者學術成就的指數,計算方法是該學者至多有h篇論文分別被引用了至少h次。
AMiner自然語言處理華人庫中專家h-index指數的平均數為14,這一數值是遠遠低於自然語言處理全球top1000學者h-index指數平均數的。
而且,在華人庫中,h-index指數<10的專家人數最多,佔比60%;10-19次之,佔比17%;>60的專家佔比僅佔9%。
這也說明,自然語言處理華人專家整體水平低於自然語言處理領域全球top1000的學者,尤其是在h-index指數>60的學者方面有所欠缺。
AMiner自然語言處理華人庫男女比
AMiner自然語言處理華人庫367位專家中,男性專家佔98%,女性專家僅佔2%,二者比例約為49:1。
AMiner基於發表於國際期刊會議的學術論文,對自然語言處理領域內專家進行深入挖掘,並按照相關度和影響力等對專家進行排序和分類。
排序和分類規則主要參考專家的h-index、paper、citation、專家所獲得的榮譽、任職機構排名、專家Activity、Sociability以及Diversity等,得到結果如下:
清華大學 | 孫茂松、朱小燕、馬少平、李涓子等人 |
北京大學 | 王厚峰、李素建、穗志方、萬小軍等人 |
哈工大 | 趙鐵軍、劉挺等人 |
中國科學院 | 劉群、宗成慶、趙軍、孫樂等人 |
蘇州大學 | 張民、周國棟等人 |
復旦大學 | 黃萱菁等人 |
東北大學 | 朱靖波等人 |
以下是AMiner挖掘出國內自然語言處理重要實驗室及其主要負責人簡介。
中科院計算所自然語言處理研究組
自然語言處理研究組隸屬於中國科學院計算技術研究所智慧資訊處理重點實驗室。研究組教師有劉群、馮洋等人。
研究組主要從事自然語言處理和機器翻譯相關的研究工作,研究方向包括機器翻譯、人機對話、多語言詞法分析、句法分析和網路資訊挖掘等。
研究組已完成和正在承擔的國家自然科學基金、863計劃、科技支撐計劃、國際合作等課題40餘項,在自然語言處理和機器翻譯領域取得了多項創新性研究成果。
研究組自2004年重點開展統計機器翻譯方面的研究並取得重大突破,並於2015年起轉向神經機器翻譯並取得很大進展。
2018年7月,正式加入華為諾亞方舟實驗室,任語音語義首席科學家,主導語音和自然語言處理領域的前沿研究和技術創新。
在自然語言處理的頂級國際刊物CL、AI和頂級國際學術會議ACL、IJCAI、AAAI、EMNLP、COLING上發表高水平論文70餘篇,取得發明專利10餘項。
研究組已經成功將自主開發的統計機器翻譯和神經機器翻譯技術推廣到漢語、維吾爾語、藏語、蒙古語、英語、韓語、泰語、日語、阿拉伯語等多種語言。
部分語種的翻譯系統已經在相關領域得到了實際應用,獲得使用者的好評。
實驗室在2017年發表論文見下表。
ME-MD: An Effective Framework for Neural Machine Translation with Multiple Encoders and Decoders 作者:Jinchao Zhang、Qun Liu、Jie Zhou 收錄會議:IJCAI 2017 |
Deep Neural Machine Translation With Linear Associative Unit 作者:Mingxuan Wang、Zhengdong Lu、Jie Zhou、Qun Liu 收錄會議:ACL 2017 |
Incorporating Word Reordering Knowledge into Attention-based Neural Machine Translation 作者:inchao Zhang、Mingxuan Wang、Qun Liu、Jie Zhou 收錄會議:ACL 2017 |
Memory-Augmented Neural Machine Translation 作者:Yang Feng、Shiyue Zhang、Andi Zhang、Dong Wang、Andrew Abel 收錄會議:EMNLP 2017 |
Further Investigation into Reference Bias in Monolingual Evaluation of Machine Translation 作者:Qingsong Ma、Yvette Graham、Timothy Baldwin、Qun Liu 收錄會議:EMNLP 2017 |
Blend: a Novel Combined MT Metric Based on Direct Assessment——CASICT-DCU submission to WMT17 Metrics Task 作者:Qingsong Ma、Yvette Graham、Shugen Wang、Qun Liu 收錄會議:WMT 2017 |
CASICT-DCU Neural Machine Translation Systems for WMT17 作者:Jinchao Zhang、Peerachet Porkaew、Jiawei Hu、Qiuye Zhao、Qun Liu 收錄會議:WMT 2017 |
現任實驗室主要負責人為劉群,中國科學院自然語言處理研究組組長,都柏林大學自然語言處理組組長、專案負責人。
曾負責863重點專案“機器翻譯新方法的研究”和“面向跨語言搜尋的機器翻譯關鍵技術研究”等。
哈工大社會計算與資訊檢索研究中心
哈工大社會計算與資訊檢索研究中心(HIT-SCIR)成立於2000年9月,隸屬於電腦科學與技術學院。
研究中心成員有主任劉挺教授,副主任秦兵教授,教師包括張宇、車萬翔、陳毅恆、張偉男等。
研究方向包括語言分析、資訊抽取、情感分析、問答系統、社會媒體處理和使用者畫像6個方面。
已完成或正在承擔的國家973課題、國家自然科學基金重點專案、國家863重點專案、國際合作、企業合作等課題60餘項。
在這些專案的支援下打造出“語言技術平臺LTP”,提供給百度、騰訊、華為、金山等企業使用,獲2010年錢偉長中文資訊處理科學技術一等獎。
研究中心近年來發表論文100餘篇,其中在ACL、SIGIR、IJCAI、EMNLP等頂級國際學術會議上發表20餘篇論文,參加國內外技術評測。
並在國際CoNLL’2009七國語言句法語義分析評測總成績第一名。
研究中心透過與企業合作,已將多項技術嵌入企業產品中,為社會服務。
雙語例句檢索等一批技術嵌入金山詞霸產品中,並因此獲得2012年黑龍江省技術發明二等獎。
哈工大社會計算與資訊檢索研究中心現任負責人劉挺,哈爾濱工業大學教授,國家“萬人計劃”科技創新領軍人才。
國家“萬人計劃”科技創新領軍人才。多次擔任國家863重點專案總體組專家、基金委會評專家。
復旦自然語言處理研究組
復旦大學自然語言與資訊檢索實驗室,致力於社會媒體海量多媒體資訊處理的前沿技術研究。
主要研究方向包括:自然語言處理、非規範化文字分析、語義計算、資訊抽取、傾向性分析、文字挖掘等方面。
實驗室開發了NLP工具包FudanNLP,FudanNLP提供了一系列新技術,包括中文分詞、詞性標註、依賴解析、時間表示式識別和規範化等。
實驗室先後承擔和參與了國家科技重大專項、國家973計劃、863計劃、國家自然科學基金課題、上海市科技攻關計劃等。
並與國內外多所重點大學、公司保持著良好的合作關係。
研究成果持續發表在國際權威期刊和一流國際會議(TPAMI、TKDE、ICML、ACL、AAAI、IJCAI、SIGIR、CIKM、EMNLP、COLING等)。
復旦大學自然語言與資訊檢索實驗室現任負責人黃萱菁,復旦大學電腦科學技術學院教授、博士生導師。
曾任2014年CIKM會議競賽主席,2015年WSDM會議組織者,2015年全國社會媒體處理大會程式委員會主席,2016年全國計算語言學會議程式委員會副主席,2017年自然語言處理與中文計算國際會議程式委員會主席。
清華大學自然語言處理與社會人文計算實驗室
清華大學計算機系自然語言處理課題組在20世紀70年代末,就在黃昌寧教授的帶領下從事這方面的研究工作,是國內開展相關研究最早、深具影響力的科研單位,同時也是中國中文資訊學會計算語言學專業委員會的掛靠單位。
目前該課題組對以中文為核心的自然語言處理中的若干前沿課題,進行系統、深入的研究,研究領域的涵蓋面正逐步從計算語言學的核心問題擴充套件到社會計算和人文計算。
該課題組多篇論文被ACL 2018、IJCAI-ECAI 2018、WWW 2018錄用,內容涉及問答系統、資訊檢索、機器翻譯、詩歌生成、查詢推薦等多個領域。具體見下表:
Denoising Distantly Supervised Open-Domain Question Answering 作者:林衍凱、計昊哲、劉知遠、孫茂松 收錄會議:ACL 2018 |
Incorporating Chinese Characters of Words for Lexical Sememe Prediction 作者:金暉明*、朱昊*、劉知遠、謝若冰、孫茂松、林芬、林樂宇(*同等貢獻,本篇文章與騰訊微信合作) 收錄會議:ACL 2018 |
Entity-Duet Neural Ranking:Understanding the Role of Knowledge Graph Semantics in Neural Information Retrieval 作者:劉正皓、熊辰炎、孫茂松、劉知遠(本篇文章與CMU熊辰炎合作) 收錄會議:ACL 2018 |
Towards Robust Neural Machine Translation 作者:程勇、塗兆鵬、孟凡東、翟俊傑、劉洋(本篇文章與騰訊AI實驗室合作) 收錄會議:ACL 2018 |
Chinese Poetry Generation with a Working Memory Model 作者:矣曉沅、孫茂松、李若愚、楊宗瀚 收錄會議:IJCAI 2018 |
Query Suggestion with Feedback Memory Network 作者:武彬、熊辰炎、孫茂松、劉知遠(本篇文章與CMU熊辰炎合作) 收錄會議:WWW 2018 |
孫茂松,清華大學電腦科學與技術系教授,2007-2010年任該繫系主任。
國家重點基礎研究發展計劃(973計劃)專案首席科學家,國家社會科學基金重大專案首席專家。多次擔任相關領域國際會議和全國性學術會議大會主席或程式委員會主席。
北京大學語言計算與網際網路挖掘研究組
語言計算與網際網路挖掘研究室從屬於北京大學電腦科學技術研究所,成立於2008年7月。
研究室以自然語言處理技術、資料探勘技術與機器學習技術為基礎,對網際網路上多源異質的文字大資料進行智慧分析與深度挖掘。
為網際網路搜尋、輿情與情報分析、寫稿與對話機器人等系統提供關鍵技術支撐,並從事電腦科學與人文社會科學的交叉科學研究。
研究室當前研究內容包括:
(1)語義理解:研製全新的語義分析系統實現對人類語言(尤其是漢語)的深層語義理解;
(2)機器寫作:綜合利用自動文摘與自然語言生成等技術讓機器寫出高質量的各類稿件;
(3)情感計算:針對多語言網際網路文字實現高精度情感、立場與幽默分析;
(4)其他:包括特定情境下的人機對話技術等。
北京大學語言計算與網際網路挖掘研究組現任負責人為萬小軍,北京大學電腦科學技術研究所教授,博士生導師。
擔任計算語言學頂級國際期刊Computational Linguistics編委,TACL常務評審委員(Standing Reviewing Committee)。
研製了自動文摘開源平臺PKUSUMSUM,與今日頭條合作推出AI寫稿機器人小明(Xiaomingbot),與南方都市報合作推出寫稿機器人小南等應用系統。
北京大學計算語言學教育部重點實驗室
計算語言學教育部重點實驗室依託北京大學建設。
實驗室研究人員由北京大學資訊科學技術學院計算語言學研究所、中文系、軟體與微電子學院語言資訊工程系、計算機技術研究所、心理系和外語學院的相關研究人員構成。
主要研究方向包括:中文計算的基礎理論與模型;大規模多層次語言知識庫構建的方法;國家語言資源整理與語音資料庫建設;海量文字內容分析與動態監控;多語言資訊處理和機器翻譯。
北京大學計算語言學教育部重點實驗室現任負責人穗志方,北京大學資訊科學技術學院計算語言學實驗室主任,教授、博士生導師。
2011年度國家科技進步二等獎“綜合型語言知識庫”專案第二完成人。在計算語言學國際頂級會議ACL 2000、COLING2008、CONLL 2008、ACL 2009、EMNLP2009、AIRS 2008上發表多篇學術論文。
中科院模式識別國家重點實驗室
中科院模式識別國家重點實驗室自然語言處理組主要從事自然語言處理基礎、機器翻譯、資訊抽取和問答系統等相關研究工作,力圖在自然語言處理的理論模型和應用系統開發方面做出創新成果。
近年來,研究組注重於自然語言處理基礎理論和應用基礎的相關研究,承擔了一系列包括國家自然科學基金專案、973計劃課題、863計劃專案和支撐計劃專案等在內的基礎研究和應用基礎研究類專案,以及一批企業應用合作專案。
宗成慶,模式識別國家重點實驗室研究員、博士生導師。
目前擔任亞洲自然語言處理學會(AFNLP)候任主席,2014年獲“錢偉長中文資訊處理科學技術獎”一等獎,2015年獲國家科技進步獎二等獎,2017年獲北京市優秀教師榮譽稱號。
清華大學智慧技術與系統國家重點實驗室
智慧技術與系統國家重點實驗室依託在清華大學。
實驗室學術委員會由17名國內外著名專家組成。實驗室學術委員會名譽主任為中科院院士張鈸教授,主任為應明生教授、副主任為鄧志東教授。
清華大學智慧技術與系統國家重點實驗室現任負責人朱小燕,清華計算機系教授,博士生導師。
作為專案負責人先後承擔國家863,973專案,自然科學基金專案、國際合作專案多項。
1997年獲國家教委科技進步二等獎,2003年獲北京市科技進步二等獎。獲得國家發明專利3項。在各種國際刊物和會議上發表論文近100篇。