國內NLP實驗室哪家強？

AMiner學術頭條發表於2018-12-27

原文網址 : http://www.jiqizhixin.com/articles/2018-12-27-16

AMiner基於論文資料整理了自然語言處理華人專家庫，其中包括了來自NUS、HKUS、THU、PKU、FDU等知名高校以及百度、科大訊飛、微軟等公司的367位專家學者。

AMiner官方網站：https://www.aminer.cn/

下面基於自然語言處理華人庫中的資料對其進行分析。

國內NLP實驗室哪家強？

AMiner自然語言處理華人庫專家全球分佈

自然語言處理領域中華人專家在中國最多，美國次之。

國內NLP實驗室哪家強？

AMiner自然語言處理華人庫專家國內分佈

國內NLP實驗室哪家強？

AMiner自然語言處理華人庫專家地區統計

從地區來看，中國大陸是自然語言處理華人人才的最主要聚集地。尤其是北京、哈爾濱及東南沿海地區等具有自然語言處理學術基礎的地區。美國東部和西部等其他地區排在其後。

國內NLP實驗室哪家強？

AMiner自然語言處理華人庫專家遷徙圖

由上圖可以看出，華人專家在中國流出量大於流入量，美國則正好相反，這也說明就自然領域而言，中國對人才的吸引力要小於美國。

國內NLP實驗室哪家強？

AMiner自然語言處理華人庫專家h-index統計

注：h-index指數

國際公認的能夠比較準確地反映學者學術成就的指數，計算方法是該學者至多有h篇論文分別被引用了至少h次。

AMiner自然語言處理華人庫中專家h-index指數的平均數為14，這一數值是遠遠低於自然語言處理全球top1000學者h-index指數平均數的。

而且，在華人庫中，h-index指數<10的專家人數最多，佔比60%；10-19次之，佔比17%；>60的專家佔比僅佔9%。

這也說明，自然語言處理華人專家整體水平低於自然語言處理領域全球top1000的學者，尤其是在h-index指數>60的學者方面有所欠缺。

國內NLP實驗室哪家強？

AMiner自然語言處理華人庫男女比

AMiner自然語言處理華人庫367位專家中，男性專家佔98%，女性專家僅佔2%，二者比例約為49:1。

AMiner基於發表於國際期刊會議的學術論文，對自然語言處理領域內專家進行深入挖掘，並按照相關度和影響力等對專家進行排序和分類。

排序和分類規則主要參考專家的h-index、paper、citation、專家所獲得的榮譽、任職機構排名、專家Activity、Sociability以及Diversity等，得到結果如下：

清華大學	孫茂松、朱小燕、馬少平、李涓子等人
北京大學	王厚峰、李素建、穗志方、萬小軍等人
哈工大	趙鐵軍、劉挺等人
中國科學院	劉群、宗成慶、趙軍、孫樂等人

蘇州大學	張民、周國棟等人
復旦大學	黃萱菁等人
東北大學	朱靖波等人

以下是AMiner挖掘出國內自然語言處理重要實驗室及其主要負責人簡介。

中科院計算所自然語言處理研究組

自然語言處理研究組隸屬於中國科學院計算技術研究所智慧資訊處理重點實驗室。研究組教師有劉群、馮洋等人。

研究組主要從事自然語言處理和機器翻譯相關的研究工作，研究方向包括機器翻譯、人機對話、多語言詞法分析、句法分析和網路資訊挖掘等。

研究組已完成和正在承擔的國家自然科學基金、863計劃、科技支撐計劃、國際合作等課題40餘項，在自然語言處理和機器翻譯領域取得了多項創新性研究成果。

研究組自2004年重點開展統計機器翻譯方面的研究並取得重大突破，並於2015年起轉向神經機器翻譯並取得很大進展。

2018年7月，正式加入華為諾亞方舟實驗室，任語音語義首席科學家，主導語音和自然語言處理領域的前沿研究和技術創新。

在自然語言處理的頂級國際刊物CL、AI和頂級國際學術會議ACL、IJCAI、AAAI、EMNLP、COLING上發表高水平論文70餘篇，取得發明專利10餘項。

研究組已經成功將自主開發的統計機器翻譯和神經機器翻譯技術推廣到漢語、維吾爾語、藏語、蒙古語、英語、韓語、泰語、日語、阿拉伯語等多種語言。

部分語種的翻譯系統已經在相關領域得到了實際應用，獲得使用者的好評。

實驗室在2017年發表論文見下表。

ME-MD: An Effective Framework for Neural Machine Translation with Multiple Encoders and Decoders

作者：Jinchao Zhang、Qun Liu、Jie Zhou

收錄會議：IJCAI 2017

Deep Neural Machine Translation With Linear Associative Unit

作者：Mingxuan Wang、Zhengdong Lu、Jie Zhou、Qun Liu

收錄會議：ACL 2017

Incorporating Word Reordering Knowledge into Attention-based Neural Machine Translation

作者：inchao Zhang、Mingxuan Wang、Qun Liu、Jie Zhou

收錄會議：ACL 2017

Memory-Augmented Neural Machine Translation

作者：Yang Feng、Shiyue Zhang、Andi Zhang、Dong Wang、Andrew Abel

收錄會議：EMNLP 2017

Further Investigation into Reference Bias in Monolingual Evaluation of Machine Translation

作者：Qingsong Ma、Yvette Graham、Timothy Baldwin、Qun Liu

收錄會議：EMNLP 2017

Blend: a Novel Combined MT Metric Based on Direct Assessment——CASICT-DCU submission to WMT17 Metrics Task

作者：Qingsong Ma、Yvette Graham、Shugen Wang、Qun Liu

收錄會議：WMT 2017

CASICT-DCU Neural Machine Translation Systems for WMT17

作者：Jinchao Zhang、Peerachet Porkaew、Jiawei Hu、Qiuye Zhao、Qun Liu

收錄會議：WMT 2017

現任實驗室主要負責人為劉群，中國科學院自然語言處理研究組組長，都柏林大學自然語言處理組組長、專案負責人。

國內NLP實驗室哪家強？

曾負責863重點專案“機器翻譯新方法的研究”和“面向跨語言搜尋的機器翻譯關鍵技術研究”等。

哈工大社會計算與資訊檢索研究中心

哈工大社會計算與資訊檢索研究中心（HIT-SCIR）成立於2000年9月，隸屬於電腦科學與技術學院。

研究中心成員有主任劉挺教授，副主任秦兵教授，教師包括張宇、車萬翔、陳毅恆、張偉男等。

研究方向包括語言分析、資訊抽取、情感分析、問答系統、社會媒體處理和使用者畫像6個方面。

已完成或正在承擔的國家973課題、國家自然科學基金重點專案、國家863重點專案、國際合作、企業合作等課題60餘項。

在這些專案的支援下打造出“語言技術平臺LTP”，提供給百度、騰訊、華為、金山等企業使用，獲2010年錢偉長中文資訊處理科學技術一等獎。

研究中心近年來發表論文100餘篇，其中在ACL、SIGIR、IJCAI、EMNLP等頂級國際學術會議上發表20餘篇論文，參加國內外技術評測。

並在國際CoNLL’2009七國語言句法語義分析評測總成績第一名。

研究中心透過與企業合作，已將多項技術嵌入企業產品中，為社會服務。

雙語例句檢索等一批技術嵌入金山詞霸產品中，並因此獲得2012年黑龍江省技術發明二等獎。

哈工大社會計算與資訊檢索研究中心現任負責人劉挺，哈爾濱工業大學教授，國家“萬人計劃”科技創新領軍人才。

國內NLP實驗室哪家強？

國家“萬人計劃”科技創新領軍人才。多次擔任國家863重點專案總體組專家、基金委會評專家。

復旦自然語言處理研究組

復旦大學自然語言與資訊檢索實驗室，致力於社會媒體海量多媒體資訊處理的前沿技術研究。

主要研究方向包括：自然語言處理、非規範化文字分析、語義計算、資訊抽取、傾向性分析、文字挖掘等方面。

實驗室開發了NLP工具包FudanNLP，FudanNLP提供了一系列新技術，包括中文分詞、詞性標註、依賴解析、時間表示式識別和規範化等。

實驗室先後承擔和參與了國家科技重大專項、國家973計劃、863計劃、國家自然科學基金課題、上海市科技攻關計劃等。

並與國內外多所重點大學、公司保持著良好的合作關係。

研究成果持續發表在國際權威期刊和一流國際會議（TPAMI、TKDE、ICML、ACL、AAAI、IJCAI、SIGIR、CIKM、EMNLP、COLING等）。

復旦大學自然語言與資訊檢索實驗室現任負責人黃萱菁，復旦大學電腦科學技術學院教授、博士生導師。

國內NLP實驗室哪家強？

曾任2014年CIKM會議競賽主席，2015年WSDM會議組織者，2015年全國社會媒體處理大會程式委員會主席，2016年全國計算語言學會議程式委員會副主席，2017年自然語言處理與中文計算國際會議程式委員會主席。

清華大學自然語言處理與社會人文計算實驗室

清華大學計算機系自然語言處理課題組在20世紀70年代末，就在黃昌寧教授的帶領下從事這方面的研究工作，是國內開展相關研究最早、深具影響力的科研單位，同時也是中國中文資訊學會計算語言學專業委員會的掛靠單位。

目前該課題組對以中文為核心的自然語言處理中的若干前沿課題，進行系統、深入的研究，研究領域的涵蓋面正逐步從計算語言學的核心問題擴充套件到社會計算和人文計算。

該課題組多篇論文被ACL 2018、IJCAI-ECAI 2018、WWW 2018錄用，內容涉及問答系統、資訊檢索、機器翻譯、詩歌生成、查詢推薦等多個領域。具體見下表：

Denoising Distantly Supervised Open-Domain Question Answering

作者：林衍凱、計昊哲、劉知遠、孫茂松

收錄會議：ACL 2018

Incorporating Chinese Characters of Words for Lexical Sememe Prediction

作者：金暉明*、朱昊*、劉知遠、謝若冰、孫茂松、林芬、林樂宇（*同等貢獻，本篇文章與騰訊微信合作）

收錄會議：ACL 2018

Entity-Duet Neural Ranking:Understanding the Role of Knowledge Graph Semantics in Neural Information Retrieval

作者：劉正皓、熊辰炎、孫茂松、劉知遠（本篇文章與CMU熊辰炎合作）

收錄會議：ACL 2018

Towards Robust Neural Machine Translation

作者：程勇、塗兆鵬、孟凡東、翟俊傑、劉洋（本篇文章與騰訊AI實驗室合作）

收錄會議：ACL 2018

Chinese Poetry Generation with a Working Memory Model

作者：矣曉沅、孫茂松、李若愚、楊宗瀚

收錄會議：IJCAI 2018

Query Suggestion with Feedback Memory Network

作者：武彬、熊辰炎、孫茂松、劉知遠（本篇文章與CMU熊辰炎合作）

收錄會議：WWW 2018

孫茂松，清華大學電腦科學與技術系教授，2007-2010年任該繫系主任。

國內NLP實驗室哪家強？

國家重點基礎研究發展計劃（973計劃）專案首席科學家，國家社會科學基金重大專案首席專家。多次擔任相關領域國際會議和全國性學術會議大會主席或程式委員會主席。

北京大學語言計算與網際網路挖掘研究組

語言計算與網際網路挖掘研究室從屬於北京大學電腦科學技術研究所，成立於2008年7月。

研究室以自然語言處理技術、資料探勘技術與機器學習技術為基礎，對網際網路上多源異質的文字大資料進行智慧分析與深度挖掘。

為網際網路搜尋、輿情與情報分析、寫稿與對話機器人等系統提供關鍵技術支撐，並從事電腦科學與人文社會科學的交叉科學研究。

研究室當前研究內容包括：

（1）語義理解：研製全新的語義分析系統實現對人類語言（尤其是漢語）的深層語義理解；

（2）機器寫作：綜合利用自動文摘與自然語言生成等技術讓機器寫出高質量的各類稿件；

（3）情感計算：針對多語言網際網路文字實現高精度情感、立場與幽默分析；

（4）其他：包括特定情境下的人機對話技術等。

北京大學語言計算與網際網路挖掘研究組現任負責人為萬小軍，北京大學電腦科學技術研究所教授，博士生導師。

國內NLP實驗室哪家強？

擔任計算語言學頂級國際期刊Computational Linguistics編委，TACL常務評審委員（Standing Reviewing Committee）。

研製了自動文摘開源平臺PKUSUMSUM，與今日頭條合作推出AI寫稿機器人小明（Xiaomingbot），與南方都市報合作推出寫稿機器人小南等應用系統。

北京大學計算語言學教育部重點實驗室

計算語言學教育部重點實驗室依託北京大學建設。

實驗室研究人員由北京大學資訊科學技術學院計算語言學研究所、中文系、軟體與微電子學院語言資訊工程系、計算機技術研究所、心理系和外語學院的相關研究人員構成。

主要研究方向包括：中文計算的基礎理論與模型；大規模多層次語言知識庫構建的方法；國家語言資源整理與語音資料庫建設；海量文字內容分析與動態監控；多語言資訊處理和機器翻譯。

北京大學計算語言學教育部重點實驗室現任負責人穗志方，北京大學資訊科學技術學院計算語言學實驗室主任，教授、博士生導師。

國內NLP實驗室哪家強？

2011年度國家科技進步二等獎“綜合型語言知識庫”專案第二完成人。在計算語言學國際頂級會議ACL 2000、COLING2008、CONLL 2008、ACL 2009、EMNLP2009、AIRS 2008上發表多篇學術論文。

中科院模式識別國家重點實驗室

中科院模式識別國家重點實驗室自然語言處理組主要從事自然語言處理基礎、機器翻譯、資訊抽取和問答系統等相關研究工作，力圖在自然語言處理的理論模型和應用系統開發方面做出創新成果。

近年來，研究組注重於自然語言處理基礎理論和應用基礎的相關研究，承擔了一系列包括國家自然科學基金專案、973計劃課題、863計劃專案和支撐計劃專案等在內的基礎研究和應用基礎研究類專案，以及一批企業應用合作專案。

國內NLP實驗室哪家強？

宗成慶，模式識別國家重點實驗室研究員、博士生導師。

國內NLP實驗室哪家強？

目前擔任亞洲自然語言處理學會（AFNLP）候任主席，2014年獲“錢偉長中文資訊處理科學技術獎”一等獎，2015年獲國家科技進步獎二等獎，2017年獲北京市優秀教師榮譽稱號。

清華大學智慧技術與系統國家重點實驗室

智慧技術與系統國家重點實驗室依託在清華大學。國內NLP實驗室哪家強？

實驗室學術委員會由17名國內外著名專家組成。實驗室學術委員會名譽主任為中科院院士張鈸教授，主任為應明生教授、副主任為鄧志東教授。

清華大學智慧技術與系統國家重點實驗室現任負責人朱小燕，清華計算機系教授，博士生導師。

國內NLP實驗室哪家強？

作為專案負責人先後承擔國家863，973專案，自然科學基金專案、國際合作專案多項。

1997年獲國家教委科技進步二等獎，2003年獲北京市科技進步二等獎。獲得國家發明專利3項。在各種國際刊物和會議上發表論文近100篇。

相關文章

國內實驗室資訊化管理現狀
2021-03-12
清華NLP實驗室劉知遠：如何寫一篇合格的NLP論文
2019-03-11
國內首家移動及物聯網安全聯合實驗室成立
2018-03-06
該填志願了，國內大學計算機專業哪家強？
2020-07-26
計算機
世界品牌實驗室：2024年度《世界品牌500強》排行榜蘋果登頂騰訊國內第二
2024-12-15
蘋果
人設崩塌的美國生物實驗室
2021-01-22
對話清華NLP實驗室劉知遠：NLP搞事情少不了知識庫與圖神經網路
2019-02-07
神經網路
世界品牌實驗室：2019年世界品牌500強 40箇中國品牌入選
2019-12-12
Python 管理哪家強？
2019-03-15
Python
中國雲端計算方案商哪家強？
2018-03-19
國內mes系統廠商排名哪家好？
2020-05-07
web遊戲框架哪家強？國內外精選優質框架分析及注意事項
2018-12-26
Web遊戲框架
ADO品牌電動出行實驗室通過國際公認機構SGS的"QTL實驗室"認證
2022-05-28
QT
晶片檢測哪家強？
2023-10-14
晶片
OpenAI與洛斯阿拉莫斯國家實驗室合作
2024-07-11
OpenAI
企業版防毒軟體哪家強?國內外四大熱門產品測評
2018-08-01
防毒
【招聘】NLP文字挖掘研究員-深圳大學傳播學院大資料傳播實驗室
2018-12-24
大資料
產學研用強強聯合，中國信通院、清華大學、騰訊安全共建雲原生安全實驗室
2022-06-15
國內免費漢語語料庫-NLP
2018-10-29
實驗室銀訊PCM配置
2020-02-28
lims實驗室管理系統是什麼?實驗室資訊管理系統介紹!
2021-11-03
身為實驗室管理者的你，需要知道的實驗室物聯網！
2021-03-17
中國首個國家大資料工程實驗室在貴陽揭牌
2018-03-29
大資料
21資料新聞實驗室：截止2020年底中國市值500強騰訊排名第一
2021-01-05
1032 挖掘機技術哪家強
2018-09-26
雲端計算到底哪家強
2020-10-01
steam隆重推出 Steam 實驗室
2019-07-12
Discovery收購ReachBio研究實驗室
2023-04-11
11月26實驗室日誌
2020-11-26
國內UI設計培訓機構哪家比較好
2021-11-19
UI
如何在技術上實現室內導航？室內地圖導航怎麼實現？
2021-03-22
地圖
國產資料庫哪家強?上半年13家公司專案簽約及驗收盤點
2020-09-07
資料庫
室內地圖導航是怎麼實現的？室內導航好做嗎？
2023-02-08
地圖
21資料新聞實驗室：2018年中國上市公司市值500強京東跌出前20
2018-12-31
百分點認知智慧實驗室：NLP模型開發平臺在輿情分析中的設計和實踐（下）
2020-10-23
模型
7月勒索病毒報告：Globelmposter勒索病毒活動增強|美創安全實驗室
2020-08-12
如何實現室內無線覆蓋
2019-07-18
Big Sur中Chrome與Safari哪家強？
2021-02-23
Chrome