本文由機器之心經授權轉載自 AI 部落聯盟(ID:AI_Tribe),未經授權禁止二次轉載。
根據這幾年的積累,整理了一份國內外學術界和工業界的牛人和大牛團隊,供大家申請碩士、博士、博士後和找工作參考。
學校(排名不分先後):
哈工大社會計算與資訊檢索實驗室:劉挺老師坐鎮,教師包括:秦兵、張宇、車萬翔、趙妍妍、劉銘、張偉男、丁效等老師,實驗室共7個組,另外王海峰老師也是實驗室兼職博導。
哈工大智慧技術與自然語言處理實驗室:王曉龍老師坐鎮,教師包括劉秉權、劉遠超 、孫承傑等老師
哈工大機器智慧與翻譯研究室:趙鐵軍老師坐鎮,教師包括楊沐昀、鄭德權、徐冰老師等,另外周明老師是實驗室兼職博導。
哈工大深圳智慧計算研究中心:王曉龍老師坐鎮,包括陳清才、湯步洲、徐睿峰、劉濱等老師,實力很強。
哈工大深圳人類語言技術組:徐睿峰老師坐鎮,情感原因發現做的比較好。
哈工大另外做NLP的老師包括:關毅、王軒等。
清華大學自然語言處理與社會人文計算實驗室:孫茂松老師坐鎮,包括劉洋、劉知遠等老師。論文發的非常多。
清華大學互動式人工智慧(CoAI)課題組:朱小燕老師坐鎮,包括黃民烈等老師。Dialogue System做的非常好,論文非常多。
清華大學智慧技術與系統國家重點實驗室資訊檢索課題組:馬少平老師坐鎮,包括張敏、劉奕群等老師。資訊檢索做的非常好,論文非常多,前段時間剛拿了CIKM唯一的最佳論文(因為一作是學生,跟最佳學生論文合二為一了)。
清華大學另外做NLP的老師還有李涓子、唐傑、朱軍等老師,李老師知識圖譜做得好,唐老師資料探勘(尤其是學者畫像)做得好,朱老師偏向機器學習和貝葉斯等做的很好。
北京大學計算語言學教育部重點實驗室:教師包括:王厚峰、萬小軍、常寶寶、李素建、孫栩、嚴睿、穗志方、吳雲芳等(包含其他實驗室的老師)。萬老師、李老師、常老師等發論文很多。
北京大學語言計算與網際網路挖掘研究組:萬小軍老師、孫薇薇老師。萬老師主要做自動摘要、文字生成、情感分析與計算等,論文非常多。
中科院NLP組主要集中在自動化所模式識別國家重點實驗室下屬的中文資訊處理研究組,另外計算所有劉群老師組和軟體所也有孫樂老師做。具體老師包括劉群、宗成慶、趙軍、孫樂、王斌、徐君、張家俊、劉康、韓先培、何世柱等老師。論文非常多。
復旦大學自然語言處理組:黃萱菁、邱錫鵬等老師,發論文很多。
復旦大學知識工場:肖仰華老師知識圖譜做的非常好,論文發的很多。
蘇州大學自然語言處理組:做機器翻譯、情感分析、資訊抽取等,論文發的很多。教師包括張民、周國棟、姚建民、李正華、熊得意、李軍輝、洪宇、陳文亮等老師。其中張老師、姚老師、李老師都是哈工大畢業的,張老師也是哈工大的兼職博導,論文很多。
東北大學自然語言處理實驗室:機器翻譯做的非常好,還成立了自己的公司,對外合作很多。姚天順老師是創始人,朱靖波老師坐鎮,教師包括肖桐、任飛亮、張春良等老師。
浙江大學:陳華鈞、趙洲等老師,陳老師知識圖譜做的很厲害。
中國人民大學:文繼榮、趙鑫、徐君、竇志成等老師。文老師現在是院長,之前在MSRA,資訊檢索非常厲害。
上海交大:趙海老師,主要做機器翻譯、句法分析等。
東南大學:漆桂林老師,知識圖譜做的很厲害。
大連理工資訊檢索實驗室:林鴻飛老師坐鎮,包括楊志豪、王健、張紹武、孫媛媛、張冬瑜、楊亮等老師。主要做資訊檢索,隱喻、幽默等語料庫做的非常好。
西湖大學:張嶽老師,之前在新加坡,論文發的非常非常非常多,劍橋2016年統計的全世界發論文的數量好像排第二。
南京大學自然語言處理研究組:包括陳家俊、戴新宇、黃書劍等老師。
天津大學:張鵬老老師,資訊檢索做的很好。
北京理工大學:黃河燕老師、張華平老師。黃老師是北京理工大學計算機學院院長,主要研究機器翻譯,擔任好幾個副理事長,享受國務院特殊津貼。中科院的自然語言處理工具包就是張老師做的,另外跟劉群老師合作發了不少論文,我之前工作時實習生開發的NER就是借鑑的他的層疊馬爾可夫模型而二次開發和最佳化的。
武漢大學語言與資訊研究中心:姬東鴻等老師。
廈門大學智慧科學與技術系自然語言處理實驗室:包括史曉東等老師,主要做機器翻譯、知識圖譜、資訊抽取等。
山東大學:聶禮強老師,資訊檢索做的非常好,論文很多。之前在新加坡,新加坡發SIGIR太多了。。。
南開大學:楊徵路老師,主要做資訊檢索。
北京郵電大學:王小捷老師。
北京語言大學:於東老師,主要做機器翻譯、人機對話等。
華東師範大學:吳苑斌老師,記得應該是復旦大學黃萱菁老師的學生。
山西大學:李茹老師,山西大學計算機學院副院長。
鄭州大學自然語言處理實驗室:實驗室網頁最近打不開了。
黑龍江大學:付國宏、張梅山等老師。
以下是港澳臺地區的高校(排名不分先後):
臺灣大學自然語言處理實驗室:主要研究方向包括知識圖譜、機器翻譯、問答、自動摘要、資訊檢索等,論文非常多。
香港科技大學人類語言技術中心:論文非常多,牛人也不少。
香港中文大學文字挖掘組:主要研究方向包括文字挖掘和資訊檢索。
澳門大學自然語言處理與中葡翻譯實驗室:主要做機器翻譯,做的非常好,論文也非常多。
香港理工大學社會媒體挖掘組:主要研究方向包括社會影響力建模、社會媒體分析、觀點摘要、觀點追蹤、跨語言情感分析等,這個實驗室對外合作很多,比如北大李素建老師、MSRA的韋福如老師等。
國內工業界(排名不分先後):
百度王海峰老師以及帶領的自然語言處理部+百度研究院做NLP的一些組,內部NLPC平臺整合了幾十個NLP運算元,一些運算元每天呼叫量都能上億次(不要問我為啥知道這麼詳細,因為15-16年我參與開發過2個運算元,被加到開發者組了,經常有群郵件告知各運算元的呼叫情況),幾乎涵蓋所有的NLP任務,部分技術在百度AI開放平臺-全球領先的人工智慧服務平臺-百度AI開放平臺開放API,少量技術在github開原始碼;
MSRA周明老師帶領的NLC組,組內論文發的非常多,尤其是幾個高階研究員、主管研究員;
哈工大和科大訊飛聯合實驗室:實驗室主任是劉挺老師,閱讀理解做的非常好;
華為諾亞方舟的劉群老師以及帶領的團隊;
小米:王斌老師坐鎮,王老師翻譯的書相信大部分人都看過吧。
今日頭條的李航老師;
阿里巴巴、騰訊NLP做的也不少,只是個人感覺都是很多團隊在做,比較分散,沒有集中到一起。如果有人總結比較好的話,歡迎告知。
其他很多創業公司也有大牛坐鎮,只是太多、太分散了,不再贅述,感興趣的可以私聊。
國外學術界:
麻省理工學院:Regina Barzilay, Tommi S. Jaakkola。
卡內基梅隆大學:Jaime Carbonell, Justine Cassell, William Cohen(主要做資訊抽取), Chris Dyer(主要做機器翻譯), Scott Fahlman,(主要做只是表示和知識推理),Robert Frederking, Eduard Hovy, Alon Lavie, Lori Levin, Brian MacWhinney,(做的比較雜),Teruko Mitamura,(主要做QA),Tom Mitchell, Eric Nyberg,Kemal Oflazer, Carolyn Penstein Rosé,(主要做聊天),Roni Rosenfeld, Noah Smith, Eric Xing。
約翰·霍普金斯大學:Andreas Andreou,Raman Arora,Jason Eisner, Sanjeev Khudanpur, David Yarowsky, Hynek Hermansky,Mark Dredze, Tom Lippincott,Philipp Koehn,Najim Dehak,Ben van Durme。絕對的NLP領域頂級牛校,研究幾乎涵蓋所有NLP任務,而且做的都非常好,如果非要說主要研究內容的話:句法分析、機器翻譯。
普林斯頓大學:Sanjeev Arora,Karthik Narasimhan。
史丹佛大學: Christopher Manning, Daniel Jurafsky, Percy Liang,這幾個人不用贅述了吧,實驗室做的很廣泛,句法分析和詞性標註的工具很有名。
哈弗大學:Stuart Shieber,Alexander Rush,主要做MT、自動摘要和文字生成。
劍橋大學:Edward J. Briscoe,Ann Copestake,Simone Teufel,Paula Buttery,Andreas Vlachos,摘要、文字生成、NLU、句法分析、IR做的都不錯。
牛津大學:Stephen Pulman,Phil Blunsom(MT非常非常厲害)。
加州大學伯克利分校:Dan Klein(主要做IE和MT)。
伊利諾伊大學香檳分校:Margaret M. Fleck (CS),Roxana Girju (Linguistics),Mark Hasegawa-Johnson (ECE),Julia Hockenmaier (CS), Dan Roth (CS),ChengXiang Zhai (CS)。
賓夕法尼亞大學:Mitch Marcus,Dan Roth,Lyle Ungar,Ani Nenkova,Chris Callison-Burch,句法分析做的非常屌,LTAG、Penn Treebank不用過多解釋了吧。
芝加哥大學:John Lafferty(CRF發明人,機器翻譯做的也不錯), John Goldsmith
哥倫比亞大學:Kathy McKeown, Julia Hirschberg,Owen Rambow。
康奈爾大學:Lillian Lee(主要做SA(情感分析)), Thorsten Joachims(深入學習SVM的話應該知道他), Claire Cardie, Yoav Artzi。
俄亥俄州立大學(OSU):Eric Fosler-Lussier(我是因為做對話知道的他), Michael White(主要做NLG), William Schuler(主要做句法分析和MT), Micha Elsner, Alan Ritter, Wei Xu(社交媒體)。
匹茲堡大學:Ashley Kevin, Brusilovsky Peter, Lewis Michael。
多倫多大學:Graeme Hirst, Gerald Penn,Frank Rudzic,Suzanne Stevenson,主要做句法分析、語義分析。
麥吉爾大學:Doina Precup,Jackie Chi Kit Cheung,Joelle Pineau, Prakash Panangaden
蒙特利爾大學:Yoshua Bengio,不過多解釋。
佐治亞理工:Eric Gilbert(社會計算領域很有名)。
南加州大學:Jerry Hobbs,Ron Artstein,David DeVault,Kallirroi Georgila,Panayiotis (Panos) Georgiou, Andrew Gordon,Jerry Hobbs,Khalil Iskarous,Kevin Knight,Sungbok Lee, Anton Leuski,Jonathan May,Prem Natarajan,MT、IE、關係挖掘、對話做的都不錯。
華盛頓大學:Tim Althoff,Jeffrey Bilmes,Yejin Choi,Pedro Domingos,Oren Etzioni, Hannaneh Hajishirzi,Noah Smith,Daniel S. Weld,Luke Zettlemoyer,主要做句法分析、MT、對話、IR等。
愛丁堡大學:Shay Cohen(句法分析),Sharon Goldwater,Kenneth Heafield(MT),Frank Keller(句法分析),Mirella Lapata(NLU、NLG),Adam Lopez,Walid Magdy(IR、DM、社會計算),Rico Sennrich(句法分析、MT),Mark Steedman(對話),Ivan Titov(句法分析、NLU),Bonnie Webber(QA)。
新加坡國立大學:NG Hwee Tou(主要做MT和句法糾錯)。
馬里蘭大學:Philip Resnik, Naomi Feldman,Marine Carpuat,Hal Daumé, 主要做MT和IR。
東北大學:David A. Smith, Byron Wallace, Lu Wang。
加州大學伯克利分校:Dan Klein,主要做NLP和ML交叉研究。
加州大學聖巴巴拉分校:William Wang, 主要做IE(資訊抽取)和ML。
加州大學聖克魯茲分校:Marilyn Walker,主要做dialogue。
紐約市立學院(CUNY):Martin Chodorow,Liang huang,Andrew Rosenberg,William Sakas,Virginia Teller。
University of Massachusetts Amherst:Andrew McCallum(CRF、主題模型)、Bruce Croft、James Allan(IR做的非常屌)。
紐約大學:Sam Bowman, Kyunghyun Cho,NLU做的非常好。
北卡羅來納大學教堂山分校(UNC):Mohit Bansal, Tamara Berg,主要做句法分析、多模態對話。
羅切斯特大學:Len Schubert, James Allen(篇章分析、對話做的很好),Dan Gildea(句法分析、MT)。
謝菲爾德大學:Rob Gaizauskas (Head of Group),Mark Hepple,Lucia Specia(MT很厲害),Mark Stevenson(主要做IR和IE),Yorick Wilks(ACL終身成就獎)。
還有很多學校、很多學術界大佬沒整理了,後續再補充吧。另外美國工業界的NLP大牛也很多,比如google、facebook、microsoft、amazon、IBM等公司。
以上就是我這些年的總結,畢竟精力有限,難免掛一漏萬。國內學術界、工業界瞭解較多,國外瞭解相對較少,很多隻是掃過一些學者的論文或者看過他們的主頁,如果大家有了解的歡迎交流。謝謝!
本文由機器之心經授權轉載自 AI 部落聯盟(ID:AI_Tribe),原文連結:https://mp.weixin.qq.com/s/MD2-xMWWXx7rpfWzd5XDxA