學界 | 和清華大學自然語言處理與社會人文計算實驗室一起讀機器翻譯論文
https://blog.csdn.net/weixin_42137700/article/details/86777053
在生產和經濟高度全球化的今天,機器翻譯(Machine Translation)是人類面對外語時最渴望擁有的工具,也是神經網路帶來最大變革的人工智慧問題之一。
從最早的基於規則的機器翻譯,到基於機率的機器翻譯,再到現在的基於神經網路的機器翻譯,機器學習和語言學的研究人員們一起經歷了幾十年的歷程。如今的機器翻譯系統雖然還算不上盡善盡美,但以谷歌翻譯、百度翻譯為代表的,使用神經機器翻譯技術的大規模開放使用的翻譯系統,已經可以時不時地給出一些流暢、明瞭的雙語互譯結果了。
當然了,在神經網路/深度學習的衝擊之下,我們也不免看到這樣的調侃:“團隊裡每開除一個語言學家,翻譯模型的準確率就可以再提升一點。”在越來越大的語料庫、越來越多的模型設計和訓練技巧的幫助下,來自語言學領域的指導帶來的提升遠不如機器學習領域的新技術成果、甚至已有技術成果的好的實現帶來的提升大。AI 科技評論的讀者們相信也有這樣的感覺。
機器翻譯,尤其是神經機器翻譯(neural machine translation,NMT)也是清華大學自然語言處理與社會人文計算實驗室重點關注的研究課題之一。為了便於自己研究,也給這個課題的其他研究人員提供從那靠和指引,清華大學自然語言處理與社會人文計算實驗室機器翻譯小組在 GitHub 上維護著一份神經機器翻譯論文清單,包含了這個領域內他們認為起到重要作用的研究論文。
列表中的神經機器翻譯論文劃分為了模型架構、注意力機制、開放詞庫、訓練目標、解碼、低語言資源翻譯、先驗知識整合、文件級別翻譯、魯棒性、視覺化和可解釋性、語言學解釋、公平性和多樣性、效率、語音翻譯、多模態、整合和重新排序、預訓練、領域適應、質量估計、以人為中心的神經機器翻譯、單詞翻譯及雙語專用語翻譯、詩歌翻譯等主題,內容十分全面細緻。除此之外,他們也列出了 10 篇必讀論文。
這 10 篇必讀論文是:
-
Peter E. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and Robert L. Mercer. 1993. The Mathematics of Statistical Machine Translation: Parameter Estimation. Computational Linguistics. (Citation: 4,965)
-
Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. 2002. BLEU: a Method for Automatic Evaluation of Machine Translation. In Proceedings of ACL 2002. (Citation: 8,507)
-
Philipp Koehn, Franz J. Och, and Daniel Marcu. 2003. Statistical Phrase-Based Translation. In Proceedings of NAACL 2003. (Citation: 3,514)
-
Franz Josef Och. 2003. Minimum Error Rate Training in Statistical Machine Translation. In Proceedings of ACL 2003. (Citation: 2,982)
-
David Chiang. 2007. Hierarchical Phrase-Based Translation. Computational Linguistics. (Citation: 1,192)
-
Ilya Sutskever, Oriol Vinyals, and Quoc V. Le. 2014. Sequence to Sequence Learning with Neural Networks. In Proceedings of NIPS 2014. (Citation: 5,428)
-
Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio. 2015. Neural Machine Translation by Jointly Learning to Align and Translate. In Proceedings of ICLR 2015. (Citation: 5,572)
-
Diederik P. Kingma, Jimmy Ba. 2015. Adam: A Method for Stochastic Optimization. In Proceedings of ICLR 2015. (Citation: 16,572)
-
Rico Sennrich, Barry Haddow, and Alexandra Birch. 2016. Neural Machine Translation of Rare Words with Subword Units. In Proceedings of ACL 2016. (Citation: 789)
-
Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin. 2017. Attention is All You Need. In Proceedings of NIPS 2017. (Citation: 1,047)
論文列表具體內容請見:
另外,在清華大學自然語言處理與社會人文計算實驗室機器翻譯小組的 GitHub 頁面還可以看到他們的開源神經機器翻譯工具包 THUMT ( )。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2600383/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【研究員視角】大牛帶你讀論文|自然語言處理自然語言處理
- 2018自然語言處理與機器學習論文發表統計自然語言處理機器學習
- [譯] 自然語言處理真是有趣!自然語言處理
- 自然語言處理前沿論壇在京召開 學者專家共探機器之讀、寫、說、譯自然語言處理
- 中國語文(自然語言處理)作業自然語言處理
- 論文翻譯器+知雲+百度API+計算機術語庫API計算機
- 自然語言處理領域重要論文&資源全索引自然語言處理索引
- 【自然語言處理篇】--Chatterbot聊天機器人自然語言處理機器人
- 《NLP漢語自然語言處理原理與實踐》學習四自然語言處理
- 自然語言處理與分析(one)自然語言處理
- 深度學習、自然語言處理和表徵方法深度學習自然語言處理
- Python自然語言處理 1 語言處理與PythonPython自然語言處理
- 自然語言處理與情緒智慧自然語言處理
- 自然語言處理(NLP)自然語言處理
- 自然語言處理的最佳實踐自然語言處理
- 使用Mahout實現自然語言處理自然語言處理
- 《自然》證實:計算機語言更類似人類語言計算機
- ACL 2017論文研討會:聚焦自然語言處理領域的新技術自然語言處理
- 【精讀】自然語言處理基礎之RNN自然語言處理RNN
- 自然語言處理第一次實驗結果自然語言處理
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理
- 自然語言處理(NLP)概述自然語言處理
- 自然語言處理NLP(四)自然語言處理
- Python自然語言處理Python自然語言處理
- 如何編譯執行HanLP自然語言處理包編譯HanLP自然語言處理
- 自然語言處理中句子相似度計算的幾種方法自然語言處理
- 解讀計算機處理器之殤 - Meltdown 與 Spectre計算機
- 《遊戲設計心理學》試讀:社會滲透理論(上)遊戲設計
- 精通Python自然語言處理 2 :統計語言建模Python自然語言處理
- 史丹佛自然語言處理習題課1——緒論自然語言處理
- 【自然語言處理篇】--聊天機器人從初始到應用自然語言處理機器人
- 探索自然語言處理:語言模型的發展與應用自然語言處理模型
- 影像處理和計算機視覺中的經典論文整理計算機視覺
- 面向機器智慧的TensorFlow實戰6:迴圈神經網路與自然語言處理神經網路自然語言處理
- HanLP 自然語言處理 for nodejsHanLP自然語言處理NodeJS
- 自然語言處理:分詞方法自然語言處理分詞
- 自然語言處理(nlp)比計算機視覺(cv)發展緩慢,而且更難!自然語言處理計算機視覺
- OpenAI:用於深度學習和自然語言處理的注意機制和記憶模型OpenAI深度學習自然語言處理模型