學界 | 和清華大學自然語言處理與社會人文計算實驗室一起讀機器翻譯論文
https://blog.csdn.net/weixin_42137700/article/details/86777053
在生產和經濟高度全球化的今天,機器翻譯(Machine Translation)是人類面對外語時最渴望擁有的工具,也是神經網路帶來最大變革的人工智慧問題之一。
從最早的基於規則的機器翻譯,到基於機率的機器翻譯,再到現在的基於神經網路的機器翻譯,機器學習和語言學的研究人員們一起經歷了幾十年的歷程。如今的機器翻譯系統雖然還算不上盡善盡美,但以谷歌翻譯、百度翻譯為代表的,使用神經機器翻譯技術的大規模開放使用的翻譯系統,已經可以時不時地給出一些流暢、明瞭的雙語互譯結果了。
當然了,在神經網路/深度學習的衝擊之下,我們也不免看到這樣的調侃:“團隊裡每開除一個語言學家,翻譯模型的準確率就可以再提升一點。”在越來越大的語料庫、越來越多的模型設計和訓練技巧的幫助下,來自語言學領域的指導帶來的提升遠不如機器學習領域的新技術成果、甚至已有技術成果的好的實現帶來的提升大。AI 科技評論的讀者們相信也有這樣的感覺。
機器翻譯,尤其是神經機器翻譯(neural machine translation,NMT)也是清華大學自然語言處理與社會人文計算實驗室重點關注的研究課題之一。為了便於自己研究,也給這個課題的其他研究人員提供從那靠和指引,清華大學自然語言處理與社會人文計算實驗室機器翻譯小組在 GitHub 上維護著一份神經機器翻譯論文清單,包含了這個領域內他們認為起到重要作用的研究論文。
列表中的神經機器翻譯論文劃分為了模型架構、注意力機制、開放詞庫、訓練目標、解碼、低語言資源翻譯、先驗知識整合、文件級別翻譯、魯棒性、視覺化和可解釋性、語言學解釋、公平性和多樣性、效率、語音翻譯、多模態、整合和重新排序、預訓練、領域適應、質量估計、以人為中心的神經機器翻譯、單詞翻譯及雙語專用語翻譯、詩歌翻譯等主題,內容十分全面細緻。除此之外,他們也列出了 10 篇必讀論文。
這 10 篇必讀論文是:
-
Peter E. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and Robert L. Mercer. 1993. The Mathematics of Statistical Machine Translation: Parameter Estimation. Computational Linguistics. (Citation: 4,965)
-
Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. 2002. BLEU: a Method for Automatic Evaluation of Machine Translation. In Proceedings of ACL 2002. (Citation: 8,507)
-
Philipp Koehn, Franz J. Och, and Daniel Marcu. 2003. Statistical Phrase-Based Translation. In Proceedings of NAACL 2003. (Citation: 3,514)
-
Franz Josef Och. 2003. Minimum Error Rate Training in Statistical Machine Translation. In Proceedings of ACL 2003. (Citation: 2,982)
-
David Chiang. 2007. Hierarchical Phrase-Based Translation. Computational Linguistics. (Citation: 1,192)
-
Ilya Sutskever, Oriol Vinyals, and Quoc V. Le. 2014. Sequence to Sequence Learning with Neural Networks. In Proceedings of NIPS 2014. (Citation: 5,428)
-
Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio. 2015. Neural Machine Translation by Jointly Learning to Align and Translate. In Proceedings of ICLR 2015. (Citation: 5,572)
-
Diederik P. Kingma, Jimmy Ba. 2015. Adam: A Method for Stochastic Optimization. In Proceedings of ICLR 2015. (Citation: 16,572)
-
Rico Sennrich, Barry Haddow, and Alexandra Birch. 2016. Neural Machine Translation of Rare Words with Subword Units. In Proceedings of ACL 2016. (Citation: 789)
-
Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin. 2017. Attention is All You Need. In Proceedings of NIPS 2017. (Citation: 1,047)
論文列表具體內容請見:
另外,在清華大學自然語言處理與社會人文計算實驗室機器翻譯小組的 GitHub 頁面還可以看到他們的開源神經機器翻譯工具包 THUMT ( )。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2600383/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 2018自然語言處理與機器學習論文發表統計自然語言處理機器學習
- 清華大學、北京語言大學獲得 CCL 2018 最佳論文獎
- 自然語言處理前沿論壇在京召開 學者專家共探機器之讀、寫、說、譯自然語言處理
- 機器學習工作坊 - 自然語言處理機器學習自然語言處理
- 《NLP漢語自然語言處理原理與實踐》學習四自然語言處理
- 計算機語言學國際大會COLING 2018公佈9篇最佳論文計算機
- 清華大學何曉斌:未來人才培養是大資料、AI和人文社會科學的結合大資料AI
- [譯] 自然語言處理真是有趣!自然語言處理
- 牛津大學xDeepMind自然語言處理 第13講 語言模型(3)自然語言處理模型
- 阿爾伯塔大學博士畢業論文:基於圖結構的自然語言處理自然語言處理
- 論文翻譯器+知雲+百度API+計算機術語庫API計算機
- 【自然語言處理篇】--Chatterbot聊天機器人自然語言處理機器人
- 牛津大學xDeepMind自然語言處理 第9講(下)語音模型自然語言處理模型
- 中國語文(自然語言處理)作業自然語言處理
- 精通Python自然語言處理 3 :形態學Python自然語言處理
- 清華大學鄭方:語音技術用於身份認證的理論與實踐
- 從技術到人才,清華-中國工程院知識智慧聯合實驗室釋出「2018自然語言處理研究報告」自然語言處理
- 自然語言處理與情緒智慧自然語言處理
- 自然語言處理中的遷移學習(下)自然語言處理遷移學習
- 自然語言處理中的遷移學習(上)自然語言處理遷移學習
- 自然語言處理背後的資料科學自然語言處理資料科學
- 基於機器學習和TFIDF的情感分類演算法,詳解自然語言處理機器學習演算法自然語言處理
- 自然語言處理的最佳實踐自然語言處理
- 《遊戲設計心理學》試讀:社會滲透理論(上)遊戲設計
- 【精讀】自然語言處理基礎之RNN自然語言處理RNN
- 《自然》證實:計算機語言更類似人類語言計算機
- 精通Python自然語言處理 2 :統計語言建模Python自然語言處理
- 自然語言處理第一次實驗結果自然語言處理
- 基於圖深度學習的自然語言處理方法和應用深度學習自然語言處理
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理
- 深度學習高效計算與處理器設計深度學習
- 如何編譯執行HanLP自然語言處理包編譯HanLP自然語言處理
- 「推薦系統的廣泛和深度學習」- 論文閱讀和翻譯深度學習
- 復旦大學黃萱菁:自然語言處理中的可理解分析自然語言處理
- 清華自然語言處理科學家孫茂松:深度學習碰壁之後,我們還能做什麼?自然語言處理深度學習
- 計算機架構頂會ISCA 2018唯一中國論文:清華大學提出AI計算晶片的儲存優化新方法計算機架構AI晶片優化
- 自然語言處理中句子相似度計算的幾種方法自然語言處理
- 自然語言處理NLP(四)自然語言處理