NLP知識總結和論文整理

生於思考發表於2022-03-26

原文網址 : https://www.cnblogs.com/AICROC/p/16057409.html

詞向量

參考論文: Efficient Estimation of Word Representations in Vector Space

CBOW (Continuous Bag-of-Word): 挑一個要預測的詞，來學習這個詞前後文中詞語和預測詞的關係。

Skip-Gram: 使用文中的某個詞，然後預測這個詞周邊的詞。相比 CBOW 最大的不同，就是剔除掉了中間的那個 SUM 求和的過程，將詞向量求和的這個過程不太符合直觀的邏輯，而Skip-Gram沒有這個過程。

句向量

Seq2Seq Learning 參考論文: Sequence to Sequence Learning with Neural Networks

將一個 sequence 轉換成另一個 sequence。也就是用Encoder壓縮並提煉第一個sequence的資訊，然後用Decoder將這個資訊轉換成另一種語言或其他的表達形式。

CNN for NLP 參考論文：Convolutional Neural Networks for Sentence Classification

注意力

CNN Attention Neural Image Caption Generation 參考論文: Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

Seq2Seq Attention Mechanism 參考論文：Effective Approaches to Attention-based Neural Machine Translation

　　　　　　　　　　　　　　　　　　　NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE

Transformer 參考論文：Attention Is All You Need

預訓練模型

ELMo 參考論文：Deep contextualized word representations

找出詞語放在句子中的意思。ELMo還是想用一個向量來表達詞語，不過這個詞語的向量會包含上下文的資訊。

ELMo的訓練：前向LSTM預測後文的資訊，後向LSTM預測前文的資訊。訓練一個順序閱讀者+一個逆序閱讀者，在下游任務的時候，分別讓順序閱讀者和逆序閱讀者，提供他們從不同角度看到的資訊。

GPT 參考論文：Improving Language Understanding by Generative Pre-Training

　　　　　　　Language Models are Unsupervised Multitask Learners

　　　　　　　Language Models are Few-Shot Learners

用非監督的人類語言資料，訓練一個預訓練模型，然後拿著這個模型進行finetune，基本上就可以讓你在其他任務上也表現出色。

BERT 參考論文：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

BERT 和 GPT 還有 ELMo 是一個性質的東西。它存在的意義是要變成一種預訓練模型，提供 NLP 中對句子的理解。ELMo 用了雙向 LSTM 作為句子資訊的提取器，同時還能表達詞語在句子中的不同含義；GPT 呢，它是一種單向的語言模型，同樣也可以用 attention 的方式提取到更加豐富的語言意思資訊。

概率論知識總結
2021-01-05
總結下分散式主要理論知識
2021-03-09
分散式
線性表的理論知識總結
2020-12-19
類和物件部分知識總結
2020-10-24
物件
AlexNet論文總結
2021-08-23
[MongoDB知識體系] 一文全面總結MongoDB知識體系
2021-03-11
MongoDB
[Redis知識體系] 一文全面總結Redis知識體系
2021-03-10
Redis
資料庫基礎知識整理與複習總結
2020-10-11
資料庫
LVM的知識總結和操作大全
2019-11-12
LVM
Java類和物件知識點總結
2020-11-15
Java物件
servlet知識總結
2018-11-19
Servlet
Cookie知識總結（-）
2019-02-15
Cookie
MySQL知識總結
2018-04-08
MySql
知識點總結
2018-05-28
知識方法總結
2024-05-19
Docker知識總結
2020-10-23
Docker
JQuery知識總結
2020-11-08
jQuery
Redis知識總結
2019-03-03
Redis
圖知識總結
2021-05-28
golang知識總結
2021-02-27
Golang
常量知識總結
2020-12-10
servelt知識總結
2020-11-28
Java模擬Ping主機和Telnet服務的知識點和程式碼整理總結
2019-05-11
Java
對話論文總結
2018-07-08
Objects as Points 論文總結
2020-11-20
Object
暑假讀論文總結
2024-07-09
Java 知識點總結
2019-03-19
Java
Vue知識總結(2)
2018-11-16
Vue
django知識點總結
2019-01-28
Django
iOS 知識點總結
2018-04-27
iOS
MongoDB知識點總結
2020-06-09
MongoDB
HDFS知識點總結
2020-06-08
HBase知識點總結
2021-11-23
jQuery 知識點總結
2021-09-09
jQuery
Kafka知識點總結
2021-11-16
Kafka
Tomcat 知識點總結
2020-12-10
Tomcat
MySQL知識點總結
2020-12-11
MySql
【論文學習】FastText總結
2020-10-10
AST

NLP知識總結和論文整理

詞向量

句向量

注意力

預訓練模型

相關文章