【論文系列】之 ---- BERT

泪水下的笑靥發表於2024-11-10

原文網址 : https://www.cnblogs.com/myleaf/p/18538382

BERT（Bidirectional Encoder Representation from Transformers）

機器閱讀理解領域
從名字很好理解，主要使用的方法是Transformer的方法。。進行機器翻譯等操作

省流：BERT用於文字識別，機器閱讀理解。。跟GPT類似

（1）詞嵌入Embedding

詞嵌入又有三個部分組成：

Token Embedding

Segment Embedding

Posiiton Embedding

文字出現的位置，進行編碼

（2）Transformer Encoder

使用了我們熟知的多頭注意力機制

（3）預訓練

BERT是一個多工模型，它的預訓練（Pre-training）任務是由兩個自監督任務組成，即MLM和NSP

MLM

MLM是指在訓練的時候隨即從輸入語料上mask掉一些單詞，然後透過的上下文預測該單詞，該任務非常像我們在中學時期經常做的完形填空。

在訓練模型時，一個句子會被多次喂到模型中用於引數學習，但是Google並沒有在每次都mask掉這些單詞，而是在確定要Mask掉的單詞之後，做以下處理。
80%的時候會直接替換為[Mask]，將句子 "my dog is cute" 轉換為句子 "my dog is [Mask]"。
10%的時候將其替換為其它任意單詞，將單詞 "cute" 替換成另一個隨機詞，例如 "apple"。將句子 "my dog is cute" 轉換為句子 "my dog is apple"。
10%的時候會保留原始Token，例如保持句子為 "my dog is cute" 不變。
-----摘自知乎

NSP（Next Sentence Prediction)

判斷句子B是否是句子A的下文。如果是的話輸出’IsNext‘，否則輸出’NotNext‘。

輸入 = [CLS] 我 喜歡 玩 [Mask] 聯盟 [SEP] 我 最 擅長 的 [Mask] 是 亞索 [SEP]

類別 = IsNext

輸入 = [CLS] 我 喜歡 玩 [Mask] 聯盟 [SEP] 今天 天氣 很 [Mask] [SEP]

類別 = NotNext

(4)微調

模型微調
原文網址
這裡按照自己的理解對該文做出總結

BERT 論文筆記
2019-01-18
筆記
【論文系列】之 ---- CLIP
2024-11-11
PointNet系列論文解讀
2019-06-03
文字分類論文系列---
2021-01-02
文字分類
三篇論文之bigtable
2019-03-12
一文徹底搞懂BERT
2020-05-31
論文查重之小白都懂
2024-03-17
乾貨系列——模板之圖論1
2018-11-08
圖論
【論文】軍事理論課程論文
2018-07-16
深度學習熱度下降，圖神經、BERT崛起，ICLR2020提交論文主題分析
2019-10-09
深度學習ICLR
BERT新轉變：面向視覺基礎進行預訓練| NeurIPS 2019論文解讀
2019-12-27
視覺
深度解析BERT：從理論到Pytorch實戰
2023-11-04
PyTorch
軟考論文之論軟體的可靠性設計
2024-10-16
論文
2024-11-30
【BERT】詳解BERT
2024-06-15
圖論系列之「讀取圖演算法」
2021-05-22
圖論演算法
軟體論文之論軟體質量保證及其應用
2024-10-18
小白經典CNN論文復現系列（一）：LeNet1989
2020-12-29
CNN
HTTP基礎系列之：一文搞懂URL
2021-10-14
HTTP
推薦系統論文之序列推薦：KERL
2021-05-17
圖論系列之「相鄰節點迭代器 ( adjIterato ) 」
2021-05-22
圖論
軟考論文之論企業整合架構設計及其應用
2024-10-18
架構
《率土之濱》首屆遊戲論文大賽圓滿收官，投稿論文超2700篇
2020-06-17
遊戲
『論文精讀』Vision Transformer(VIT)論文解讀
2024-04-25
ORM
[論文翻譯] 分散式訓練 Parameter sharding 之 ZeRO
2022-01-11
分散式
[原始碼解析] PyTorch 分散式(8) -------- DistributedDataParallel之論文篇
2021-11-21
原始碼PyTorch分散式Parallel
INTERSPEECH2020 語音情感分析論文之我見
2021-04-01
一文詳解BERT模型實現NER命名實體抽取-王文廣
2022-11-24
模型
【小白寫論文】技術性論文結構剖析
2020-08-23
論文專題
2024-04-08
論文筆記
2024-03-10
筆記
論文記錄
2024-03-05
如何讀論文
2024-05-02
論文學習
2020-06-01
畢設論文
2020-09-23
論文查重
2024-09-13
IEEE 論文投稿
2024-11-24
WBL論文解析
2021-01-27