NLP新秀 : BERT的優雅解讀

騰訊技術工程發表於2019-02-18

原文網址 : http://www.jiqizhixin.com/articles/2019-02-18-12

作為2018年自然語言處理領域的新秀，BERT做到了過去幾年NLP重大進展的集大成，一出場就技驚四座碾壓競爭對手，重新整理了11項NLP測試的最高紀錄，甚至超越了人類的表現，相信會是未來NLP研究和工業應用最主流的語言模型之一。本文嘗試由淺入深，為各位看客帶來優雅的BERT解讀。

NLP背景：BERT的應用舞臺

NLP：Natural Language Process，自然語言處理，是電腦科學、資訊工程以及人工智慧的子領域，專注於人機互動，特別是大規模自然語言資料的處理和分析。

除了OCR、語音識別，自然語言處理有四大類常見的任務。第一類任務：序列標註，譬如命名實體識別、語義標註、詞性標註、分詞等；第二類任務：分類任務，譬如文字分類、情感分析等；第三類任務：句對關係判斷，譬如自然語言推理、問答QA、文字語義相似性等；第四類任務：生成式任務，譬如機器翻譯、文字摘要、寫詩造句等。

GLUE benchmark：General Language Understanding Evaluation benchmark，通用語言理解評估基準，用於測試模型在廣泛自然語言理解任務中的魯棒性。

BERT重新整理了GLUE benchmark的11項測試任務最高記錄，這11項測試任務可以簡單分為3類。序列標註類：命名實體識別CoNNL 2003 NER；單句分類類：單句情感分類SST-2、單句語法正確性分析CoLA；句對關係判斷類：句對entailment關係識別MNLI和RTE、自然語言推理WNLI、問答對是否包含正確答案QNLI、句對文字語義相似STS-B、句對語義相等分析QQP和MRPC、問答任務SQuAD v1.1。雖然論文中沒有提及生成式任務，BERT核心的特徵提取器源於谷歌針對機器翻譯問題所提出的新網路框架Transformer，本身就適用於生成式任務。

圖解BERT（NLP中的遷移學習）
2019-04-24
圖解遷移學習
NLP 的巨人肩膀（下）：從 CoVe 到 BERT
2018-12-17
【NLP】BERT中文實戰踩坑
2018-12-06
Bert時代的創新：Bert在NLP各領域的應用進展
2019-06-10
BERT時代與後時代的NLP（一）
2019-06-17
BERT時代與後時代的NLP（二）
2019-06-27
NLP與深度學習（六）BERT模型的使用
2021-10-09
深度學習模型
C#如何優雅的多表讀取
2021-04-29
C#
NLP 新紀元？如何看待轟炸閱讀理解頂級測試的BERT模型？
2019-01-09
模型
【BERT】詳解BERT
2024-06-15
Java 如何優雅的使用註解
2019-04-08
Java
精讀《2021 前端新秀回顧》
2022-01-17
前端
讀 "優雅關閉的 Go Web 伺服器"
2019-08-31
GoWeb伺服器
Roberta: Bert調優
2020-09-30
理解BERT：一個突破性NLP框架的綜合指南
2019-11-05
框架
【Python標準庫:fileinput】優雅的讀取檔案
2018-08-31
Python
SOFAJRaft原始碼閱讀-ShutdownHook如何優雅的停機
2023-01-25
Raft原始碼Hook
詳解Kubernetes Pod優雅退出
2024-06-20
NLP與深度學習（五）BERT預訓練模型
2021-09-30
深度學習模型
完全解析！Bert & Transformer 閱讀理解原始碼詳解
2021-07-19
ORM原始碼
優雅的PromiseKit
2018-12-16
Promise
物件拷貝 - 優雅的解決方案 Mapstruct
2019-05-29
物件Struct
如何優雅的對UITableView進行解耦
2018-03-19
UIView解耦
解鎖一輛車的非“優雅”方式
2021-12-27
如何優雅的搞垮伺服器，再優雅的救活
2020-10-15
伺服器
最強NLP預訓練模型！谷歌BERT橫掃11項NLP任務記錄
2018-10-12
模型谷歌
讀 "優雅關閉的 Go Web 伺服器"
2019-08-31
GoWeb伺服器
如何優雅地讀寫HttpServletRequest和HttpServletResponse的請求體
2021-12-31
HTTPServlet
如何用最強模型BERT做NLP遷移學習？
2019-02-03
模型遷移學習
效能媲美BERT，引數量僅為1/300，谷歌最新的NLP模型
2020-09-22
谷歌模型
SpringBoot 專案優雅實現讀寫分離
2023-11-22
Spring Boot
一種更優雅的Flutter Dialog解決方案
2020-12-05
Flutter
超詳細的 Bert 文字分類原始碼解讀 | 附原始碼
2021-06-03
文字分類原始碼
優雅的使用UITableView
2020-05-08
UIView
優雅的程式碼
2021-07-01
【Go】優雅的讀取 http 請求或響應的資料
2019-01-26
GoHTTP
【Go】優雅的讀取http請求或響應的資料
2019-01-26
GoHTTP
「NLP-NER」如何使用BERT來做命名實體識別
2019-09-29

NLP新秀 : BERT的優雅解讀

相關文章