【NLP】BERT中文實戰踩坑

李入魔發表於2018-12-06

原文網址 : https://juejin.im/post/5c093c04f265da611d667584

終於用上了bert，踩了一些坑，和大家分享一下。

我主要參考了奇點機智的文章，用bert做了兩個中文任務：文字分類和相似度計算。這兩個任務都是直接用封裝好的run_classifer,py，另外兩個沒有仔細看，用到了再補充。

1. DataProcessor

Step1：寫好自己的processor，照著例子寫就可以，一定要shuffle！！！

Step2：加到main函式的processors字典裡

2. Early Stopping

Step1：建一個hook

early_stopping_hook = tf.contrib.estimator.stop_if_no_decrease_hook(
            estimator=estimator,
            metric_name='eval_loss',
            max_steps_without_decrease=FLAGS.max_steps_without_decrease,
            eval_dir=None,
            min_steps=0,
            run_every_secs=None,
            run_every_steps=FLAGS.save_checkpoints_steps)複製程式碼

Step2：加到estimator.train裡

estimator.train(input_fn=train_input_fn, max_steps=num_train_steps, hooks=[early_stopping_hook])複製程式碼

3. Train and Evaluate

需要用tensorboard檢視訓練曲線的話比較好

Step1：建立train和eval的spec，這裡需要把early stopping的hook加到trainSpec

train_spec = tf.estimator.TrainSpec(input_fn=train_input_fn, max_steps=num_train_steps,
                                                hooks=[early_stopping_hook])
eval_spec = tf.estimator.EvalSpec(input_fn=eval_input_fn, throttle_secs=0)
tf.estimator.train_and_evaluate(estimator, train_spec, eval_spec)複製程式碼

4. Batch size

預設Eval和Predict的batch size都很小，記得改一下

<-未完待續->

stylelint 接入實戰踩坑總結
2021-11-05
SpringMVC中文亂碼踩坑
2021-08-01
SpringMVC
如何載入本地下載下來的BERT模型，pytorch踩坑！！
2022-01-28
模型PyTorch
Taro踩坑實踐
2020-02-20
NLP新秀 : BERT的優雅解讀
2019-02-18
讓你在 API 設計中少踩坑的實戰分享
2018-04-12
API
「NLP-NER」如何使用BERT來做命名實體識別
2019-09-29
.Net Core踩坑記：讀取txt中文亂碼
2020-06-18
Weex線上踩坑實錄
2019-03-06
中文任務全面超越 BERT：百度正式釋出NLP預訓練模型ERNIE
2019-03-16
模型
應用實戰：從Redis到Aerospike，我們踩了這些坑
2018-07-18
RedisROS
NLP 的巨人肩膀（下）：從 CoVe 到 BERT
2018-12-17
Android開發踩坑及最佳實踐（工作踩坑記錄持續更新...）
2018-11-16
Android
前端閘道器踩坑實踐
2021-11-22
前端
谷歌開源 BERT：最先進的 NLP 預訓練技術，支援中文和更多語言
2018-11-07
谷歌
vue踩坑
2018-11-20
Vue
相容踩坑
2019-04-11
THEOS踩坑。。。
2018-06-28
Flutter 踩坑
2019-08-26
Flutter
angular踩坑
2020-04-04
Angular
protodep踩坑
2024-11-19
CDH踩坑
2020-11-27
小程式實戰踩坑之B2B商城專案總結
2018-12-27
Jmeter分散式壓測實戰及踩坑處理(含引數化)
2021-08-06
JMeter分散式
小程式踩坑填坑
2018-07-25
BERT時代與後時代的NLP（一）
2019-06-17
圖解BERT（NLP中的遷移學習）
2019-04-24
圖解遷移學習
BERT時代與後時代的NLP（二）
2019-06-27
NLP與深度學習（六）BERT模型的使用
2021-10-09
深度學習模型
中文語料的 Bert finetune
2019-02-23
Bert時代的創新：Bert在NLP各領域的應用進展
2019-06-10
Flutter 入門與實戰（五十二）：升級踩坑，聊聊 Dart 的 null safety
2021-08-15
FlutterDartNull
高效、優雅的物件copy之MapStruct入門到精通，實戰踩坑版
2023-02-14
物件Struct
用RUST寫流媒體伺服器實戰——rtmp chunk 踩坑記錄
2021-04-26
Rust伺服器
removeChild踩坑記
2019-02-16
REM
Fragment-踩坑
2019-03-04
Fragment
小程式踩坑
2019-04-11
MQTT使用踩坑
2019-01-24
MQQT

【NLP】BERT中文實戰踩坑

1. DataProcessor

2. Early Stopping

3. Train and Evaluate

4. Batch size

相關文章