Transformers 儲存並載入模型 | 八

Pans發表於2020-04-05

原文網址 : https://juejin.im/post/5e8938996fb9a03c5147f306

ORM模型

作者|huggingface 編譯|VK 來源|Github

本節說明如何儲存和重新載入微調模型(BERT，GPT，GPT-2和Transformer-XL)。你需要儲存三種檔案型別才能重新載入經過微調的模型：

模型本身應該是PyTorch序列化儲存的模型(pytorch.org/docs/stable…)
模型的配置檔案是儲存為JSON檔案
詞彙表(以及基於GPT和GPT-2合併的BPE的模型)。

這些檔案的預設檔名如下：

模型權重檔案：pytorch_model.bin
配置檔案：config.json
詞彙檔案：vocab.txt代表BERT和Transformer-XL，vocab.json代表GPT/GPT-2(BPE詞彙)，
代表GPT/GPT-2(BPE詞彙)額外的合併檔案：merges.txt。

如果使用這些預設檔名儲存模型，則可以使用from_pretrained()方法重新載入模型和tokenizer。

這是儲存模型，配置和配置檔案的推薦方法。詞彙到output_dir目錄，然後重新載入模型和tokenizer：

from transformers import WEIGHTS_NAME, CONFIG_NAME

output_dir = "./models/"

# 步驟1：儲存一個經過微調的模型、配置和詞彙表

#如果我們有一個分散式模型，只儲存封裝的模型
#它包裝在PyTorch DistributedDataParallel或DataParallel中
model_to_save = model.module if hasattr(model, 'module') else model
#如果使用預定義的名稱儲存，則可以使用`from_pretrained`載入
output_model_file = os.path.join(output_dir, WEIGHTS_NAME)
output_config_file = os.path.join(output_dir, CONFIG_NAME)

torch.save(model_to_save.state_dict(), output_model_file)
model_to_save.config.to_json_file(output_config_file)
tokenizer.save_vocabulary(output_dir)

# 步驟2: 重新載入儲存的模型

#Bert模型示例
model = BertForQuestionAnswering.from_pretrained(output_dir)
tokenizer = BertTokenizer.from_pretrained(output_dir, do_lower_case=args.do_lower_case)  # Add specific options if needed
#GPT模型示例
model = OpenAIGPTDoubleHeadsModel.from_pretrained(output_dir)
tokenizer = OpenAIGPTTokenizer.from_pretrained(output_dir)複製程式碼

如果要為每種型別的檔案使用特定路徑，則可以使用另一種方法儲存和重新載入模型：

output_model_file = "./models/my_own_model_file.bin"
output_config_file = "./models/my_own_config_file.bin"
output_vocab_file = "./models/my_own_vocab_file.bin"

# 步驟1：儲存一個經過微調的模型、配置和詞彙表

#如果我們有一個分散式模型，只儲存封裝的模型
#它包裝在PyTorch DistributedDataParallel或DataParallel中
model_to_save = model.module if hasattr(model, 'module') else model

torch.save(model_to_save.state_dict(), output_model_file)
model_to_save.config.to_json_file(output_config_file)
tokenizer.save_vocabulary(output_vocab_file)

# 步驟2: 重新載入儲存的模型

# 我們沒有使用預定義權重名稱、配置名稱進行儲存，無法使用`from_pretrained`進行載入。
# 下面是在這種情況下的操作方法：

#Bert模型示例
config = BertConfig.from_json_file(output_config_file)
model = BertForQuestionAnswering(config)
state_dict = torch.load(output_model_file)
model.load_state_dict(state_dict)
tokenizer = BertTokenizer(output_vocab_file, do_lower_case=args.do_lower_case)

#GPT模型示例
config = OpenAIGPTConfig.from_json_file(output_config_file)
model = OpenAIGPTDoubleHeadsModel(config)
state_dict = torch.load(output_model_file)
model.load_state_dict(state_dict)
tokenizer = OpenAIGPTTokenizer(output_vocab_file)複製程式碼

原文連結：huggingface.co/transformer…

歡迎關注磐創AI部落格站： panchuang.net/

OpenCV中文官方文件： woshicver.com/

歡迎關注磐創部落格資源彙總站： docs.panchuang.net/

spacy儲存和載入模型
2021-01-01
模型
儲存載入模型model.save()
2020-12-15
模型
Tensorflow SavedModel模型的儲存與載入
2018-10-12
模型
訓練模型的儲存與載入
2019-12-19
模型
tensorflow模型持久化儲存和載入
2018-04-23
模型持久化
tf.keras: 儲存與載入模型
2020-12-14
Keras模型
Pytorch | Tutorial-07 儲存和載入模型
2024-03-20
PyTorch模型
Tensorflow模型的儲存與恢復載入
2018-04-22
模型
[PyTorch 學習筆記] 7.1 模型儲存與載入
2020-09-15
PyTorch筆記模型
pytorch-模型儲存與載入自己訓練的模型詳解
2020-10-31
PyTorch模型
Pytorch模型檔案`*.pt`與`*.pth` 的儲存與載入
2024-07-19
PyTorch模型
在 Python 中儲存和載入機器學習模型
2021-09-26
Python機器學習模型
全面解析Pytorch框架下模型儲存，載入以及凍結
2021-07-01
PyTorch框架模型
機器學習之儲存與載入.pickle模型檔案
2020-11-08
機器學習模型
【小白學PyTorch】19 TF2模型的儲存與載入
2020-10-07
PyTorchTF2模型
PyTorch儲存模型斷點以及載入斷點繼續訓練
2023-04-27
PyTorch模型斷點
儲存並退出 crontab
2019-08-15
transformers(1) 、load模型
2024-04-16
ORM模型
2.影像的載入與儲存
2020-11-04
DAOS 分散式非同步物件儲存｜儲存模型
2021-04-01
分散式非同步物件模型
Java 載入、操作和儲存WPS文字文件
2021-07-26
Java
修改並儲存hosts檔案
2020-10-03
Python匯入Excel表格資料並以字典dict格式儲存
2023-01-18
PythonExcel
TensorFlow模型儲存和提取方法
2020-04-06
模型
掌握Hive資料儲存模型
2024-06-28
Hive模型
資料中心儲存 TCO 模型
2022-03-17
模型
使用Spark載入資料到SQL Server列儲存表
2021-03-03
SparkSQLServer
NOPI讀取Word模板並儲存
2018-08-04
C++之OpenCV入門到提高002：載入、修改、儲存影像
2024-10-29
C++OpenCV
skmultiflow使用自己的csv檔案訓練模型並儲存實驗結果
2020-10-05
模型
載入模型
2020-10-18
模型
Gartner：浪潮儲存進入分散式儲存前三
2021-10-25
分散式
Oracle 共享儲存掛載
2018-06-28
Oracle
Spark SQL使用簡介（3）--載入和儲存資料
2018-08-03
SparkSQL
opencv學習筆記（二）-- 載入、修改和儲存影像
2021-01-05
OpenCV筆記
學習筆記14：模型儲存
2024-06-04
筆記模型
js實現canvas儲存圖片為png格式並下載到本地
2018-05-22
JSCanvas
MySQL入門--儲存引擎
2019-06-28
MySql儲存引擎

Transformers 儲存並載入模型 | 八

相關文章