Pytorch模型檔案`.pt`與`.pth` 的儲存與載入

华小电發表於2024-07-19

原文網址 : https://www.cnblogs.com/conpi/p/18310901

1.`*.pt`檔案

.pt檔案儲存的是模型的全部，在載入時可以直接賦值給新變數model = torch.load("filename.pt")。

具體操作:

（1）. 模型的儲存

torch.save(model,"Path/filename.pt")

（2）. 模型的載入

model = torch.load("filename.pt")

注意：torch.load()的引數使用字串引數。

2. `.pth`檔案

.pth儲存的是模型引數，透過字元字典進行儲存，在載入該類檔案時應該先例項化一個具體的模型，然後對新建立的空模型，進行引數賦予。

具體操作:

（1）. 模型的儲存

torch.save(model.state_dict(), PATH)

（2）. 模型的載入

model = nn.Module() # 這裡要先例項化模型
model.load_state_dict(torch.load("filename.pth"))

操作例項

首先定義一個模型作為例子

# Define model
class TheModelClass(nn.Module):
    # 類的初始化
    def __init__(self):
        # 繼承父類 nn.Module 的屬性和方法
        super(TheModelClass, self).__init__()
        # Inputs_channel, Outputs_channel, kernel_size
        self.conv1 = nn.Conv2d(3, 6, 5)
        # 最大池化層，池化核的大小
        self.pool = nn.MaxPool2d(2, 2)
        # 卷積層，池化層，卷積層
        self.conv2 = nn.Conv2d(6, 16, 5)
        # 最後接一個線性全連線層
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        # 卷積作用後，使用relu進行非線性化，最後使用池化操作進行特徵個數，引數量的降低
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# Initialize model
model = TheModelClass()

# Initialize optimizer
optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

# Print model's state_dict
print("Model's state_dict:")
for param_tensor in model.state_dict():
    print(param_tensor, "\t", model.state_dict()[param_tensor].size())

# Print optimizer's state_dict
print("Optimizer's state_dict:")
for var_name in optimizer.state_dict():
    print(var_name, "\t", optimizer.state_dict()[var_name])

2. 現在開始進行模型的儲存與載入

PATH = "/home/深度學習/model"
#  第一種模型儲存和載入方式
torch.save(model.state_dict(), PATH+"/TheModuleClass.pth")
model = TheModelClass()
model.load_state_dict(torch.load("/home/深度學習/model/TheModuleClass.pth"))

for param_tensor in model.state_dict():
    print(f"{param_tensor}<<<{model.state_dict()[param_tensor].size()}")
print(model)

# 輸出結果
'''
conv1.weight<<<torch.Size([6, 3, 5, 5])
conv1.bias<<<torch.Size([6])
conv2.weight<<<torch.Size([16, 6, 5, 5])
conv2.bias<<<torch.Size([16])
fc1.weight<<<torch.Size([120, 400])
fc1.bias<<<torch.Size([120])
fc2.weight<<<torch.Size([84, 120])
fc2.bias<<<torch.Size([84])
fc3.weight<<<torch.Size([10, 84])
fc3.bias<<<torch.Size([10])
TheModelClass(
  (conv1): Conv2d(3, 6, kernel_size=(5, 5), stride=(1, 1))
  (pool): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)
'''
#  第二種模型儲存和載入方式

torch.save(model, PATH + "/the_module_class.pt")
model = torch.load(PATH + "/the_module_class.pt")

for param_tensor in model.state_dict():
    print(f"{param_tensor} <<< {model.state_dict()[param_tensor].size()}")
print(model)

#  輸出結果
'''
conv1.weight<<<torch.Size([6, 3, 5, 5])
conv1.bias<<<torch.Size([6])
conv2.weight<<<torch.Size([16, 6, 5, 5])
conv2.bias<<<torch.Size([16])
fc1.weight<<<torch.Size([120, 400])
fc1.bias<<<torch.Size([120])
fc2.weight<<<torch.Size([84, 120])
fc2.bias<<<torch.Size([84])
fc3.weight<<<torch.Size([10, 84])
fc3.bias<<<torch.Size([10])
TheModelClass(
  (conv1): Conv2d(3, 6, kernel_size=(5, 5), stride=(1, 1))
  (pool): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)
'''

總結

這裡推薦使用第二種方法，因為儲存和載入檔案簡單，而且生成的二進位制檔案區分程度高。
torch.save() 儲存模型的引數，為以後模型推理核模型恢復提供了更加方便更加靈活的方法。
一定要在模型評估時，關閉批次規範化和丟棄法, 僅僅在模型訓練時有用，模型推理時一定要關閉(所謂模型推理，指是使用模型進行的實際應用)
載入.pth 要先例項化，再進行引數的承接。

[PyTorch 學習筆記] 7.1 模型儲存與載入
2020-09-15
PyTorch筆記模型
pytorch-模型儲存與載入自己訓練的模型詳解
2020-10-31
PyTorch模型
【小白學PyTorch】19 TF2模型的儲存與載入
2020-10-07
PyTorchTF2模型
機器學習之儲存與載入.pickle模型檔案
2020-11-08
機器學習模型
Pytorch | Pytorch格式 .pt .pth .bin .onnx 詳解
2024-09-02
PyTorch
Tensorflow SavedModel模型的儲存與載入
2018-10-12
模型
訓練模型的儲存與載入
2019-12-19
模型
Tensorflow模型的儲存與恢復載入
2018-04-22
模型
tf.keras: 儲存與載入模型
2020-12-14
Keras模型
Pytorch | Tutorial-07 儲存和載入模型
2024-03-20
PyTorch模型
全面解析Pytorch框架下模型儲存，載入以及凍結
2021-07-01
PyTorch框架模型
2.影像的載入與儲存
2020-11-04
PyTorch儲存模型斷點以及載入斷點繼續訓練
2023-04-27
PyTorch模型斷點
spacy儲存和載入模型
2021-01-01
模型
pytorch模型(.pt)轉onnx模型(.onnx)的方法
2024-07-05
PyTorch模型
Transformers 儲存並載入模型 | 八
2020-04-05
ORM模型
儲存載入模型model.save()
2020-12-15
模型
Pytorch資料載入與使用
2024-06-17
PyTorch
tensorflow模型持久化儲存和載入
2018-04-23
模型持久化
OBJ模型檔案的結構、匯入與渲染
2018-04-20
OBJ模型
Python中檔案讀取與儲存程式碼示例
2024-04-15
Python
塊儲存檔案儲存物件儲存
2020-05-28
物件
檔案儲存
2019-05-23
資料儲存--檔案儲存
2024-05-26
Drools與動態載入規則檔案
2024-11-23
Android 檔案儲存
2019-05-13
Android
CSV檔案儲存
2024-06-09
儲存json檔案
2024-07-13
JSON
Android中的資料儲存之檔案儲存
2020-03-11
Android
IPFS的檔案儲存模式
2020-10-20
模式
【小白學PyTorch】17 TFrec檔案的建立與讀取
2020-10-03
PyTorch
Flutter持久化儲存之檔案儲存
2019-03-06
Flutter持久化
Windows系統電腦不能載入本地儲存的配置檔案的解決方法
2021-04-12
Windows
大模型儲存實踐：效能、成本與多雲
2024-04-07
大模型
檔案的上傳與下載
2018-04-09
XSKY 檔案儲存首次進入 IDC 榜單
2022-10-28
在 Python 中儲存和載入機器學習模型
2021-09-26
Python機器學習模型
python 儲存檔案json
2020-11-10
PythonJSON

Pytorch模型檔案`*.pt`與`*.pth` 的儲存與載入

1.*.pt檔案

2. .pth檔案

操作例項

總結

相關文章

Pytorch模型檔案`.pt`與`.pth` 的儲存與載入

1.`*.pt`檔案

2. `.pth`檔案