使用 PyTorch 構建和訓練一個卷積神經網路進行影像分類任務

阿坦發表於2024-06-27

原文網址 : https://www.cnblogs.com/lizhiqiang0204/p/18271008

下面是一個稍微複雜一些的神經網路示例程式碼。這個例子實現了一個卷積神經網路（CNN），用於處理影像分類任務（例如MNIST手寫數字識別）。該網路包含卷積層、池化層、全連線層以及使用了ReLU啟用函式和批次歸一化層。

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# 定義卷積神經網路
class ConvNet(nn.Module):
    def __init__(self):
        super(ConvNet, self).__init__()
        # 第一卷積層：輸入通道數為1（灰度影像），輸出通道數為32，卷積核大小為3x3，步長為1，填充為1
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1)
        # 第一批次歸一化層：歸一化32個特徵圖
        self.bn1 = nn.BatchNorm2d(32)
        # 第二卷積層：輸入通道數為32，輸出通道數為64，卷積核大小為3x3，步長為1，填充為1
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1)
        # 第二批次歸一化層：歸一化64個特徵圖
        self.bn2 = nn.BatchNorm2d(64)
        # 最大池化層：池化視窗大小為2x2，步長為2
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
        # 全連線層：輸入大小為64*7*7，輸出大小為128
        self.fc1 = nn.Linear(64 * 7 * 7, 128)
        # 全連線層：輸入大小為128，輸出大小為10（對應10個分類）
        self.fc2 = nn.Linear(128, 10)
        # Dropout層：在訓練過程中隨機斷開50%的神經元連線，防止過擬合
        self.dropout = nn.Dropout(p=0.5)

    def forward(self, x):
        # 第一個卷積層，啟用函式為ReLU，然後進行最大池化
        x = self.pool(F.relu(self.bn1(self.conv1(x))))
        # 第二個卷積層，啟用函式為ReLU，然後進行最大池化
        x = self.pool(F.relu(self.bn2(self.conv2(x))))
        # 將特徵圖展平成一維向量
        x = x.view(-1, 64 * 7 * 7)
        # 第一個全連線層，啟用函式為ReLU
        x = F.relu(self.fc1(x))
        # Dropout層
        x = self.dropout(x)
        # 第二個全連線層，輸出未經過啟用函式
        x = self.fc2(x)
        return x

# 資料預處理和載入
# 使用Compose將多個變換組合在一起：ToTensor()將影像轉換為張量，Normalize()進行標準化
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307,), (0.3081,))
])

# 下載並載入訓練集
train_dataset = datasets.MNIST('./data', train=True, download=True, transform=transform)
# 下載並載入測試集
test_dataset = datasets.MNIST('./data', train=False, transform=transform)

# 使用DataLoader載入資料集
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=1000, shuffle=False)

# 初始化網路、損失函式和最佳化器
model = ConvNet()
criterion = nn.CrossEntropyLoss()  # 交叉熵損失函式
optimizer = optim.Adam(model.parameters(), lr=0.001)  # Adam最佳化器，學習率為0.001

# 訓練網路的函式
def train(model, device, train_loader, optimizer, criterion, epoch):
    model.train()  # 設定模型為訓練模式
    for batch_idx, (data, target) in enumerate(train_loader):
        data, target = data.to(device), target.to(device)  # 將資料和標籤移動到裝置上（GPU或CPU）
        optimizer.zero_grad()  # 清空梯度
        output = model(data)  # 前向傳播
        loss = criterion(output, target)  # 計算損失
        loss.backward()  # 反向傳播
        optimizer.step()  # 更新引數
        if batch_idx % 100 == 0:  # 每100個批次列印一次訓練資訊
            print(f'Train Epoch: {epoch} [{batch_idx * len(data)}/{len(train_loader.dataset)} '
                  f'({100. * batch_idx / len(train_loader):.0f}%)]\tLoss: {loss.item():.6f}')

# 測試網路的函式
def test(model, device, test_loader, criterion):
    model.eval()  # 設定模型為評估模式
    test_loss = 0
    correct = 0
    with torch.no_grad():  # 不計算梯度
        for data, target in test_loader:
            data, target = data.to(device), target.to(device)  # 將資料和標籤移動到裝置上
            output = model(data)  # 前向傳播
            test_loss += criterion(output, target).item()  # 累加批次損失
            pred = output.argmax(dim=1, keepdim=True)  # 獲取最大機率的索引
            correct += pred.eq(target.view_as(pred)).sum().item()  # 統計正確預測的數量

    test_loss /= len(test_loader.dataset)  # 計算平均損失
    print(f'\nTest set: Average loss: {test_loss:.4f}, Accuracy: {correct}/{len(test_loader.dataset)} '
          f'({100. * correct / len(test_loader.dataset):.0f}%)\n')

# 訓練和測試迴圈
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")  # 選擇裝置
model.to(device)  # 將模型移動到裝置上
for epoch in range(1, 11):  # 進行10個訓練週期
    train(model, device, train_loader, optimizer, criterion, epoch)  # 訓練模型
    test(model, device, test_loader, criterion)  # 測試模型

View Code

解釋

卷積神經網路（ConvNet）：定義了一個包含兩個卷積層、兩個批次歸一化層、兩個池化層、兩個全連線層和一個Dropout層的卷積神經網路。
資料預處理和載入：使用 transforms 對資料進行標準化，並載入 MNIST 資料集。
訓練和測試函式：定義了訓練和測試模型的函式，其中包含前向傳播、反向傳播和引數更新的過程。
訓練和測試迴圈：選擇裝置（GPU 或 CPU），將模型移動到裝置，進行10個訓練週期，每個週期結束後進行一次測試。

如何使用卷積神經網路進行影像處理？
2020-10-13
卷積神經網路
卷積神經網路進行影像識別
2020-11-11
卷積神經網路
圖卷積神經網路分類的pytorch實現
2023-02-20
卷積神經網路PyTorch
【python實現卷積神經網路】開始訓練
2020-04-18
Python卷積神經網路
使用Pytorch和卷積神經網路進行簡單的數字識別（MNIST）
2024-10-30
PyTorch卷積神經網路
使用pytorch快速搭建神經網路實現二分類任務（包含示例）
2020-08-03
PyTorch神經網路
PyTorch入門-殘差卷積神經網路
2023-04-18
PyTorch卷積神經網路
14 卷積神經網路（進階）
2020-11-01
卷積神經網路
卷積神經網路
2020-03-10
卷積神經網路
TF2.keras 實現基於卷積神經網路的影像分類模型
2020-03-11
TF2Keras卷積神經網路模型
訓練一個影像分類器demo in PyTorch【學習筆記】
2022-06-30
PyTorch筆記
FSNet：利用卷積核概要進行深度卷積神經網路的壓縮
2020-03-28
卷積神經網路
Pytorch中自定義神經網路卷積核權重
2020-05-02
PyTorch神經網路卷積
卷積神經網路概述
2018-10-24
卷積神經網路
解密卷積神經網路！
2018-11-06
解密卷積神經網路
5.2.1 卷積神經網路
2019-12-31
卷積神經網路
卷積神經網路CNN
2020-11-04
卷積神經網路CNN
卷積神經網路-AlexNet
2024-06-21
卷積神經網路
卷積神經網路-1
2018-04-19
卷積神經網路
卷積神經網路-2
2018-04-19
卷積神經網路
卷積神經網路-3
2018-04-20
卷積神經網路
用Keras框架構建一個簡單的卷積神經網路！
2018-09-03
Keras框架架構卷積神經網路
文字分類(下)-卷積神經網路(CNN)在文字分類上的應用
2018-07-25
文字分類卷積神經網路CNN
一文看懂卷積神經網路
2020-10-07
卷積神經網路
卷積神經網路四種卷積型別
2018-12-17
卷積神經網路型別
全卷積神經網路FCN
2018-07-19
卷積神經網路
深度剖析卷積神經網路
2018-05-23
卷積神經網路
Pytorch_第十篇_卷積神經網路（CNN）概述
2020-08-15
PyTorch卷積神經網路CNN
9 大主題卷積神經網路（CNN）的 PyTorch 實現
2020-11-27
卷積神經網路CNNPyTorch
送你9個快速使用Pytorch訓練解決神經網路的技巧（附程式碼）
2019-08-22
PyTorch神經網路
初識卷積神經網路第一講！
2019-02-25
卷積神經網路
卷積神經網路鼻祖LeNet網路分析
2018-12-14
卷積神經網路
CNN神經網路之卷積操作
2019-07-19
CNN神經網路卷積
卷積神經網路 part2
2020-08-08
卷積神經網路
卷積神經網路（CNN）詳解
2021-08-05
卷積神經網路CNN
何為神經網路卷積層？
2023-03-16
神經網路卷積
Tensorflow-卷積神經網路CNN
2021-01-31
卷積神經網路CNN
如何入門Pytorch之四：搭建神經網路訓練MNIST
2020-09-13
PyTorch神經網路

使用 PyTorch 構建和訓練一個卷積神經網路進行影像分類任務

解釋

相關文章