ResNet50的貓狗分類訓練及預測

Wchime發表於2023-04-12

原文網址 : https://www.cnblogs.com/moon3496694/p/17310038.html

相比於之前寫的ResNet18，下面的ResNet50寫得更加工程化一點，這還適用與其他分類，就是換一個分類訓練只需要修改圖片資料的路徑即可。

我的程式碼檔案結構

1. 資料處理

　　首先已經對資料做好了分類

　　資料夾結構是這樣

　　開始劃分資料集

　　split_data.py

import os
import random
import shutil


def move_file(target_path, save_train_path, save_val_pathm, scale=0.1):

    file_list = os.listdir(target_path)
    random.shuffle(file_list)

    number = int(len(file_list) * scale)
    train_list = file_list[number:]
    val_list = file_list[:number]

    for file in train_list:
        target_file_path = os.path.join(target_path, file)
        save_file_path = os.path.join(save_train_path, file)
        shutil.copyfile(target_file_path, save_file_path)
    for file in val_list:
        target_file_path = os.path.join(target_path, file)
        save_file_path = os.path.join(save_val_pathm, file)
        shutil.copyfile(target_file_path, save_file_path)


def split_classify_data(base_path, save_path, scale=0.1):
    folder_list = os.listdir(base_path)
    for folder in folder_list:
        target_path = os.path.join(base_path, folder)
        save_train_path = os.path.join(save_path, 'train', folder)
        save_val_path = os.path.join(save_path, 'val', folder)
        if not os.path.exists(save_train_path):
            os.makedirs(save_train_path)
        if not os.path.exists(save_val_path):
            os.makedirs(save_val_path)
        move_file(target_path, save_train_path, save_val_path, scale)
        print(folder, 'finish!')


if __name__ == '__main__':
    base_path = r'C:\Users\Administrator.DESKTOP-161KJQD\Desktop\save_dir'
    save_path = r'C:\Users\Administrator.DESKTOP-161KJQD\Desktop\dog_cat'
    # 驗證集比例
    scale = 0.1
    split_classify_data(base_path, save_path, scale)

　　執行完以上程式碼的到的資料夾結構

　　一個訓練集資料，一個驗證集資料

2.資料集的匯入

　　我這個檔案寫了一個資料集的匯入和一個學習率更新的函式。資料匯入是通用的

　　tools.py

import os
import time

import cv2
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torchvision
from torch.autograd.variable import Variable
from torch.utils.tensorboard import SummaryWriter
from torchvision import datasets, transforms
from torch.utils.data import Dataset, DataLoader
from torch.optim.lr_scheduler import ExponentialLR, LambdaLR
from torchvision.models import ResNet50_Weights
from tqdm import tqdm
from classify_cfg import *

mean = MEAN
std = STD


def get_dataset(base_dir='', input_size=160):
    dateset = dict()
    transform_train = transforms.Compose([
        # 解析度重置為input_size
        transforms.Resize(input_size),
        transforms.RandomRotation(15),
        # 對載入的影像作歸一化處理， 並裁剪為[input_sizexinput_sizex3]大小的影像(因為這圖片畫素不一致直接統一)
        transforms.CenterCrop(input_size),
        transforms.ToTensor(),
        transforms.Normalize(mean=mean, std=std)
    ])

    transform_val = transforms.Compose([
        transforms.Resize(input_size),
        transforms.RandomRotation(15),
        transforms.CenterCrop(input_size),
        transforms.ToTensor(),
        transforms.Normalize(mean=mean, std=std)
    ])
    base_dir_train = os.path.join(base_dir, 'train')
    train_dataset = datasets.ImageFolder(root=base_dir_train, transform=transform_train)
    # print("train_dataset=" + repr(train_dataset[1][0].size()))
    # print("train_dataset.class_to_idx=" + repr(train_dataset.class_to_idx))
    # print(train_dataset.classes)
    classes = train_dataset.classes
    # classes = train_dataset.class_to_idx
    classes_num = len(train_dataset.classes)

    base_dir_val = os.path.join(base_dir, 'val')
    val_dataset = datasets.ImageFolder(root=base_dir_val, transform=transform_val)

    dateset['train'] = train_dataset
    dateset['val'] = val_dataset

    return dateset, classes, classes_num


def update_lr(epoch, epochs):
    """
    假設開始的學習率lr是0.001，訓練次數epochs是100
    當epoch<33時是lr * 1
    當33<=epoch<=66 時是lr * 0.5
    當66<epoch時是lr * 0.1
    """
    if epoch == 0 or epochs // 3 > epoch:
        return 1
    elif (epochs // 3 * 2 >= epoch) and (epochs // 3 <= epoch):
        return 0.5
    else:
        return 0.1

3.訓練模型

　　資料集匯入好了以後，選擇模型，選擇最佳化器等等，然後開始訓練。

　　mytrain.py

import os
import time

import cv2
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
from torch.autograd.variable import Variable
from torch.utils.tensorboard import SummaryWriter
from torch.utils.data import Dataset, DataLoader
from torch.optim.lr_scheduler import ExponentialLR, LambdaLR
from torchvision.models import ResNet50_Weights
# from tqdm import tqdm
from classify_cfg import *
from tools import get_dataset, update_lr


def train(model, dateset, epochs, batch_size, device, optimizer, scheduler, criterion, save_path):
    train_loader = DataLoader(dateset.get('train'), batch_size=batch_size, shuffle=True)
    val_loader = DataLoader(dateset.get('val'), batch_size=batch_size, shuffle=True)

    # 儲存為tensorboard檔案
    write = SummaryWriter(save_path)
    # 訓練過程寫入txt
    f = open(os.path.join(save_path, 'log.txt'), 'w', encoding='utf-8')

    best_acc = 0
    for epoch in range(epochs):
        train_correct = 0.0
        model.train()
        sum_loss = 0.0
        accuracy = -1
        total_num = len(train_loader.dataset)
        # print(total_num, len(train_loader))
        # loop = tqdm(enumerate(train_loader), total=len(train_loader))
        batch_count = 0
        for batch_idx, (data, target) in enumerate(train_loader):
            start_time = time.time()
            data, target = Variable(data).to(device), Variable(target).to(device)
            output = model(data)
            loss = criterion(output, target)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            print_loss = loss.data.item()
            sum_loss += print_loss
            train_predict = torch.max(output.data, 1)[1]
            if torch.cuda.is_available():
                train_correct += (train_predict.cuda() == target.cuda()).sum()
            else:
                train_correct += (train_predict == target).sum()
            accuracy = (train_correct / total_num) * 100
            # loop.set_description(f'Epoch [{epoch+1}/{epochs}]')
            # loop.set_postfix(loss=loss.item(), acc='{:.3f}'.format(accuracy))
            batch_count += len(data)
            end_time = time.time()
            s = f'Epoch:[{epoch+1}/{epochs}] Batch:[{batch_count}/{total_num}] train_acc: {"{:.2f}".format(accuracy)} ' \
                f'train_loss: {"{:.3f}".format(loss.item())} time: {int((end_time-start_time)*1000)} ms'
            # print(f'Epoch:[{epoch+1}/{epochs}]', f'Batch:[{batch_count}/{total_num}]',
            #       'train_acc:', '{:.2f}'.format(accuracy), 'train_loss:', '{:.3f}'.format(loss.item()),
            #       'time:', f'{int((end_time-start_time)*1000)} ms')
            print(s)
            f.write(s+'\n')

        write.add_scalar('train_acc', accuracy, epoch)
        write.add_scalar('train_loss', loss.item(), epoch)
        # print(optimizer.param_groups[0]['lr'])
        scheduler.step()
        if best_acc < accuracy:
            best_acc = accuracy
            torch.save(model, os.path.join(save_path, 'best.pt'))

        if epoch+1 == epochs:
            torch.save(model, os.path.join(save_path, 'last.pt'))

        # 預測驗證集
        # if (epoch+1) % 5 == 0 or epoch+1 == epochs:
        model.eval()
        test_loss = 0.0
        correct = 0.0
        total_num = len(val_loader.dataset)
        # print(total_num, len(val_loader))
        with torch.no_grad():
            for data, target in val_loader:
                data, target = Variable(data).to(device), Variable(target).to(device)
                output = model(data)
                loss = criterion(output, target)
                _, pred = torch.max(output.data, 1)
                if torch.cuda.is_available():
                    correct += torch.sum(pred.cuda() == target.cuda())
                else:
                    correct += torch.sum(pred == target)
                print_loss = loss.data.item()
                test_loss += print_loss
            acc = correct / total_num * 100
            avg_loss = test_loss / len(val_loader)
        s = f"val acc: {'{:.2f}'.format(acc)} val loss: {'{:.3f}'.format(avg_loss)}"
        # print('val acc: ', '{:.2f}'.format(acc), 'val loss: ', '{:.3f}'.format(avg_loss))
        print(s)
        f.write(s+'\n')
        write.add_scalar('val_acc', acc, epoch)
        write.add_scalar('val_loss', avg_loss, epoch)
        # loop.set_postfix(val_loss='{:.3f}'.format(avg_loss), val_acc='{:.3f}'.format(acc))

    f.close()


if __name__ == '__main__':
    device = DEVICE
    epochs = EPOCHS
    batch_size = BATCH_SIZE
    input_size = INPUT_SIZE
    lr = LR
    # ---------------------------訓練-------------------------------------
    # 圖片的路徑
    base_dir = r'C:\Users\Administrator.DESKTOP-161KJQD\Desktop\dog_cat'
    # 儲存的路徑
    save_path = r'C:\Users\Administrator.DESKTOP-161KJQD\Desktop\dog_cat_save'
    dateset, classes, classes_num = get_dataset(base_dir, input_size=input_size)
    # model = torchvision.models.resnet50(pretrained=True)
    model = torchvision.models.resnet50(weights=ResNet50_Weights.IMAGENET1K_V1)
    num_ftrs = model.fc.in_features
    model.fc = nn.Linear(num_ftrs, classes_num)
    model.to(DEVICE)
    # # 損失函式,交叉熵損失函式
    criteon = nn.CrossEntropyLoss()
    # 選擇最佳化器
    optimizer = optim.SGD(model.parameters(), lr=lr)
    # 學習率更新
    # scheduler = ExponentialLR(optimizer, gamma=0.9)
    scheduler = LambdaLR(optimizer, lr_lambda=lambda epoch: update_lr(epoch, epochs))
    # 開始訓練
    train(model, dateset, epochs, batch_size, device, optimizer, scheduler, criteon, save_path)
    # 將label儲存起來
    with open(os.path.join(save_path, 'labels.txt'), 'w', encoding='utf-8') as f:
        f.write(f'{classes_num} {classes}')

　　訓練結束以後，在儲存路徑下會得到下面的檔案

　　最好的模型，最後一次的模型，標籤的列表，訓練的記錄和tensorboard記錄

　　在該路徑下執行 tensorboard --logdir=.

　　然後在瀏覽器開啟給出的地址，即可看到資料訓練過程的繪圖

4.對圖片進行預測

　　考慮對於使用者來說，使用者是在網頁或者手機上上傳一張圖片進行預測，所以這邊是採用二進位制資料。

　　mypredict.py

import cv2
import numpy as np
import torch

from classify_cfg import *



def img_process(img_betys, img_size, device):

    img_arry = np.asarray(bytearray(img_betys), dtype='uint8')
    # im0 = cv2.imread(img_betys)
    im0 = cv2.imdecode(img_arry, cv2.IMREAD_COLOR)
    image = cv2.resize(im0, (img_size, img_size))
    image = np.float32(image) / 255.0
    image[:, :, ] -= np.float32(mean)
    image[:, :, ] /= np.float32(std)
    image = image.transpose((2, 0, 1))
    im = torch.from_numpy(image).unsqueeze(0)
    im = im.to(device)
    return im


def predict(model_path, img, device):
    model = torch.load(model_path)
    model.to(device)
    model.eval()
    predicts = model(img)
    # print(predicts)
    _, preds = torch.max(predicts, 1)
    pred = torch.squeeze(preds)
    # print(pred)
    return pred


if __name__ == '__main__':
    mean = MEAN
    std = STD
    device = DEVICE
    classes = ['狗', '貓']
    # # 預測
    model_path = r'C:\Users\Administrator.DESKTOP-161KJQD\Desktop\dog_cat_save\best.pt'
    img_path = r'C:\Users\Administrator.DESKTOP-161KJQD\Desktop\save_dir\狗\000000.jpg'
    with open(img_path, 'rb') as f:
        img_betys = f.read()
    img =img_process(img_betys, 160, device)
    # print(img.shape)
    # print(img)
    pred = predict(model_path, img, device)
    print(classes[int(pred)])

還有我的配置檔案classify_cfg.py

import torch

BATCH_SIZE = 2  # 每批處理的資料
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')  # 放在cuda或者cpu上訓練
EPOCHS = 30  # 訓練資料集的輪次
LR = 1e-3       # 學習率
INPUT_SIZE = 160    # 輸入圖片大小
MEAN = [0.485, 0.456, 0.406]    # 均值
STD = [0.229, 0.224, 0.225]     # 方差

貓狗識別訓練
2020-12-01
實驗12-使用keras預訓練模型完成貓狗識別
2024-04-27
Keras模型
使用jupyter實現貓和狗的分類
2018-12-12
5.AlexNet貓狗分類（Lightning框架）
2024-06-27
框架
基於Pytorch實現貓狗分類
2021-06-08
PyTorch
深度學習（二）之貓狗分類
2022-03-20
深度學習
人工智慧的預訓練基礎模型的分類
2023-04-21
人工智慧模型
使用Bert預訓練模型文字分類（內附原始碼）
2019-03-13
模型文字分類原始碼
看照片挑民宿：Airbnb如何重新訓練ResNet50，實現房間圖片分類最佳化
2018-06-07
AI
訓練PaddleOCR文字方向分類模型
2024-08-27
模型
知物由學 | 更適合文字分類的輕量級預訓練模型
2021-01-26
文字分類模型
使用Pytorch訓練分類器詳解（附python演練）
2018-12-27
PyTorchPython
基於飛槳PaddlePaddle的多種影像分類預訓練模型強勢釋出
2019-07-08
模型
劃分訓練集與測試集
2021-07-20
機器學習是如何區分貓和狗的？
2019-03-14
機器學習
NLP領域預訓練模型的現狀及分析
2019-11-05
模型
【Svm機器學習篇】Opencv3.4.1與C++實現對分類問題的訓練與預測】
2018-08-19
機器學習OpenCVC++
YOLOv5模型訓練及檢測
2022-02-14
YOLO模型
MNIST3_tf2.keras訓練預測
2020-09-30
TF2Keras
狗不吃貓糧
2018-03-27
自訓練 + 預訓練 = 更好的自然語言理解模型
2020-11-13
模型
飛槳帶你瞭解：基於百科類資料訓練的 ELMo 中文預訓練模型
2019-06-06
模型
【預訓練語言模型】使用Transformers庫進行BERT預訓練
2024-03-13
模型ORM
PaddlePaddle分散式訓練及CTR預估模型應用
2019-05-21
分散式模型
輕鬆學Pytorch-使用ResNet50實現影像分類
2020-07-20
PyTorch
NeurIPS Spotlight｜從分類到生成：無訓練的可控擴散生成
2024-12-05
oracle分割槽表的分類及測試
2019-01-22
Oracle
PyTorch預訓練Bert模型
2020-11-17
PyTorch模型
樸素貝葉斯分類和預測演算法的原理及實現
2018-03-28
演算法
【預訓練語言模型】使用Transformers庫進行GPT2預訓練
2024-03-13
模型ORMGPT
Mxnet速查_CPU和GPU的mnist預測訓練_模型匯出_模型匯入再預測_匯出onnx並預測
2022-04-02
GPU模型
Keras速查_CPU和GPU的mnist預測訓練_模型匯出_模型匯入再預測_匯出onnx並預測
2022-03-20
KerasGPU模型
零樣本文字分類應用：基於UTC的醫療意圖多分類，打通資料標註-模型訓練-模型調優-預測部署全流程。
2023-04-21
文字分類模型
貓狗大戰--使用 “VGG16進行CIFAR10分類” 遷移學習實現
2020-11-14
遷移學習
0802-程式設計實戰_貓和狗二分類_深度學習專案架構
2021-05-06
程式設計深度學習架構
使用自己的資料集訓練MobileNet、ResNet實現影象分類（TensorFlow）
2019-03-09
人工智慧大模型的訓練階段和使用方式來分類
2024-04-15
人工智慧大模型
訓練一個影像分類器demo in PyTorch【學習筆記】
2022-06-30
PyTorch筆記

ResNet50的貓狗分類訓練及預測

相關文章