學習筆記17：DenseNet實現多分類（卷積基特徵提取）

有何m不可發表於2024-06-04

原文網址 : https://www.cnblogs.com/gongzb/p/18230180

筆記SENet卷積特徵

轉自：https://www.cnblogs.com/miraclepbc/p/14378379.html

資料集描述

總共

資料預處理

首先分析一下我們在資料預處理階段的目標和工作流程

獲取每張影像以及對應的標籤
劃分測試集和訓練集
透過寫資料集類的方式，獲取資料集並進一步獲得DataLoader
列印圖片，驗證效果

獲取影像及標籤

all_imgs_path = glob.glob(r'E:\birds\birds\*\*.jpg') # 獲取所有影像路徑列表
all_labels_name = [i.split('\\')[3].split('.')[1] for i in all_imgs_path] # 獲取每張影像的標籤名
label_to_index = dict([(v, k) for k, v in enumerate(unique_labels)]) # 將標籤名對映到數值
# 獲取每張圖片的數值標籤
all_labels = []
for img in all_imgs_path:
    for k, v in label_to_index.items():
        if k in img:
            all_labels.append(v)

劃分測試集和訓練集

以下程式碼可以作為模板來用，不做額外解釋

np.random.seed(2021)
index = np.random.permutation(len(all_imgs_path))
all_imgs_path = np.array(all_imgs_path)[index]
all_labels = np.array(all_labels)[index]
s = int(len(all_imgs_path) * 0.8)

train_path = all_imgs_path[:s]
train_labels = all_labels[:s]
test_path = all_imgs_path[s:]
test_labels = all_labels[s:]

透過寫資料集類的方式，獲取資料集並進一步獲得DataLoader

以下程式碼可以作為模板來用，不做額外解釋

transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor()
])

class BirdsDataset(data.Dataset):
    def __init__(self, img_paths, labels, transform):
        self.imgs = img_paths
        self.labels = labels
        self.transforms = transform
    def __getitem__(self, index):
        img = self.imgs[index]
        label = self.labels[index]
        pil_img = Image.open(img)
        pil_img = pil_img.convert('RGB') # 這一句是專門用來解決一種RuntimeError的
        np_img = np.array(pil_img, dtype = np.uint8)
        if np_img.shape == 2:
            img_data = np.repeat(np_img[:, :, np.newaxis], 3, axis = 2)
            pil_data = Image.fromarray(img_data)
        data = self.transforms(pil_img)
        return data, label
    def __len__(self):
        return len(self.imgs)

train_ds = BirdsDataset(train_path, train_labels, transform)
test_ds = BirdsDataset(test_path, test_labels, transform)
train_dl = data.DataLoader(train_ds, batch_size = 32) # 這裡只是提取卷積基，不做訓練，因此不用shuffle
test_dl = data.DataLoader(test_ds, batch_size = 32)

結果檢視

取出一個批次的資料，繪圖

img_batch, label_batch = next(iter(train_dl))
plt.figure(figsize = (12, 8)) # 定義畫布大小
index_to_label = dict([(k, v) for k, v in enumerate(unique_labels)])
for i, (img, label) in enumerate(zip(img_batch[:3], label_batch[:3])):
    img = img.permute(1, 2, 0).numpy() # 將channel放在最後一維
    plt.subplot(1, 3, i + 1)
    plt.title(index_to_label.get(label.item()))
    plt.imshow(img)

結果如下：

學習筆記17：DenseNet實現多分類（卷積基特徵提取）

提取卷積基

這一階段的工作流程如下：

獲取DenseNet預訓練模型，使用feature部分
使用卷積基提取影像特徵，並存放在列表中

預訓練模型獲取

my_densenet = models.densenet121(pretrained = True).features

if torch.cuda.is_available():
    my_densenet = my_densenet.cuda()

for p in my_densenet.parameters():
    p.requires_grad = False

提取影像特徵

train_features = []
train_features_labels = []
for im, la in train_dl:
    out = my_densenet(im.cuda())
    out = out.view(out.size(0), -1) # 這裡需要進行扁平化操作，因為後面要進行線性模型預測
    train_features.extend(out.cpu().data) # 這裡注意是extend，extend可以將一個列表加到另一個列表的後面
    train_features_labels.extend(la)

test_features = []
test_features_labels = []
for im, la in test_dl:
    out = my_densenet(im.cuda())
    out = out.view(out.size(0), -1)
    test_features.extend(out.cpu().data)
    test_features_labels.extend(la)

重新定義資料集

因為後面要透過線性模型來預測，因此之前的影像資料集就不好用了

因此需要用剛剛提取到的特徵，重新制作資料集

class FeatureDataset(data.Dataset):
    def __init__(self, feature_list, label_list):
        self.feature_list = feature_list
        self.label_list = label_list
    def __getitem__(self, index):
        return self.feature_list[index], self.label_list[index]
    def __len__(self):
        return len(self.feature_list)

train_feature_ds = FeatureDataset(train_features, train_features_labels)
test_feature_ds = FeatureDataset(test_features, test_features_labels)
train_feature_dl = data.DataLoader(train_feature_ds, batch_size = 32, shuffle = True)
test_feature_dl = data.DataLoader(test_feature_ds, batch_size = 32)

模型定義與預測

這裡定義一個線性模型即可

模型定義

class FCModel(nn.Module):
    def __init__(self, in_size, out_size):
        super().__init__()
        self.linear = nn.Linear(in_size, out_size)
    def forward(self, input):
        return self.linear(input)

in_feature_size = train_features[0].shape[0]
net = FCModel(in_feature_size, 200)

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
net.to(device)

loss_func = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(net.parameters(), lr = 0.00001)
epochs = 30

模型訓練

def fit(epoch, model, trainloader, testloader):
    correct = 0
    total = 0
    running_loss = 0
    
    model.train()
    for x, y in trainloader:
        y = torch.tensor(y, dtype = torch.long)
        x, y = x.to(device), y.to(device)
        y_pred = model(x)
        loss = loss_func(y_pred, y)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        with torch.no_grad():
            y_pred = torch.argmax(y_pred, dim = 1)
            correct += (y_pred == y).sum().item()
            total += y.size(0)
            running_loss += loss.item()
    
    epoch_acc = correct / total
    epoch_loss = running_loss / len(trainloader.dataset)
    
    test_correct = 0
    test_total = 0
    test_running_loss = 0
    
    model.eval()
    with torch.no_grad():
        for x, y in testloader:
            y = torch.tensor(y, dtype = torch.long)
            x, y = x.to(device), y.to(device)
            y_pred = model(x)
            loss = loss_func(y_pred, y)
            y_pred = torch.argmax(y_pred, dim = 1)
            test_correct += (y_pred == y).sum().item()
            test_total += y.size(0)
            test_running_loss += loss.item()
    epoch_test_acc = test_correct / test_total
    epoch_test_loss = test_running_loss / len(testloader.dataset)
    
    print('epoch: ', epoch, 
          'loss: ', round(epoch_loss, 3),
          'accuracy: ', round(epoch_acc, 3),
          'test_loss: ', round(epoch_test_loss, 3),
          'test_accuracy: ', round(epoch_test_acc, 3))
    
    return epoch_loss, epoch_acc, epoch_test_loss, epoch_test_acc

train_loss = []
train_acc = []
test_loss = []
test_acc = []
for epoch in range(epochs):
    epoch_loss, epoch_acc, epoch_test_loss, epoch_test_acc = fit(epoch, net, train_feature_dl, test_feature_dl)
    train_loss.append(epoch_loss)
    train_acc.append(epoch_acc)
    test_loss.append(epoch_test_loss)
    test_acc.append(epoch_test_acc)

訓練結果

學習筆記17：DenseNet實現多分類（卷積基特徵提取）

tensorflow學習筆記——DenseNet
2020-12-12
筆記SENet
[PyTorch 學習筆記] 3.2 卷積層
2020-08-30
PyTorch筆記卷積
深度學習筆記------卷積神經網路
2020-02-09
深度學習筆記卷積神經網路
卷積神經網路學習筆記——SENet
2021-01-23
卷積神經網路筆記SENet
深度學習卷積神經網路筆記
2020-12-19
深度學習卷積神經網路筆記
Java基礎-學習筆記17
2024-09-09
Java筆記
《卷積神經網路的Python實現》筆記
2020-12-29
卷積神經網路Python筆記
CondenseNet：可學習分組卷積，原作對DenseNet的輕量化改造 | CVPR 2018
2020-07-17
SENet卷積
Ng深度學習筆記——卷積神經網路基礎
2020-11-08
深度學習筆記卷積神經網路
機器學習-特徵提取
2019-09-07
機器學習特徵
深度學習基礎-基於Numpy的卷積神經網路（CNN）實現
2022-06-09
深度學習卷積神經網路CNN
40行Python程式碼，實現卷積特徵視覺化
2019-03-17
Python卷積特徵視覺化
深度學習入門筆記（十八）：卷積神經網路（一）
2020-02-14
深度學習筆記卷積神經網路
Kubernetes學習筆記（五）：卷
2020-05-24
筆記
HexMap學習筆記(九)——地形特徵
2019-06-06
筆記特徵
筆記-JavaWeb學習之旅17
2019-06-16
筆記JavaWeb
學習筆記：微積分
2021-11-15
筆記
圖卷積實戰——文字分類
2019-05-22
卷積文字分類
機器學習筆記——特徵標準化
2018-10-24
機器學習筆記特徵
Redis基礎知識（學習筆記17--持久化 (3)）
2024-07-13
Redis筆記持久化
2020-11-17 redis學習筆記
2020-11-17
Redis筆記
卷積神經網路學習筆記——Siamese networks（孿生神經網路）
2021-01-14
卷積神經網路筆記
圖卷積神經網路分類的pytorch實現
2023-02-20
卷積神經網路PyTorch
（四）卷積神經網路 -- 12 稠密連線網路（DenseNet）
2020-10-25
卷積神經網路SENet
如何實現高速卷積？深度學習庫使用了這些「黑魔法」
2019-09-15
卷積深度學習
《Java核心技術卷I》學習筆記10：使用預定義類
2020-11-15
Java筆記
SVM實現多分類的三種方案
2018-08-01
python實現多分類評價指標
2020-09-20
Python指標
【機器學習基礎】卷積神經網路（CNN）基礎
2021-11-25
機器學習卷積神經網路CNN
神經網路 | 基於MATLAB 深度學習工具實現簡單的數字分類問題（卷積神經網路）
2019-03-07
神經網路Matlab深度學習卷積
多分類學習及糾錯輸出碼
2024-07-27
深度學習之新聞多分類問題
2021-04-15
深度學習
TS學習筆記（三）：類
2019-04-20
筆記
Docker學習筆記：映象、容器、資料卷
2020-05-15
Docker筆記
TF2.keras 實現基於卷積神經網路的影象分類模型
2020-03-11
TF2Keras卷積神經網路模型
TF2.keras 實現基於卷積神經網路的影像分類模型
2020-03-11
TF2Keras卷積神經網路模型
影像篡改被動檢測技術一覽：基於特徵提取和卷積神經網路的篡改檢測
2020-11-05
特徵卷積神經網路
SEPC：使用3D卷積從FPN中提取尺度不變特徵，漲點神器 | CVPR 2020
2020-05-26
3D卷積特徵

學習筆記17：DenseNet實現多分類（卷積基特徵提取）

資料集描述

資料預處理

獲取影像及標籤

劃分測試集和訓練集

透過寫資料集類的方式，獲取資料集並進一步獲得DataLoader

結果檢視

提取卷積基

預訓練模型獲取

提取影像特徵

重新定義資料集

模型定義與預測

模型定義

模型訓練

訓練結果

相關文章