學習筆記15：第二種載入資料的方法

有何m不可發表於2024-06-04

原文網址 : https://www.cnblogs.com/gongzb/p/18230163

轉自：https://www.cnblogs.com/miraclepbc/p/14367560.html

構建路徑集和標籤集

取出所有路徑

import glob
all_imgs_path = glob.glob(r"E:\datasets2\29-42\29-42\dataset2\dataset2\*.jpg")

獲得所有標籤

species = ['cloudy', 'rain', 'shine', 'sunrise']
all_labels = []
for img in all_imgs_path:
    for i, c in enumerate(species):
        if c in img:
            all_labels.append(i)

定義資料集類

# 必須建立 __getitem__, __len__, __init__
class Mydataset(data.Dataset):
    def __init__(self, img_paths, labels, transform):
        self.imgs = img_paths
        self.labels = labels
        self.transforms = transform
    def __getitem__(self, index):
        img = self.imgs[index]
        label = self.labels[index]
        pil_img = Image.open(img)
        data = self.transforms(pil_img)
        return data, label
    def __len__(self):
        return len(self.imgs)

基本屬性是：資料集裡面的影像是誰，相應的標籤是誰，變換方式有什麼
getitem是索引方法
len是返回資料集長度

劃分訓練集和測試集

這裡需要將所有路徑進行亂序，再將標籤相應的亂序。取出前80%為訓練集，其他為測試集

index = np.random.permutation(len(all_imgs_path))
all_imgs_path = np.array(all_imgs_path)[index]
all_labels = np.array(all_labels)[index]
s = int(len(all_imgs_path) * 0.8)

構建訓練集和測試集

transform = transforms.Compose([
    transforms.Resize((96, 96)),
    transforms.ToTensor()
])

train_ds = Mydataset(all_imgs_path[:s], all_labels[:s], transform)
test_ds = Mydataset(all_imgs_path[s:], all_labels[s:], transform)

train_dl = data.DataLoader(train_ds, batch_size = 8, shuffle = True)
test_dl = data.DataLoader(test_ds, batch_size = 8)

構建其他資料集

如果需要對剛剛構建的資料集進行一些其他變換
比如：原來是channel, height, width，現在要改成height, width, channel
這時候可以構建一個新的資料集類

class New_dataset(data.Dataset):
    def __init__(self, some_ds):
        self.ds = some_ds
    def __getitem__(self, index):
        img, label = self.ds[index]
        img = img.permute(1, 2, 0)
        return img, label
    def __len__(self):
        return len(self.ds)

測試一下：

train_new_ds = New_dataset(train_ds)
img, label = train_new_ds[2]

這個時候，img的shape就是(96, 96, 3)

資料結構第二章（學習筆記一）
2020-10-04
資料結構筆記
《Python入門與資料科學庫》學習筆記
2021-02-12
Python資料科學筆記
Oracle學習、進階資料合集（含教程、筆記、題庫下載與學習方法分享）
2021-07-29
Oracle筆記
Python學習之路15-下載資料
2018-05-29
Python
jvm學習筆記6：類載入器
2020-11-17
JVM筆記
JVM學習筆記——類載入機制
2019-02-20
JVM筆記
【Python學習】學習筆記 14-15 字串
2020-12-11
Python筆記字串
資料庫學習筆記
2018-10-18
資料庫筆記
強化學習-學習筆記15 | 連續控制
2022-07-14
強化學習筆記
15種下載檔案的方法
2019-03-30
下載檔案的15種方法
2020-08-19
Django學習筆記（15）——中介軟體
2019-06-05
Django筆記
PHP 資料加密 (學習筆記)
2019-07-30
PHP加密筆記
1029學習筆記資料庫
2020-11-03
筆記資料庫
資料結構學習筆記
2018-04-22
資料結構筆記
python學習筆記：資料庫
2018-04-19
Python筆記資料庫
MySQL資料庫學習筆記
2020-12-10
MySql資料庫筆記
GO 方法學習筆記
2020-04-13
Go筆記
osgEarth使用筆記4——載入向量資料
2020-10-02
筆記
資料庫mysql學習筆記記錄
2021-09-09
資料庫MySql筆記
[PyTorch 學習筆記] 7.1 模型儲存與載入
2020-09-15
PyTorch筆記模型
15種最常用的資料分析方法和模型
2021-12-28
模型
MYSQL學習筆記15: 數值函式
2024-03-09
MySql筆記函式
Adaptive AUTOSAR 學習筆記 15 - 持久化 Persistency
2021-08-22
APT筆記持久化
統計學習方法筆記-感知機學習方法
2023-05-16
筆記
大資料之 Hadoop學習筆記
2018-12-14
大資料Hadoop筆記
資料結構學習筆記1
2018-08-15
資料結構筆記
Redis學習筆記（七）資料庫
2020-05-16
Redis筆記資料庫
資料結構學習筆記--棧
2019-02-12
資料結構筆記
達夢資料庫學習筆記
2021-01-03
資料庫筆記
Python 學習筆記——資料型別
2020-11-25
Python筆記資料型別
JavaScript入門學習學習筆記（上）
2020-10-23
JavaScript筆記
學習筆記——物件方法整理
2018-04-02
筆記物件
統計學習方法筆記
2024-11-02
筆記
git入門學習筆記
2018-11-15
Git筆記
Docker入門學習筆記
2018-07-25
Docker筆記
Unity學習筆記--入門
2023-10-29
Unity筆記
TS入門學習筆記
2020-01-19
筆記