[PyTorch 學習筆記] 2.2 圖片預處理 transforms 模組機制

張賢同學發表於2020-08-27

原文網址 : https://www.cnblogs.com/zhangxiann/p/13570835.html

PyTorch筆記ORM

PyTorch 的資料增強

我們在安裝PyTorch時，還安裝了torchvision，這是一個計算機視覺工具包。有 3 個主要的模組：

torchvision.transforms: 裡面包括常用的影像預處理方法
torchvision.datasets: 裡面包括常用資料集如 mnist、CIFAR-10、Image-Net 等
torchvision.models: 裡面包括常用的預訓練好的模型，如 AlexNet、VGG、ResNet、GoogleNet 等

深度學習模型是由資料驅動的，資料的數量和分佈對模型訓練的結果起到決定性作用。所以我們需要對資料進行預處理和資料增強。下面是用資料增強，從一張圖片經過各種變換生成 64 張圖片，增加了資料的多樣性，這可以提高模型的泛化能力。

[PyTorch 學習筆記] 2.2 圖片預處理 transforms 模組機制

常用的影像預處理方法有：

資料中心化
資料標準化
縮放
裁剪
旋轉
翻轉
填充
噪聲新增
灰度變換
線性變換
仿射變換
亮度、飽和度以及對比度變換。

在人民幣圖片二分類實驗中，我們對資料進行了一定的增強。

# 設定訓練集的資料增強和轉化
train_transform = transforms.Compose([
    transforms.Resize((32, 32)),# 縮放
    transforms.RandomCrop(32, padding=4), #裁剪
    transforms.ToTensor(), # 轉為張量，同時歸一化
    transforms.Normalize(norm_mean, norm_std),# 標準化
])

# 設定驗證集的資料增強和轉化，不需要 RandomCrop
valid_transform = transforms.Compose([
    transforms.Resize((32, 32)),
    transforms.ToTensor(),
    transforms.Normalize(norm_mean, norm_std),
])

當我們需要多個transforms操作時，需要作為一個list放在transforms.Compose中。需要注意的是transforms.ToTensor()是把圖片轉換為張量，同時進行歸一化操作，把每個通道 0~255 的值歸一化為 0~1。在驗證集的資料增強中，不再需要transforms.RandomCrop()操作。然後把這兩個transform操作作為引數傳給Dataset，在Dataset的__getitem__()方法中做影像增強。

def __getitem__(self, index):
	# 通過 index 讀取樣本
	path_img, label = self.data_info[index]
	# 注意這裡需要 convert('RGB')
	img = Image.open(path_img).convert('RGB')     # 0~255
	if self.transform is not None:
		img = self.transform(img)   # 在這裡做transform，轉為tensor等等
	# 返回是樣本和標籤
	return img, label

其中self.transform(img)會呼叫Compose的__call__()函式：

def __call__(self, img):
	for t in self.transforms:
		img = t(img)
	return img

可以看到，這裡是遍歷transforms中的函式，按順序應用到 img 中。

transforms.Normalize

torchvision.transforms.Normalize(mean, std, inplace=False)

功能：逐 channel 地對影像進行標準化

output = ( input - mean ) / std

mean: 各通道的均值
std: 各通道的標準差
inplace: 是否原地操作

該方法呼叫的是F.normalize(tensor, self.mean, self.std, self.inplace)

而``F.normalize()`方法如下：

def normalize(tensor, mean, std, inplace=False):
    if not _is_tensor_image(tensor):
        raise TypeError('tensor is not a torch image.')

    if not inplace:
        tensor = tensor.clone()

    dtype = tensor.dtype
    mean = torch.as_tensor(mean, dtype=dtype, device=tensor.device)
    std = torch.as_tensor(std, dtype=dtype, device=tensor.device)
    tensor.sub_(mean[:, None, None]).div_(std[:, None, None])
    return tensor

首先判斷是否為 tensor，如果不是 tensor 則丟擲異常。然後根據inplace是否為 true 進行 clone，接著把 mean 和 std 都轉換為 tensor (原本是 list)，最後減去均值除以方差：tensor.sub_(mean[:, None, None]).div_(std[:, None, None])

對資料進行均值為 0，標準差為 1 的標準化，可以加快模型的收斂。

在邏輯迴歸的實驗中，我們的資料生成程式碼如下：

sample_nums = 100
mean_value = 1.7
bias = 1
n_data = torch.ones(sample_nums, 2)
# 使用正態分佈隨機生成樣本，均值為張量，方差為標量
x0 = torch.normal(mean_value * n_data, 1) + bias      # 類別0 資料 shape=(100, 2)
# 生成對應標籤
y0 = torch.zeros(sample_nums)                         # 類別0 標籤 shape=(100, 1)
# 使用正態分佈隨機生成樣本，均值為張量，方差為標量
x1 = torch.normal(-mean_value * n_data, 1) + bias     # 類別1 資料 shape=(100, 2)
# 生成對應標籤
y1 = torch.ones(sample_nums)                          # 類別1 標籤 shape=(100, 1)
train_x = torch.cat((x0, x1), 0)
train_y = torch.cat((y0, y1), 0)

生成的資料均值是mean_value+bias=1.7+1=2.7，比較靠近 0 均值。模型在 380 次迭代時，準確率就超過了 99.5%。

如果我們把 bias 修改為 5。那麼資料的均值變成了 6.7，偏離 0 均值較遠，這時模型訓練需要更多次才能收斂 (準確率達到 99.5%)。

**參考資料**

深度之眼 PyTorch 框架班

如果你覺得這篇文章對你有幫助，不妨點個贊，讓我有更多動力寫出好文章。

transforms模組—PyTorch影像處理與資料增強方法
2023-01-03
ORMPyTorch
深度學習 preprocess 預處理圖片方式去 pytorch 化
2023-04-07
深度學習PyTorch
機器學習筆記---資料預處理
2022-04-30
機器學習筆記
機器學習演算法筆記之6：資料預處理
2020-04-06
機器學習演算法筆記
pytorch學習筆記
2020-10-24
PyTorch筆記
PyTorch 學習筆記
2024-10-11
PyTorch筆記
React學習筆記-事件處理
2020-12-26
React筆記事件
學習筆記（2）IPC機制
2019-04-27
筆記
Python學習筆記 - 下載圖片
2019-01-19
Python筆記
Nginx 學習筆記--程式與模組
2020-04-07
Nginx筆記
深度學習框架Pytorch學習筆記
2023-02-27
深度學習框架PyTorch筆記
Vue學習筆記之事件處理
2018-06-20
Vue筆記事件
[PyTorch 學習筆記] 6.2 Normalization
2020-09-10
PyTorch筆記ORM
Pytorch學習筆記之tensorboard
2022-12-19
PyTorch筆記ORB
Pytorch入門-Transforms
2024-03-13
PyTorchORM
Python3學習筆記（5）常用模組：time、datetime、random、os、sys、shutil、shelve、xml處理
2019-05-30
Python筆記randomXML
大模型學習筆記：attention 機制
2024-11-24
大模型筆記
MySQL 學習筆記（二）MVCC 機制
2022-03-05
MySql筆記MVC
Nginxhttp模組(學習筆記二十一)
2018-05-17
NginxHTTP筆記
Nginxupload上傳模組(學習筆記十七)
2018-05-17
Nginx筆記
Nginx 學習筆記--程式與模組（二）
2020-04-08
Nginx筆記
(1) Pytorch深度學習—數值處理
2024-11-11
PyTorch深度學習
機器學習一：資料預處理
2019-02-27
機器學習
機器學習框架ML.NET學習筆記【6】TensorFlow圖片分類
2019-05-31
機器學習框架筆記
swoft 學習筆記之異常處理
2019-08-13
筆記
Flutter學習筆記（32）--PointerEvent事件處理
2020-06-18
Flutter筆記事件
vue學習筆記3-事件處理
2024-06-30
Vue筆記事件
Go語言學習筆記 - PART12 - 異常處理機制與單元測試
2019-05-08
Go筆記
Pytorch學習筆記|莫凡Python
2020-11-02
PyTorch筆記Python
JVM學習筆記——類載入機制
2019-02-20
JVM筆記
Flutter學習筆記（10）--容器元件、圖片元件
2019-07-25
Flutter筆記元件
node學習筆記第八節：模組化
2018-08-03
筆記
Python學習筆記_函式_匯入模組
2019-11-16
Python筆記函式
Python深度學習（處理文字資料）--學習筆記（十二）
2020-11-12
Python深度學習筆記
OpenCV影像處理學習筆記-Day1
2020-09-28
OpenCV筆記
SpringMVC學習筆記10-異常處理
2020-12-16
SpringMVC筆記
Python入門學習之異常處理機制
2021-06-28
Python
[PyTorch 學習筆記] 3.2 卷積層
2020-08-30
PyTorch筆記卷積

[PyTorch 學習筆記] 2.2 圖片預處理 transforms 模組機制

PyTorch 的資料增強

transforms.Normalize

相關文章