影像語義分割資料增強——imgaug（二）

沒傘的孩紙努力奔跑發表於2020-11-02

原文網址 : https://blog.csdn.net/Joseph__Lagrange/article/details/109458846

有一個需求

使用imgaug工具包進行影像分割資料增強

說明：輸入有兩張圖片，分別是RGB圖片和對應的label圖片，然後通過程式碼對這兩張圖片做了縮放、映象+上下翻轉、旋轉、xy平移、裁剪、旋轉 + 裁剪、高斯平滑的影像增強

兩張輸入圖片：
RGB圖片
在這裡插入圖片描述

對應的label
在這裡插入圖片描述

程式碼如下

import random
import glob
import numpy as np
import imgaug as ia
import imgaug.augmenters as iaa
from imgaug.augmentables.segmaps import SegmentationMapsOnImage
from PIL import Image


class ImageAugmentor(object):
    def __init__(self, image_dir=None, segmap_dir=None, image_aug_dir=None, SegmentationClass_aug_dir=None):
        self.image_dir = image_dir  # 存放原圖的目錄，必須是RGB
        self.segmap_dir = segmap_dir  # 存放原圖對應的標籤，必須是p模式的圖片
        self.image_aug_dir = image_aug_dir
        self.SegmentationClass_aug_dir = SegmentationClass_aug_dir

        self.image_num = 1
        self.seed_set()

    def seed_set(self, seed=1):
        np.random.seed(seed)
        random.seed(seed)
        ia.seed(seed)

    def array2p_mode(self, alpha_channel):
        """alpha_channel is a binary image."""
        assert set(alpha_channel.flatten().tolist()) == {0, 1}, "alpha_channel is a binary image."
        alpha_channel[alpha_channel == 1] = 128
        h, w = alpha_channel.shape
        image_arr = np.zeros((h, w, 3))
        image_arr[:, :, 0] = alpha_channel
        img = Image.fromarray(np.uint8(image_arr))
        img_p = img.convert("P")
        return img_p

    def augmentor(self, image):
        height, width, _ = image.shape
        resize = iaa.Sequential([
            iaa.Resize({"height": int(height/2), "width": int(width/2)}),
        ])

        fliplr_flipud = iaa.Sequential([
            iaa.Fliplr(),
            iaa.Flipud(),
        ])

        guassian_blur = iaa.Sequential([
            iaa.GaussianBlur(sigma=(1.5, 2.5)),
        ])

        rotate = iaa.Sequential([
            iaa.Affine(rotate=(-90, 90))
        ])

        translate = iaa.Sequential([
            iaa.Affine(translate_percent=(0.2, 0.5))
        ])

        crop_and_pad = iaa.Sequential([
            iaa.CropAndPad(percent=(-0.25, 0), keep_size=False),
        ])

        rotate_and_crop = iaa.Sequential([
            iaa.Affine(rotate=45),
            iaa.CropAndPad(percent=(-0.25, 0), keep_size=False)
        ])

        ops = [resize, fliplr_flipud, rotate, translate, crop_and_pad, rotate_and_crop, guassian_blur]
        #    縮放、映象+上下翻轉、旋轉、xy平移、裁剪、旋轉 + 裁剪、高斯平滑
        return ops

    def augment_image(self, image_name, segmap_name):
        # 1.Load an image.
        image = Image.open(image_name)
        segmap = Image.open(segmap_name)

        name = f"{self.image_num:04d}"
        image.save(self.image_aug_dir + name + ".jpg")
        segmap.save(self.SegmentationClass_aug_dir + name + ".png")
        self.image_num += 1

        image = np.array(image)
        segmap = SegmentationMapsOnImage(np.array(segmap), shape=image.shape)

        # 2. define the ops
        ops = self.augmentor(image)

        # 3.execute ths ops
        for _, op in enumerate(ops):
            name = f"{self.image_num:04d}"
            print(f"當前增強了{self.image_num:04d}張資料...")
            images_aug_i, segmaps_aug_i = op(image=image, segmentation_maps=segmap)
            images_aug_i = Image.fromarray(images_aug_i)
            images_aug_i.save(self.image_aug_dir + name + ".jpg")

            segmaps_aug_i_ = segmaps_aug_i.get_arr()
            segmaps_aug_i_ = self.array2p_mode(segmaps_aug_i_)
            segmaps_aug_i_.save(self.SegmentationClass_aug_dir + name + ".png")
            self.image_num += 1


if __name__ == "__main__":
    image_name = "./JPEGImages/0036.jpg"
    segmap_name = "./SegmentationClass/0036.png"
    image_aug_dir = "./JPEG_AUG/"
    SegmentationClass_aug_dir = "./SegmentationClass_AUG/"

    image_augmentation = ImageAugmentor(image_aug_dir=image_aug_dir, SegmentationClass_aug_dir=SegmentationClass_aug_dir)
    image_augmentation.augment_image(image_name, segmap_name)

實現方法

藉助imgaug工具包實現

引數說明
image_name
segmap_name
image_aug_dir
SegmentationClass_aug_dir

結果展示

原圖增強後的七張圖
在這裡插入圖片描述

標籤增強後的七張圖
在這裡插入圖片描述

IEMLRN：基於影像增強的句子語義表示
2019-04-19
Pixellib語義分割-影像背景替換
2024-06-22
常用語義分割資料集
2021-01-03
乾貨 | 影像資料增強實戰
2018-11-21
Ai影像分割模型PaddleSeg——自定義資料集處理
2021-08-10
AI模型
谷歌開源最新語義影像分割模型DeepLab-v3+
2018-03-13
谷歌模型
YOLOv9：在自定義資料上進行影像分割訓練
2024-04-22
YOLO
transforms模組—PyTorch影像處理與資料增強方法
2023-01-03
ORMPyTorch
影像增強（Image enhancement）
2024-10-07
31-語義分割
2024-08-29
使用LabVIEW實現基於pytorch的DeepLabv3影像語義分割
2022-11-04
ViewPyTorch
IEMLRN：基於影象增強的句子語義表示
2019-04-19
標註案例分享：自動駕駛影像語義分割丨曼孚科技
2020-12-29
自動駕駛
夜間場景缺資料，如何進行語義分割？浙大提出基於GAN的高魯棒夜間語義分割框架
2019-10-31
框架
機器學習筆記 - Pascal VOC資料集使用FCN語義分割
2021-08-18
機器學習筆記
QGis二次開發基礎 -- 柵格影像增強顯示
2020-10-31
李飛飛等人提出Auto-DeepLab：自動搜尋影像語義分割架構
2019-01-14
架構
影像增強之對比度拉伸
2018-03-24
影像增強演算法總結
2020-12-15
演算法
【影像分割】基於四叉樹影像分割matlab
2020-11-02
Matlab
什麼是資料增強？
2021-12-15
語義分割的標準度量MIoU
2020-10-28
案例分享：自動駕駛3D點雲語義分割資料標註
2022-07-15
自動駕駛3D
自動網路搜尋（NAS）在語義分割上的應用（二）
2020-05-26
java9系列第二篇-資源自動關閉的語法增強
2020-10-15
Java
MIGO 增強提交資料庫後
2024-04-16
Go資料庫
體素科技：深鑽小資料下的醫學影像分割
2020-04-20
PostgreSQL11preview-分割槽表增強彙總
2018-07-28
SQLView
C#處理醫學影像(二):基於Hessian矩陣的醫學影像增強與窗寬窗位
2021-01-14
C#矩陣
ES6-解構賦值，語義增強，擴充套件運算子
2018-06-24
賦值套件
Perfectly Clear Workbench for Mac(強大的影像清晰度增強工具）
2021-12-19
Mac
三維點雲語義分割模型介紹
2018-11-18
模型
語義分割網路 U-Net 詳解
2019-08-28
Retinex影像增強演算法的優勢分析
2020-10-01
演算法
詳解計算機視覺五大技術：影像分類、物件檢測、目標跟蹤、語義分割和例項分割...
2018-04-19
計算機視覺物件
演算法影像崗-影像分類與影像分割
2020-11-08
演算法
知物由學 | 弱監督語義分割：從影像級標註快進到畫素級預測
2022-03-30
深度學習領域的資料增強
2020-03-13
深度學習

影像語義分割資料增強——imgaug（二）

有一個需求

程式碼如下

實現方法

結果展示

相關文章