超全Python影像處理講解(多圖預警)

ZackSock發表於2020-04-07

Pillow模組講解

一、Image模組

1.1 、開啟圖片和顯示圖片

對圖片的處理最基礎的操作就是開啟這張圖片,我們可以使用Image模組中的open(fp, mode)方法,來開啟圖片。open方法接收兩個引數,第一個是檔案路徑,第二個是模式。主要的模式如下:

mode(模式) bands(通道) 說明
“1” 1 數字1,表示黑白二值圖片,每個畫素用0或1共1位二進位制碼錶示
“L” 1 灰度圖
“P” 1 索引圖
“RGB” 3 24位真彩圖
“RGBA” 4 “RGB”+透明通道
“CMYK” 4 印刷模式影像

更多的模式也就不說了,關於模式的模式的詳細介紹我也不知道。這個open方法返回一個Image物件,mode也不是必須引數。開啟圖片程式碼如下:

from PIL import Image
# 開啟圖片
im = Image.open('test.jpg')
# 顯示圖片
im.show()

當然顯示圖片不是我們的重點,我們獲取Image物件之後,就可以獲取它的一些資訊了。

print('影像的格式:', im.format)
print('影像的大小:', im.size)
print('影像的寬度:', im.width)
print('影像的高度:', im.height)
# 傳入座標的元組
print('獲取某個畫素點的顏色值:', im.getpixel(100, 100))

在我的環境中執行結果如下:

影像的格式: JPEG
影像的大小: (3968, 2976)
影像的寬度: 3968
影像的高度: 2976
獲取某個畫素點的顏色值: (198, 180, 132)

1.2、建立一個簡單的影像

在Image模組中,提供了建立影像的方法。主要是通過**Image.new(mode, size, color)**實現,該方法傳入三個引數:

  • mode:影像的建立模式
  • size:影像的大小
  • color:影像的顏色

用該方法可以建立一個簡單的影像,之後我們可以通過save方法將影像儲存:

from PIL import Image
# 建立一個簡單的影像
im = Image.new('RGB', (100, 100), 'red')
# 儲存這個影像
im.save('red.png')

生成圖片如下:

1.3、影像混合

(1)透明度混合

透明度混合主要是使用**Image中的blend(im1, im2, alpha)**方法,對該方法的解釋如下:

  • im1:Image物件,在混合的過程中,透明度設定為(1-apha)
  • im2:Image物件,在混合的過程中,透明度設定為(apha)
  • alpha:透明度,取值是0-1。當透明度為0是,顯示im1物件;當透明度為1時,顯示im2物件

注意:im1和im2的大小必須一樣,且mode都為RGB

程式碼實現如下:

from PIL import Image

# 開啟im1
im1 = Image.open('pic.jpg').convert(mode='RGB')
# 建立一個和im1大小一樣的影像
im2 = Image.new('RGB', im1.size, 'red')
# 混合圖片,並顯示
Image.blend(im1, im2, 0.5).show()

下面為原圖和混合圖的對比:

不得不說,我家艾斯真滴帥。

(2)遮罩混合

接下來就是很迷的時刻了,我們可以通過Image.composite(im1, im2, mask)方法實現遮罩混合。三個引數都是Image物件,該方法的作用就是使用mask來混合im1和im2。我是聽不懂,你們能聽懂最好給我講一下。具體實現如下:

# 這句程式碼寫了好多遍,我真不想寫了
from PIL import Image
# 開啟影像1
im1 = Image.open('pic1.jpg')
# 開啟影像2
im2 = Image.open('pic2.jpg')
# 重新設定im2的大小
im2.resize(im1.size)
# 將影像2的三個色道分離,其中r、g、b都為Image物件
r, g, b = im2.split()
# 遮罩混合
Image.composite(im1, im2, b).show()

注意:im1、im2和mask的大小必須一樣

im1、im2和遮罩混合效果對比如下:

依舊是我帥氣的艾斯。

1.4、影像縮放

(1)按畫素縮放

按畫素縮放通過Image.eval(im1, fun)方法實現,其中im1為我們老生常談的Image物件了;第二個為一個方法(函式),該函式傳入一個引數,即畫素點。該函式會對圖片中每個畫素點進行函式內的操作。下面我們對來簡單使用一下這個方法:

from PIL import Image
# 開啟一張影像
im = Image.open('摳鼻屎.jpg')
# 對該影像每個畫素點進行*2處理
Image.eval(im, lambda x:x*2).show()

這裡我使用的lambda表示式,當然一般也都是用lambda表示式,不過你也可以像下面這樣寫:

# 定義一個方法
def func(x):
    return x*2
# 對影像im每個畫素點進行func中的操作,其中func不能加()
Image.eval(im, func)

效果圖如下:

細心的讀者應該可以發現,這個摳鼻屎的圖片和筆者頭像並不完全一樣。在血色方面,筆者的頭像確實要差幾分。

注意:筆者在日常生活中可不是天天在大街上摳鼻屎的那種。

(2)按尺寸縮放

按尺寸縮放是通過Image物件的thumbnail()方法實現的,這裡不同於前面直接通過Image呼叫方法,而是使用Image的具體例項im2呼叫thumbnail方法,從而對im2直接進行處理。具體程式碼如下:

from PIL import Image
# 開啟影像
im1 = Image.open('xx.jpg')
# 複製影像
im2 = im1.copy()
# 將複製後的影像進行縮放,傳入一個元組
im2.thumbnail((100, 100))
# 輸出影像大小
print("im1的大小", im1.size)
print('im2的大小', im2.size)

這裡縮放影像並不會對影像進行變形,即顯示效果是一樣的。這裡就不放效果圖了,輸入結果如下:

im1的大小 (960, 960)
im2的大小 (100, 100)

1.5、影像的剪下與貼上

(1)影像貼上

貼上的實現主要是通過Image物件的paste(im, box, mask)方法,其中im為Image物件;box為要貼上到的區域;mask為遮罩(我也不知道啥是遮罩)。其中box的引數有三種形式:

  • (x1, y1):將im左上角對齊(x1,y1)點,其餘部分貼上,超出部分拋棄
  • (x1, x2, y1, y2):將im貼上至此區域
  • None:此時im必須與源影像大小一致

(2)裁剪影像

裁剪主要通過Image物件的crop(box)方法實現,box同貼上中一致。

接下來我們做一個小練習,想將影像某個區域剪下下來,然後貼上到另一個影像上:

from PIL import Image
# 開啟影像
im = Image.open('nnz.jpg')
# 複製兩份
im1 = im.copy()
im2 = im.copy()
# 剪下圖片
im_crop = im1.crop((200, 200, 400, 400))
# 貼上圖片
im2.paste(im_crop, (30, 30))
im2.show()

原圖和效果圖對比如下:

貌美如花的娜娜子。

1.4、影像旋轉和格式轉換

(1)影像旋轉

影像旋轉就非常簡單了,簡單的一句程式碼,通過Image物件呼叫rotate(),該方法返回被旋轉影像的一個副本:

from PIL import Image
im = Image.open('nnz.jpg')
# 旋轉90度然後顯示
im.rotate(90).show()

順時針逆時針就不要問我了。

(2)格式轉換

  • convert:轉換影像的模式
  • transpose:轉換影像的格式

convert之前已經使用過了,這裡就簡單演示一下transpose的作用,transpose主要傳入一些Image中的常量:

from PIL import Image
# 開啟影像
im = Image.open('nnz.jpg')
# 這裡我也不知道註釋啥了,總之效果和rotate(90)效果一樣
im.transpose(Image.ROTATE_90).show()

效果圖我也就不放了,給大家列出一些可以傳入的常量和該常量的作用:

常量 作用
Image.FILP_TOP_BOTTOM 上下翻轉
Image.FILP_LEFT_RIGHT 左右翻轉
Image.ROTATE_90 翻轉90°
Image.ROTATE_180 翻轉180°
Image.TRANSPOSE 顛倒

我也不知道這是哪門子的格式轉換。

1.5、分離和合並

(1)分離

這個是之前使用過的,通過Image物件的split()方法,將影像的RGB三個通道分離,並返回三個Image物件:

from PIL import Image
# 開啟影像
im = Image.open('nnz.jpg')
# 分離通道,返回3個Image物件
r, g, b = im.split()

三個通道的效果圖如下:

(2)合併

合併是通過Image.merge(mode, bands)方法實現的,其中mode為模式,bands為通道列表,傳入一個列表型別資料。下面我實現以下小新多年來的願望:

from PIL import Image
# 開啟小新.jpg和娜娜子.jpg
im1 = Image.open('娜娜子.jpg')
im2 = Image.open('小新.jpg')
# 讓im2大小和im1一樣
im2.resize(im1.size)
# 將兩個影像分別分離
r1, g1, b1 = im1.split()
r2, g2, b2 = im2.split()
# 合併影像
im3 = Image.merge('RGB', [r1, g2, b1])
im3.show()

效果圖如下,看到這麼美的圖片,小新一定會感謝我的:

到這裡,我們就把Image模組的大致內容講解完了,接下來我們來了解PIL中更豐富的功能。

二、ImageFilter

ImageFilter中提供了很多常用的濾鏡功能,

2.1、高斯模糊

高斯模糊也叫高斯平滑,是啥我也不知道,反正聽名字就是模糊。我們結合上面的內容完成一個小案例:

from PIL import Image, ImageFilter
# 開啟影像
im1 = Image.open('iron_man.jpg')
# 建立一個im1兩倍寬的影像
img = Image.new('RGB', (im1.width*2, im1.height), 'red')
# 高斯模糊處理
im2 = im1.filter(ImageFilter.GaussianBlur)
# 將im1貼上到img上
img.paste(im1, (0, 0))
# 將im2(高斯模糊後的影像)貼上到img上
img.paste(im2, (im1.width, 0))
img.show()

為了考慮小新的感受,下面不再用娜娜子作為素材。我選取了一張鋼鐵俠的圖片,執行結果如下:

超全Python影像處理講解(多圖預警)

希望各位讀者不要誤會,他倆真沒說你帥,他倆只說筆者一個人帥。

2.2、其它濾鏡

除了高斯模糊,ImageFilter中還提供了許多其它濾鏡:

濾鏡值 濾鏡名詞
BLUR 模糊效果
CONTOUR 輪廓
DETAIL 細節
EDGE_ENHANCE 邊緣增強
EDGE_ENHANCE_MORE 邊緣增強plus
EMBOSS 浮雕效果
FIND_EDGES 尋找邊緣
SMOOTH 平滑

筆者用一張美女圖片,測試了上面幾個濾鏡的效果,發現9張圖是看起來是完全一樣的。雖然完全一樣,但是筆者還是打算將這次測試的結果作為我慈善事業的一部分,分享給各位讀者。

其中1為高斯模糊,2-9分別為表格中的8個濾鏡。

三、ImageChops模組(影像合成)

ImageChops模組中,提供了很多影像合成的方法。這些方法是通過計算通道中畫素值來實現的,不同的方法有不同的計算方式。

3.1、加法運算

加法運算通過**ImageChops.add(image1, image2, scale=1.0, offset=0)**方法實現,合成公式如下:

out = (im1 + im2)/scale + offset

我也看不懂,其中scale和offset是有預設值的。所以使用時我們可以省略引數,具體實現如下:

from PIL import Image, ImageChops
# 開啟影像
im1 = Image.open('im1.jpg')
im2 = Image.open('im2.jpg')
# 合成影像並顯示
im3 = ImageChops.add(im1, im2)
im3.show()

實驗結果產不忍賭,效果圖如下:

在這裡插入圖片描述

3.2、減法運算

加法運算通過**ImageChops.subtract(image1, image2, scale=1.0, offset=0)**方法實現,合成公式如下:

out = (im1 - im2)/scale + offset

其使用和add方法是一致的,程式碼如下:

from PIL import Image, ImageChops
# 開啟影像
im1 = Image.open('xscn.jpg')
im2 = Image.open('xscn2.jpg')
# 合成影像並顯示
im3 = ImageChops.subtract(im1, im2)
im3.show()

原本是不想放效果圖的,但是執行後,發現效果圖比較美,所以想和大家分享一下:

在這裡插入圖片描述

希望大家讀到這篇部落格的時候是獨自一人的深夜。

3.3、其它函式

因為大多數函式的使用都比較簡單,所以後續的函式也不單獨拿出來講了,具體功效可以看下列表:

函式名 引數 作用 計算公式
darker(變暗) (image1, image2) 對比兩種圖片的畫素,取兩種圖片中對應畫素的較小值。(去亮留暗) min(im1, im2)
lighter(變亮) 同上 對比兩種圖片的畫素,取兩種圖片中對應畫素的較大值。(去暗留亮) max(im1, im2)
invert(反色) (image) 將max(255)減去每個畫素的值 max-image
multiply(疊加) (image1, image2) 兩種圖片互相疊加。如果和黑色疊加,將獲得一張很色圖片 im1*im2/max
screen(螢幕) 同上 先反色後疊加 max-((max-im1)*(max-im2)/max)
difference(比較) 同上 各個畫素做減法,取絕對值。如果畫素相同結果為黑色 abs(im1-im2)

演示程式碼如下:

from PIL import Image, ImageChops

# 開啟影像
im1 = Image.open("im1.jpg")
im2 = Image.open("im2.jpg")

# 對影像進行各種操作
im3 = ImageChops.darker(im1, im2)
im3.save('darker.jpg')
im3 = ImageChops.lighter(im1, im2)
im3.save('lighter.jpg')
im3 = ImageChops.invert(im1)
im3.save('invert.jpg')
im3 = ImageChops.multiply(im1, im2)
im3.save('multiply.jpg')
im3 = ImageChops.screen(im1, im2)
im3.save('screen.jpg')
im3 = ImageChops.difference(im1, im2)
im3.save('difference.jpg')

其中,我選取的素材im1和im2都是上面使用到的那兩張,效果圖如下:

在這裡插入圖片描述

這樣,我的女神就被我毀的體無完膚了。

四、ImageEnhance模組(色彩、亮度)

ImageEnhance提供了許多函式,用於調整影像的色彩、對比度、亮度、清晰度等。調整影像的步驟如下:

  1. 確定要調整的引數,獲取特定的調整器
  2. 呼叫調整器的enhance方法,傳入引數進行調整。

注意:所有調整器都實現同一個介面,該介面中包含一個方法enhance

其中enhance方法接收一個引數factor,factor是一個大於0的數。當factor為1時,返回原圖,當factor小於1返回減弱圖,大於1返回增強圖。

各個獲取色彩調整器的方法如下:

方法名稱 方法作用
ImageEnhance.Color() 獲取顏色調整器
ImageEnhance.Contrast() 獲取對比度調整器
ImageEnhance.Brightness() 獲取亮度調整器
ImageEnhance.Sharpness() 獲取清晰度調整器

雖然是很想偷懶,不去做實驗,但是想想還是做了如下實驗,程式碼如下:

from PIL import Image, ImageEnhance
# 開啟im1
im1 = Image.open("gtx.jpg")
# 獲取顏色(各種)調整器
enhance_im1 = ImageEnhance.Color(im1)
#enhance_im1 = ImageEnhance.Contrast(im1)
#enhance_im1 = ImageEnhance.Brightness(im1)
#enhance_im1 = ImageEnhance.Sharpness(im1)
# 減弱顏色(以及其它屬性)
im2 = enhance_im1.enhance(0.5)
# 增強顏色(以及其它屬性)
im3 = enhance_im1.enhance(1.5)

# 獲取原圖大小
w, h = im1.size
# 建立一個原圖大小3倍的圖片
img = Image.new("RGB", (w*3, h))
# 將減弱的圖片放在最左邊
img.paste(im2, (0, 0))
# 將原圖放在中間
img.paste(im1, (w, 0))
# 將增強後的圖片放在最右邊
img.paste(im3, (w*2, 0))
# 顯示圖片
img.show()

其中,我們只需要修改獲取調整器的程式碼就可以了,獲取其它調製器的程式碼我註釋了。然後看看效果圖:

在這裡插入圖片描述

這種不傷大雅的工作,讓我唐尼叔做再適合不過了。

另外再講一個調節亮度的函式,但是這個函式時Image中的函式point(),而不是ImageEnhance的。該函式傳入一個引數,使用方法和Image.eval()類似,使用示例如下:

from PIL import Image
# 開啟影像
im1 = Image.open('gtx.jpg')

# 變暗操作
im2 = im1.point(lambda x:x*0.5)
# 變數操作
im3 = im1.point(lambda x:x*1.5)
# 獲取原圖大小
w, h = im1.size
# 建立一個原圖大小3倍的圖片
img = Image.new("RGB", (w*3, h))
# 將減弱的圖片放在最左邊
img.paste(im2, (0, 0))
# 將原圖放在中間
img.paste(im1, (w, 0))
# 將增強後的圖片放在最右邊
img.paste(im3, (w*2, 0))
# 顯示圖片
img.show()

效果圖如下:

在這裡插入圖片描述

五、ImageDraw模組

該模組提供了許多繪製2D影像的功能,我們可以通過繪製獲取一個全新的影像,也可以在原有的影像上進行繪製。在我們使用該模組進行繪製時,我們需要先獲取ImageDraw.Draw物件,獲取方式如下:

from PIL import ImageDraw
# 建構函式中,im為一個Image物件
drawer = ImageDraw.Draw(im)

我們獲取ImageDraw.Draw物件後就可以進行相應的繪製了。

5.1、繪製簡單形狀

在繪製之前,我們先建立一個空白的圖片:

from PIL import Image, ImageDraw

# 建立一個300*300的白色圖片
im = Image.new("RGB", (300, 300), "white")
# 獲取ImageDraw.Draw物件
drawer = ImageDraw.Draw(im)

後續的繪製都可以使用物件drawer繪製。

(1)繪製直線

"""
xy:起點座標和終點座標(x1, y1, x2, y2)
fill:填充色。"red"、"blue"...
width:輪廓粗細
joint:連線方式,可以是曲線
"""
line(xy, fill, width, joint)
# 繪製直線
drawer.line((50, 50, 150, 150), fill='green',width=2)

(2)繪製矩形

"""
xy:左上角座標和右下角座標(x1, y1, x2, y2)
fill:填充色。"red"、"blue"...
outline:輪廓色。同上
width:輪廓粗細
"""
rectangle(xy, fill, outline, width)
# 使用示例
drawer.rectangle((50, 50, 150, 150), fill='green', outline='red', width=3)

(3)繪製圓弧

"""
xy:包含圓弧所在圓的矩形的左上角座標和右下角座標(x1, y1, x2, y2)
start:起始角度
end:終止角度
fill:填充色。"red"、"blue"...
width:輪廓粗細
"""
arc(xy, start, end, fill, width)
# 使用示例
drawer.arc((50, 50, 150, 150), start=0, end=90, fill='green', width=3)

對於xy引數的解釋如圖所示:

在這裡插入圖片描述

(4)繪製橢圓

"""
xy:包含橢圓(或圓)的矩形的左上角座標和右下角座標(x1, y1, x2, y2)
fill:填充色。"red"、"blue"...
outline:輪廓顏色
width:輪廓粗細
"""
ellipse(xy, fill, outline, width)
# 使用示例
drawer.ellipse((50, 50, 150, 150),fill='green', outline='red', width=3)

(5)繪製弦


"""
xy:弦所在橢圓的矩形的左上角座標和右下角座標(x1, y1, x2, y2)
start:開始角度
end:終點角度
fill:填充色。"red"、"blue"...
outline:輪廓顏色
width:輪廓粗細
"""
chord(xy, start, end, fill, outline, width)
# 使用示例
drawer.chord((50, 50, 150, 150),start=0, end=90, fill='green', outline='red', width=3)

(6)繪製扇形


"""
xy:扇形所在橢圓的矩形的左上角座標和右下角座標(x1, y1, x2, y2)
start:開始角度
end:終點角度
fill:填充色。"red"、"blue"...
outline:輪廓顏色
width:輪廓粗細
"""
pieslice(xy, start, end, fill, outline, width)
# 使用示例
drawer.pieslice((50, 50, 150, 150),start=0, end=90, fill='green', outline='red', width=3)

(7)繪製多邊形

"""
xy:多邊形各個點座標的元組/列表(x1, y1, x2, y2)
fill:填充色。"red"、"blue"...
outline:輪廓顏色
"""
pieslice(xy, fill, outline)
# 使用示例
drawer.polygon((50, 50, 150, 150, 150, 200, 200, 250, 50, 50), fill='green', outline='red')

(8)繪製點

"""
xy:點的座標
fill:填充色。"red"、"blue"...
"""
point(xy, fill)
# 使用示例
drawer.point((100, 100), fill='black')

除了上面這些簡單圖形外,我們還可以使用Draw繪製文字。

5.2、繪製文字

繪製文字和繪製圖形是一樣的:

"""
xy:起點座標
text:繪製的文字
fill:填充色。"red"、"blue"...
...其中繪製文字還有許多其它引數
"""
text(xy, text, fill)
# 使用示例
drawer.text((100, 100), text='zack' fill='red')

當我們繪製中文時,上述程式碼會報錯,因為預設編碼是不支援中文的。我們可以在C:/Windows/Fonts目錄下找到字型檔案,我們選擇一個支援中文的。我這裡直接是將字型檔案複製到專案底下來了,程式碼如下:

from PIL import Image, ImageDraw, ImageFont
# 建立一個影像用於繪製文字
im = Image.new("RGB", (300, 300), "white")
drawer = ImageDraw.Draw(im)
# 獲取字型物件
imFont = ImageFont.truetype('simkai.ttf', 30)
# 繪製文字時設定字型
drawer.text((50, 100),text="啥",font=imFont,fill="red")
im.show()

我們使用了ImageFont.truetype()函式獲取字型物件,在獲取時我們可以設定字型大小。到此我們就瞭解了PIL的各種操作了,感興趣的讀者可以關注我的個人公眾號:ZackSock。

相關文章