摘要:這篇文章詳細介紹了頂帽運算和底帽運算,它們將為後續的影像分割和影像識別提供有效支撐。
本文分享自華為雲社群《[Python從零到壹] 四十九.影像增強及運算篇之頂帽運算和底帽運算》,作者:eastmount。
數學形態學(Mathematical Morphology)是一種應用於影像處理和模式識別領域的新方法。數學形態學(也稱影像代數)表示以形態為基礎對影像進行分析的數學工具,其基本思想是用具有一定形態的結構元素去量度和提取影像中對應形狀以達到對影像分析和識別的目的。
一.影像頂帽運算
影像頂帽運算(top-hat transformation)又稱為影像禮帽運算,它是用原始影像減去影像開運算後的結果,常用於解決由於光照不均勻影像分割出錯的問題。其公式定義如下:
影像頂帽運算是用一個結構元透過開運算從一幅影像中刪除物體,頂帽運算用於暗背景上的亮物體,它的一個重要用途是校正不均勻光照的影響。其效果圖如圖1所示。
在Python中,影像頂帽運算主要呼叫morphologyEx()實現,其中引數cv2.MORPH_TOPHAT表示頂帽處理,函式原型如下:
dst = cv2.morphologyEx(src, cv2.MORPH_TOPHAT, kernel)
- src表示原始影像
- cv2.MORPH_TOPHAT表示影像頂帽運算
- kernel表示卷積核,可以用numpy.ones()函式構建
假設存在一張光照不均勻的米粒影像,如圖2所示,我們需要呼叫影像頂帽運算解決光照不均勻的問題。
影像頂帽運算的Python程式碼如下所示:
# -*- coding: utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('test01.png', cv2.IMREAD_UNCHANGED) #設定卷積核 kernel = np.ones((10,10), np.uint8) #影像頂帽運算 result = cv2.morphologyEx(src, cv2.MORPH_TOPHAT, kernel) #顯示影像 cv2.imshow("src", src) cv2.imshow("result", result) #等待顯示 cv2.waitKey(0) cv2.destroyAllWindows()
其執行結果如圖3所示。
下圖展示了“米粒”頂帽運算的效果圖,可以看到頂帽運算後的影像刪除了大部分非均勻背景,並將米粒與背景分離開來。
為什麼影像頂帽運算會消除光照不均勻的效果呢?
通常可以利用灰度三維圖來進行解釋該演算法。灰度三維圖主要呼叫Axes3D包實現,對原圖繪製灰度三維圖的程式碼如下:
# -*- coding: utf-8 -*- # By:Eastmount import numpy as np import cv2 as cv import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from matplotlib import cm from matplotlib.ticker import LinearLocator, FormatStrFormatter #讀取影像 img = cv.imread("test02.png") img = cv.cvtColor(img,cv.COLOR_BGR2GRAY) imgd = np.array(img) #image類轉numpy #準備資料 sp = img.shape h = int(sp[0]) #影像高度(rows) w = int(sp[1]) #影像寬度(colums) of image #繪圖初始處理 fig = plt.figure(figsize=(16,12)) ax = fig.gca(projection="3d") x = np.arange(0, w, 1) y = np.arange(0, h, 1) x, y = np.meshgrid(x,y) z = imgd surf = ax.plot_surface(x, y, z, cmap=cm.coolwarm) #自定義z軸 ax.set_zlim(-10, 255) ax.zaxis.set_major_locator(LinearLocator(10)) #設定z軸網格線的疏密 #將z的value字串轉為float並保留2位小數 ax.zaxis.set_major_formatter(FormatStrFormatter('%.02f')) # 設定座標軸的label和標題 ax.set_xlabel('x', size=15) ax.set_ylabel('y', size=15) ax.set_zlabel('z', size=15) ax.set_title("surface plot", weight='bold', size=20) #新增右側的色卡條 fig.colorbar(surf, shrink=0.6, aspect=8) plt.show()
執行結果如圖5所示,其中x表示原影像中的寬度座標,y表示原影像中的高度座標,z表示畫素點(x, y)的灰度值。
從影像中的畫素走勢顯示了該圖受各部分光照不均勻的影響,從而造成背景灰度不均現象,其中凹陷對應影像中灰度值比較小的區域。
透過影像白帽運算後的影像灰度三維圖如圖6所示,對應的灰度更集中於10至100區間,由此證明了不均勻的背景被大致消除了,有利於後續的閾值分割或影像分割。
繪製三維圖增加的頂帽運算核心程式碼如下:
二.影像底帽運算
影像底帽運算(bottom-hat transformation)又稱為影像黑帽運算,它是用影像閉運算操作減去原始影像後的結果,從而獲取影像內部的小孔或前景色中黑點,也常用於解決由於光照不均勻影像分割出錯的問題。其公式定義如下:
影像底帽運算是用一個結構元透過閉運算從一幅影像中刪除物體,常用於校正不均勻光照的影響。其效果圖如圖8所示。
在Python中,影像底帽運算主要呼叫morphologyEx()實現,其中引數cv2.MORPH_BLACKHAT表示底帽或黑帽處理,函式原型如下:
dst = cv2.morphologyEx(src, cv2.MORPH_BLACKHAT, kernel)
- src表示原始影像
- cv2.MORPH_BLACKHAT表示影像底帽或黑帽運算
- kernel表示卷積核,可以用numpy.ones()函式構建
Python實現影像底帽運算的程式碼如下所示:
# -*- coding: utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('test02.png', cv2.IMREAD_UNCHANGED) #設定卷積核 kernel = np.ones((10, 10), np.uint8) #影像黑帽運算 result = cv2.morphologyEx(src, cv2.MORPH_BLACKHAT, kernel) #顯示影像 cv2.imshow("src", src) cv2.imshow("result", result) #等待顯示 cv2.waitKey(0) cv2.destroyAllWindows()
其執行結果如圖9所示:
三.總結
該系列主要講解了影像數學形態學知識,結合原理和程式碼詳細介紹了影像腐蝕、影像膨脹、影像開運算和閉運算、影像頂帽運算和影像底帽運算等操作。這篇文章詳細介紹了頂帽運算和底帽運算,它們將為後續的影像分割和影像識別提供有效支撐。
參考文獻:
- [1]岡薩雷斯著,阮秋琦譯. 數字影像處理(第3版)[M]. 北京:電子工業出版社,2013.
- [2]阮秋琦. 數字影像處理學(第3版)[M]. 北京:電子工業出版社,2008.
- [3]毛星雲,冷雪飛. OpenCV3程式設計入門[M]. 北京:電子工業出版社,2015.
- [4]Eastmount. [Python影像處理] 八.影像腐蝕與影像膨脹[EB/OL]. (2018-10-31). https://blog.csdn.net/Eastmount/article/details/83581277.