前文傳送門:
「Python 影像處理 OpenCV (2):畫素處理與 Numpy 操作以及 Matplotlib 顯示影像」
「Python 影像處理 OpenCV (3):影像屬性、影像感興趣 ROI 區域及通道處理」
「Python 影像處理 OpenCV (4):影像算數運算以及修改顏色空間」
「Python 影像處理 OpenCV (5):影像的幾何變換」
「Python 影像處理 OpenCV (6):影像的閾值處理」
「Python 影像處理 OpenCV (7):影像平滑(濾波)處理」
「Python 影像處理 OpenCV (8):影像腐蝕與影像膨脹」
「Python 影像處理 OpenCV (9):影像處理形態學開運算、閉運算以及梯度運算」
「Python 影像處理 OpenCV (10):影像處理形態學之頂帽運算與黑帽運算」
「Python 影像處理 OpenCV (11):Canny 運算元邊緣檢測技術」
「Python 影像處理 OpenCV (12): Roberts 運算元、 Prewitt 運算元、 Sobel 運算元和 Laplacian 運算元邊緣檢測技術」
「Python 影像處理 OpenCV (13): Scharr 運算元和 LOG 運算元邊緣檢測技術」
「Python 影像處理 OpenCV (14):影像金字塔」
「Python 影像處理 OpenCV (15):影像輪廓」
直方圖
首先,第一個問題是什麼是直方圖?
直方圖這個應該都知道吧,不知道的話就是下面這玩意:
那麼影像灰度直方圖是什麼鬼?
直方圖是都是由橫縱座標組成的,而影像直方圖的橫座標 X 軸上表示的是畫素值(不總是從 0 到 255 的範圍),在縱座標 Y 軸上表示的相應畫素數。
所以,直方圖是可以對整幅圖的灰度分佈進行整體瞭解的圖示,通過直方圖我們可以對影像的對比度、亮度和灰度分佈等有一個直觀瞭解。
還沒看懂?簡單地說,就是把一幅影像中每一個畫素出現的次數都先統計出來,然後把每一個畫素出現的次數除以總的畫素個數,得到的就是這個畫素出現的頻率,然後再把畫素與該畫素出現的頻率用圖表示出來,就是灰度直方圖。
上面這張圖來自官方網站,在這張圖中,我們可以得到如下資訊:
- 左側區域顯示影像中較暗畫素的數量(左側的灰度級更趨近於 0 )。
- 右側區域則顯示明亮畫素的數量(右側的灰度級更趨近於 255)。
- 暗區域多於亮區域,而中間調的數量(中間值的畫素值,例如127附近)則非常少。
繪製直方圖
在繪製直方圖的時候,有兩種方法:
- 使用 Matplotlib 繪圖功能。
- 使用 OpenCV 繪圖功能。
使用 Matplotlib 繪圖
Matplotlib 帶有一個強大的直方圖繪圖功能:matplotlib.pyplot.hist()
,這個方法可以直接找到直方圖進行繪製。
在看示例程式碼之前,有兩個引數需要先介紹下:
- 資料來源:資料來源必須是一維陣列,通常需要通過函式
ravel()
拉直影像,而函式ravel()
的作用是將多維陣列降為一維陣列。 - 畫素級:一般是 256 ,表示 [0, 255] 。
程式碼實現:
import cv2 as cv
import matplotlib.pyplot as plt
img = cv.imread("maliao.jpg")
cv.imshow("img", img)
cv.waitKey(0)
cv.destroyAllWindows()
plt.hist(img.ravel(), 256, [0, 256])
plt.show()
輸出結果:
當然,我們除了可以繪製灰度直方圖以外,還可以繪製出 r,g,b
不同通道的直方圖,可以看下面的程式碼:
import cv2 as cv
import matplotlib.pyplot as plt
img = cv.imread("tiankong.jpg")
color = ('b', 'g', 'r')
cv.imshow("img", img)
cv.waitKey(0)
cv.destroyAllWindows()
for i, col in enumerate(color):
histr = cv.calcHist([img], [i], None, [256], [0, 256])
plt.plot(histr, color = col)
plt.xlim([0, 256])
plt.show()
使用 OpenCV 繪製直方圖
使用 OpenCV 繪製直方圖還是有點費勁兒的,首先我們確認橫座標是影像中各個畫素點的灰度級,縱座標是具有該灰度級的畫素個數。
接下來要介紹幾個新概念:
BINS:
在前面的直方圖中,我們顯示的是每個畫素值的畫素數,即從 0 到 255 。那麼現在會有一個問題,如果一個直方圖我並不想找到所有的畫素數量,而是取一定範圍內的畫素值,如:先找到 0 到 15 之間的畫素數,然後找到 16 到 31 之間,......, 240 到 255 之間的畫素數。
這樣,我們將這個直方圖分成了 16 個子部分,每個子部分的值就是其中所有畫素數的總和。每個子部分都稱為 BIN 。在第一種情況下, BIN 的數量為 256 個(每個畫素一個),而在第二種情況下, BIN 的數量僅為 16 個。
DIMS:
這是我們為其收集資料的引數的數量。在這種情況下,我們僅收集關於強度值的一件事的資料。所以這裡是1。
RANGE:
這是要測量的強度值的範圍。通常,它是 [0,256]
,即所有強度值。
使用 OpenCV 的繪製直方圖,我們會用到一個新的函式 calcHist()
,它的原函式如下:
def calcHist(images, channels, mask, histSize, ranges, hist=None, accumulate=None):
- 引數1:要計算的原圖,以方括號的傳入,如:[img]。
- 引數2:灰度圖寫[0]就行,彩色圖 B/G/R 分別傳入 [0]/[1]/[2] 。
- 引數3:要計算的區域ROI,計算整幅圖的話,寫None。
- 引數4:就是我們上面提到的 BINS ,子區段數目。
- 引數5:range,要計算的畫素值範圍,一般為 [0,256] 。
接下來我們開始畫圖,首先我們需要使用 calcHist()
來查詢整個影像的直方圖。
import cv2 as cv
import matplotlib.pyplot as plt
img = cv.imread("tiankong.jpg")
# 引數:原影像 通道[0]-B 掩碼 BINS為256 畫素範圍0-255
histB = cv.calcHist([img], [0], None, [256], [0, 255])
histG = cv.calcHist([img], [1], None, [256], [0, 255])
histR = cv.calcHist([img], [2], None, [256], [0, 255])
cv.imshow("img", img)
cv.waitKey(0)
cv.destroyAllWindows()
plt.plot(histB, color='b')
plt.plot(histG, color='g')
plt.plot(histR, color='r')
plt.show()
直方圖均衡化
一副效果好的影像通常在直方圖上的分佈比較均勻,直方圖均衡化就是用來改善影像的全域性亮度和對比度。
- 灰度圖均衡,直接使用
equalizeHist()
函式。 - 彩色圖均衡,分別在不同的通道均衡後合併。
示例程式碼如下:
import cv2 as cv
import numpy as np
img = cv.imread("dahai.jpg")
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
# 灰度圖均衡化
equ = cv.equalizeHist(gray)
# 水平拼接原圖和均衡圖
result1 = np.hstack((gray, equ))
cv.imwrite('grey_equ.png', result1)
# 彩色影像均衡化,需要分解通道 對每一個通道均衡化
(b, g, r) = cv.split(img)
bH = cv.equalizeHist(b)
gH = cv.equalizeHist(g)
rH = cv.equalizeHist(r)
# 合併每一個通道
equ2 = cv.merge((bH, gH, rH))
# 水平拼接原圖和均衡圖
result2 = np.hstack((img, equ2))
cv.imwrite('bgr_equ.png', result2)
結果:
自適應直方圖均衡
上面介紹的直方圖均值化是針對整幅圖片的,這樣有好處也有不好的地方,會導致一些圖片部位太亮,導致大部分細節丟失。如下面這兩張圖片:
直方圖均衡後,背景對比度確實得到了改善。但是在兩個影像中比較雕像的臉,由於亮度過高,丟失了大多數資訊。
因此,為了解決這個問題,引入了 自適應直方圖均衡 來解決這個問題。
它在每一個小區域內(預設 8×8 )進行直方圖均衡化。當然,如果有噪點的話,噪點會被放大,需要對小區域內的對比度進行了限制。
import cv2 as cv
import numpy as np
img = cv.imread('clahe_src.jpg', 0)
# 全域性直方圖均衡
equ = cv.equalizeHist(img)
# 自適應直方圖均衡
clahe = cv.createCLAHE(clipLimit = 2.0, tileGridSize = (8, 8))
cl1 = clahe.apply(img)
# 水平拼接三張影像
result1 = np.hstack((img, equ, cl1))
cv.imwrite('clahe_result.jpg', result1)
參考
https://blog.csdn.net/Eastmount/article/details/83758402
http://www.woshicver.com/FifthSection/4_10_1_直方圖-1:查詢,繪製,分析/