[雪峰磁針石部落格]python計算機視覺深度學習2影像基礎

書籍尋找發表於2018-10-17

構建自己的影像分類器之前需要了解影像是什麼。

畫素:影像的元素

畫素是影像的基本元素。每個影像都由一組畫素組成。沒有比畫素更細的粒度。

通常畫素是光的“顏色”或“強度”。

下圖的解析度為1,000×750,這意味著它是1,000畫素寬750畫素高。我們可以將影像概念化為(多維)矩陣。圖片中總共有1,000×750 = 750,000畫素。

image.png

大多數畫素以兩種方式表示:
1.灰度/單通道
2.顏色

在灰度影像中,每個畫素是0到255之間的標量值,其中零對應為“黑色”,255為“白色”。
image.png

彩色畫素通常在RGB顏色空間中表示(其他顏色空間通常要轉成RGB)。

image.png

黑色:(0, 0, 0)
紅色:(255, 0, 0)

RGB色彩空間的主要缺點包括:
•不使用“顏色選擇器”工具時表示顏色不直觀
•它不像人類看待顏色的方式。

image.png

image.png

影像座標系統

OpenCV和scikit-image用多維NumPy陣列表示RGB。

image.png

import cv2
image = cv2.imread("example.png")
print(image.shape)
cv2.imshow("Image", image)
cv2.waitKey(0)

執行結果:

$ python load_display.py
(248, 300, 3)

畫素訪問

(b, g, r) = image[20, 100] # accesses pixel at x=100, y=20
(b, g, r) = image[75, 25] # accesses pixel at x=25, y=75
(b, g, r) = image[90, 85] # accesses pixel at x=85, y=90

OpenCV的儲存順序:Blue, Green, Red

  • 技術支援qq群144081101 591302926 567351477 釘釘免費群:21745728

縮放

image.png

多數神經網路和卷積神經網路應用於影像任務分類要求固定大小的輸入,意味著你通過的所有影像的尺寸必須相同。輸入的寬度和高度影像尺寸的常見選擇卷積神經網路包括32×32,64×64,224×224,227×227,256×256和299×299。

image.png


相關文章