如今深度學習的快速發展給計算機視覺注入了前所未有的新活力!其中在計算機圖形學和計算機視覺裡面最流行的一個庫就是 OpenCV。OpenCV 在自動駕駛和仿生機器人當中的應用非常廣泛。
而在 2018 年 11 月份,OpenCV 通過 GITHUB 正式釋出了 OpenCV 又一個重要里程碑版本 OpenCV 4.0。
今天給大家推薦一個乾貨滿滿的 GitHub 專案。該專案包含了 CV 領域,OpenCV 影象處理入門 100 題例項解析,並配備完整的 Pyhon 程式碼。
專案地址:
https://github.com/yoyoyo-yo/Gasyori100knock
極簡安裝:
作者推薦了 OpenCV 的極簡安裝方法:
1.安裝 MiniConda
地址:https://conda.io/miniconda.html
2.建立虛擬環境並啟用
$ conda create python = 3.6 - n gasyori 100
$ source actiavte gasyori 100
3.安裝包
$ pip install -r requirement.txt
其中,requirement.txt 檔案在專案根目錄下,下載至命令列所在目錄直接執行上述命令即可。
100 題例項:
作者寫的 OpenCV 100 題按照從簡單到複雜逐一解析,非常適合我們的學習路徑。
例如 Q1-10:
我們首先來看一個簡單的例子。
Q1. 讀取影象並按 BGR 順序更改 RGB
import cv2
# Read image
img = cv2.imread("imori.jpg")
b = img[:, :, 0].copy()
g = img[:, :, 1].copy()
r = img[:, :, 2].copy()
# RGB > BGR
img[:, :, 0] = r
img[:, :, 1] = g
img[:, :, 2] = b
# Save result
cv2.imwrite("out.jpg", img)
cv2.imshow("result", img)
cv2.waitKey(0)
cv2.destroyAllWindows()
例如 Q41-50:
我們來看一個稍微複雜的例子。
Q41. Canny邊緣檢測(步驟1)邊緣強度
import cv2
import numpy as np
import matplotlib.pyplot as plt
# Read image
img = cv2.imread("imori.jpg").astype(np.float32)
H, W, C = img.shape
# Gray
gray = 0.2126 * img[..., 2] + 0.7152 * img[..., 1] + 0.0722 * img[..., 0]
# Gaussian Filter
K_size = 5
sigma = 1.4
## Zero padding
pad = K_size // 2
gau = np.zeros((H + pad*2, W + pad*2), dtype=np.float32)
#gau[pad:pad+H, pad:pad+W] = gray.copy().astype(np.float32)
gau = np.pad(gray, (pad, pad), 'edge')
tmp = gau.copy()
## Kernel
K = np.zeros((K_size, K_size), dtype=np.float32)
for x in range(-pad, -pad+K_size):
for y in range(-pad, -pad+K_size):
K[y+pad, x+pad] = np.exp( -(x**2 + y**2) / (2* (sigma**2)))
K /= (sigma * np.sqrt(2 * np.pi))
K /= K.sum()
for y in range(H):
for x in range(W):
gau[pad+y, pad+x] = np.sum(K * tmp[y:y+K_size, x:x+K_size])
## Sobel vertical
KSV = np.array(((-1., -2., -1.), (0., 0., 0.), (1., 2., 1.)), dtype=np.float32)
## Sobel horizontal
KSH = np.array(((-1., 0., 1.), (-2., 0., 2.), (-1., 0., 1.)), dtype=np.float32)
gau = gau[pad-1:H+pad+1, pad-1:W+pad+1]
fy = np.zeros_like(gau, dtype=np.float32)
fx = np.zeros_like(gau, dtype=np.float32)
K_size = 3
pad = K_size // 2
for y in range(H):
for x in range(W):
fy[pad+y, pad+x] = np.sum(KSV * gau[y:y+K_size, x:x+K_size])
fx[pad+y, pad+x] = np.sum(KSH * gau[y:y+K_size, x:x+K_size])
fx = fx[pad:pad+H, pad:pad+W]
fy = fy[pad:pad+H, pad:pad+W]
# Non-maximum suppression
edge = np.sqrt(np.power(fx, 2) + np.power(fy, 2))
fx[fx == 0] = 1e-5
tan = np.arctan(fy / fx)
## Angle quantization
angle = np.zeros_like(tan, dtype=np.uint8)
angle[np.where((tan > -0.4142) & (tan <= 0.4142))] = 0
angle[np.where((tan > 0.4142) & (tan < 2.4142))] = 45
angle[np.where((tan >= 2.4142) | (tan <= -2.4142))] = 95
angle[np.where((tan > -2.4142) & (tan <= -0.4142))] = 135
out = angle.astype(np.uint8)
# Save result
cv2.imwrite("out.jpg", out)
cv2.imshow("result", out)
cv2.waitKey(0)
cv2.destroyAllWindows()
專案特色:
該專案最大的特色就是 100 題循序漸進,基本涵蓋了 OpenCV 的關鍵知識點,目前已經更新了前 60 題,後續的會陸續釋出。
唯一的缺點是專案語言是日語,稍有不便。但是問題不大,筆者推薦一個方法,可以使用谷歌瀏覽器自動翻譯網頁即可。而且,所有的程式碼都是英文的,不妨礙理解。
如果你正在入門 CV,正在學習 OpenCV,那麼這個專案將會是一個不錯的從入門到進階的教程。上手程式碼,親自跑一跑結果,希望對大家有所幫助!