opencv python 基於KNN的手寫體識別

sakurala發表於2019-02-16

原文網址 : https://flycode.co/archives/79563

OCR of Hand-written Digits

我們的目標是構建一個可以讀取手寫數字的應用程式, 為此，我們需要一些train_data和test_data. OpenCV附帶一個images digits.png（在資料夾opencvsourcessamplesdata中），它有5000個手寫數字（每個數字500個,每個數字是20×20影像）.所以首先要將圖片切割成5000個不同圖片,每個數字變成一個單行400畫素.前面的250個數字作為訓練資料，後250個作為測試資料.

import numpy as np
import cv2
import matplotlib.pyplot as plt

img = cv2.imread(`digits.png`)
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# Now we split the image to 5000 cells, each 20x20 size
cells = [np.hsplit(row,100) for row in np.vsplit(gray,50)]

# Make it into a Numpy array. It size will be (50,100,20,20)
x = np.array(cells)

# Now we prepare train_data and test_data.
train = x[:,:50].reshape(-1,400).astype(np.float32) # Size = (2500,400)
test = x[:,50:100].reshape(-1,400).astype(np.float32) # Size = (2500,400)

# Create labels for train and test data
k = np.arange(10)
train_labels = np.repeat(k,250)[:,np.newaxis]
test_labels = train_labels.copy()

# Initiate kNN, train the data, then test it with test data for k=1
knn = cv2.ml.KNearest_create()
knn.train(train, cv2.ml.ROW_SAMPLE, train_labels)
ret,result,neighbours,dist = knn.findNearest(test,k=5)

# Now we check the accuracy of classification
# For that, compare the result with test_labels and check which are wrong
matches = result==test_labels
correct = np.count_nonzero(matches)
accuracy = correct*100.0/result.size
print( accuracy )

輸出：91.76

進一步提高準確率的方法是增加訓練資料,特別是錯誤的資料.每次訓練時最好是儲存訓練資料,以便下次使用.

# save the data
np.savez(`knn_data.npz`,train=train, train_labels=train_labels)

# Now load the data
with np.load(`knn_data.npz`) as data:
    print( data.files )
    train = data[`train`]
    train_labels = data[`train_labels`]

OCR of English Alphabets

在opencv / samples / data /資料夾中附帶一個資料檔案letter-recognition.data.在每一行中,第一列是一個字母表,它是我們的標籤. 接下來的16個數字是它的不同特徵.

import numpy as np
import cv2
import matplotlib.pyplot as plt


# Load the data, converters convert the letter to a number
data= np.loadtxt(`letter-recognition.data`, dtype= `float32`, delimiter = `,`,
                    converters= {0: lambda ch: ord(ch)-ord(`A`)})

# split the data to two, 10000 each for train and test
train, test = np.vsplit(data,2)

# split trainData and testData to features and responses
responses, trainData = np.hsplit(train,[1])
labels, testData = np.hsplit(test,[1])

# Initiate the kNN, classify, measure accuracy.
knn = cv2.ml.KNearest_create()
knn.train(trainData, cv2.ml.ROW_SAMPLE, responses)
ret, result, neighbours, dist = knn.findNearest(testData, k=5)

correct = np.count_nonzero(result == labels)
accuracy = correct*100.0/10000
print( accuracy )

輸出：93.06

opencv python 基於SVM的手寫體識別
2019-02-16
OpenCVPython
基於OPENCV的手勢識別技術
2020-12-11
OpenCV
基於 OpenCv 和 Python 的手指識別及追蹤
2018-12-16
OpenCVPython
計算機視覺—kNN識別手寫數字（10）
2018-06-04
計算機視覺KNN
【opencv3】 svm實現手寫體與人臉識別
2018-11-30
OpenCV
KNN 演算法-實戰篇-如何識別手寫數字
2020-12-03
KNN演算法
基於OpenCV的車牌識別(Sobel、顏色定位)
2018-11-15
OpenCV
【實戰】基於OpenCV的水錶字元識別（OCR）
2020-06-13
OpenCV字元
OpenCV + sklearnSVM 實現手寫數字分割和識別
2024-06-17
OpenCV
torch--minst手寫體識別
2024-10-06
基於滴滴雲 GPU 實現簡單 MINIST 手寫識別
2019-02-15
GPU
深度學習例項之基於mnist的手寫數字識別
2018-05-25
深度學習
基於百度雲的OCR識別（Python）
2019-07-05
Python
雲脈文件雲識別APP：輕鬆識別潦草手寫體
2021-01-18
APP
OpenCV-Python 人臉眼睛嘴識別
2018-11-13
OpenCVPython
基於python + opencv的影片播放調節功能
2021-07-30
PythonOpenCV
基於OpenCV+dlib開發一個人臉識別應用
2019-09-05
OpenCV
keras框架下的深度學習（一）手寫體識別
2021-10-20
Keras框架深度學習
手寫識別 b友
2024-05-31
基於深度學習的手勢識別系統（Python程式碼，UI介面版）
2022-04-18
深度學習PythonUI
【摸魚神器】基於python的BOSS識別系統
2022-05-05
Python
[OpenCV實戰]1 基於深度學習識別人臉性別和年齡
2019-03-04
OpenCV深度學習
使用 OpenCV-Python 識別答題卡判卷
2021-12-22
OpenCVPython
學習Pytorch+Python之MNIST手寫字型識別
2021-10-21
PyTorchPython
基於OCaml的識別程式
2024-11-05
手寫的文字圖片怎樣使用OCR軟體識別？
2021-09-09
python基於opencv 實現影像時鐘
2021-01-05
PythonOpenCV
C#+OpenCV進階(一)_人體識別
2024-07-11
C#OpenCV
opencv 人臉識別
2018-11-21
OpenCV
Pytorch 手寫數字識別深度學習基礎分享
2024-12-09
PyTorch深度學習
手把手教你使用LabVIEW OpenCV DNN實現手寫數字識別（含原始碼）
2022-09-30
ViewOpenCVDNN原始碼
基於OpenCV和Python的車牌提取和字元分割
2020-09-25
OpenCVPython字元
谷歌推出基於AI的開源手勢識別演算法，可識別單手21個骨骼點
2019-08-21
谷歌AI演算法
機器學習演算法（九）: 基於線性判別模型的LDA手寫數字分類識別
2023-03-29
機器學習演算法模型LDA
【TensorFlow2.0】LeNet進行手寫體數字識別
2020-10-19
在PaddlePaddle上實現MNIST手寫體數字識別
2018-03-29
一看就懂的K近鄰演算法(KNN)，K-D樹，並實現手寫數字識別！
2019-08-02
演算法KNN
【專案】Python人臉識別（GUI介面）—— 基於pyopencv
2022-10-26
PythonGUIOpenCV

opencv python 基於KNN的手寫體識別

OCR of Hand-written Digits

OCR of English Alphabets

相關文章