opencv 學習之基於K近鄰的數字識別

秦城書生發表於2016-12-17

原文網址 : https://blog.csdn.net/u010477528/article/details/53707845

OpenCV

本文參考兩篇部落格，都對KNN思路做了詳細說明

(1) http://blog.csdn.net/wangyaninglm/article/details/17091901

(2) http://blog.csdn.net/xiaowei_cqu/article/details/23782561#

(3) http://download.csdn.net/download/hust_bochu_xuchao/9581796

個人對於K近鄰編碼實現的一點理解。主要基於第一篇，第三篇是將第一篇基於OpenCV2實現，可參考。

int trainsamples; 每類樣本數

int clesses; 樣本種類數

如數字識別，0-9計10個數字，則 clesses 為10，如果每個樣本庫中有100個樣本，如100個數字 0 樣本，則 trainsamples 為100.

Mat traindata; 儲存樣本資料

mat trainclass; 樣本標識

traindata = Mat(trainsamples*traincless, templet_w*templet_h);

trainclass = Mat(trainsamples*traincless, 1);

將所有樣本資料儲存在 traindata 中，每個樣本轉換為 1*(w*h) 型矩陣，且二值化處理成只有 0 和 1 兩種畫素值模式

trainclass 儲存每類樣本標識，在 traindata 賦值過程中賦值。如例 trainclass 為 1000*1 矩陣，那麼其前100行為0，最後100行為9

訓練直接呼叫 train() 函式即可

train(traindata, trainclass, Mat(), false, K);

Mat testimg; 待測資料

float result = CvKNearest::find_nearest(testimg, K)

上述為規模樣本採用K近鄰訓練識別的理解。

網上有一篇基於K近鄰的手寫字元識別，樣本是方形，實際中數字多為矩形。

第二篇部落格也同理

for (int i = 0; i < image.rows; ++i)
{  
	for (int j = 0; j < image.cols; ++j)
	{  
		const Mat sampleMat = (Mat_<float>(1,2) << i,j);  
		Mat response;  
		float result = knn.find_nearest(sampleMat,1);  
		if (result !=0)
		{  
			image.at<Vec3b>(j, i)  = green;  
		}  
		else    
		image.at<Vec3b>(j, i)  = blue;  
	}  
}

建立 512*512 大小的矩陣，生成10個樣本，實際為10對座標。

座標在0-256之間的，標籤為0，在256-512之間的，標籤為1.

將座標分類，非 0 類綠色，0 類藍色。

程式碼補充：

knnTest.h

#include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include <opencv2/ml/ml.hpp>

#include <iostream>

using namespace cv;
using namespace std;

class knnRec
{
public:
	knnRec();
	float digRec(Mat img);		//數字識別
	void  samTest();		//樣本訓練

private:
	char  folder[255];		//模板路徑
	int   sampl_num;		//每類樣本數
	int   class_num;		//樣本種類數
	Mat   trainData;		//樣本資料儲存矩陣
	Mat   trainClass;		//樣本類別儲存矩陣
	static const int K = 6;         //最大鄰居個數
	KNearest *	knn;
	void  getData();		//獲取樣本資料
	void  knnTrain();		//訓練
};

knnTest.cpp


#include "knnTest.h"

knnRec::knnRec()//建構函式
{
	sprintf(folder, "..\\pics\\Template\\");
	sampl_num = 10;	//訓練樣本，總共10個
	class_num = 10;	//暫時識別十個數字

	int samp_w = 14;	//模板的寬和高	
	int samp_h = 27;

	trainData.create(sampl_num*class_num, samp_w*samp_h, CV_32FC1);	//訓練資料的矩陣
	trainClass.create(sampl_num*class_num, 1, CV_32FC1);

	getData();
	knnTrain();
}

void knnRec::getData()
{
	char filepath[255];

	for (int i=0; i<class_num; i++)
	{
		for (int j=0; j<sampl_num; j++)
		{
			sprintf(filepath, "%s%d\\%d%d.bmp", folder, i,  i, j);

			Mat  sampl = imread(filepath, 0);
			if (sampl.empty())
			{
				printf("Error: Cant load image %s\n", filepath);
				return;
			}

			//將 MxN 矩陣 轉為 1x(MxN)
			Mat  templ = sampl.clone();
			sampl.release();
			sampl.create(1, templ.cols*templ.rows, CV_32FC1);
			//sampl 當前為1行，未初始化，templ 儲存 sampl 源資料
			float* data_sampl = sampl.ptr<float>(0);
			//確保模板均為二值圖，否則進行二值化
			for (int j = 0; j<templ.rows;  j++)
			{
				uchar * data_templ = templ.ptr<uchar>(j);
				for (int i = 0; i<templ.cols; i++)
				{
					if (data_templ[i] == 255) 
					{
						data_sampl[j*templ.rows + i] = 1;
					}
					else 
					{
						data_sampl[j*templ.rows + i] = 0;
					}
				}
			}

			//記錄模板資料
			float * data1 = trainData.ptr<float>(i*sampl_num+j);		//定位第 i 個類中第 j 個樣本
			float * data2 = sampl.ptr<float>(0);
			for (int k = 0; k < sampl.cols; k++)
			{
				data1[k] = data2[k];
			}

			//記錄模板標誌
			trainClass.at<float>(i*sampl_num+j, 0) = i;		//定位第 i 個類中第 j 個樣本，標為 i
		}
	}
}

void knnRec::knnTrain()
{    
	knn = new KNearest(trainData, trainClass, Mat(), false, K);
}

//數字識別，img 為數字區域
float knnRec::digRec(Mat src)
{	
	Mat knnImg; 
	knnImg.create(1, K, CV_32FC1);
		
	//處理輸入的影像
	Mat tmp = src.clone();
	src.release();
	src.create(1, tmp.cols*tmp.rows, CV_32FC1);
	float* data_src = src.ptr<float>(0);

	for (int j = 0; j<tmp.rows; j++)
	{
		uchar* data_tmp = tmp.ptr<uchar>(j);
		for (int i = 0; i<tmp.cols; i++)
		{
			if (data_tmp[i] == 255) 
			{
				data_src[j*tmp.rows + i] = 1;
			}
			else 
			{
					data_src[j*tmp.rows + i] = 0;
			}
		}
	}

	float result = knn->find_nearest(src, K, Mat(), knnImg, Mat());

	int checkNum = 0;
	for (int i = 0; i<K; i++)
	{
		if (knnImg.at<float>(0, i) == result)
		{
			checkNum++;
		}
	}
	float pre = 100 * ((float)checkNum / (float)K);

	return result;
}

說明：

呼叫之前，數字區域需完成處理，即完成裁剪、二值化等。

knnRec rec;

double result = rec.digRec(img);

機器學習——KNN（K近鄰）
2018-05-28
機器學習KNN
深度學習例項之基於mnist的手寫數字識別
2018-05-25
深度學習
機器學習——K近鄰演算法
2019-02-16
機器學習演算法
機器學習演算法之K近鄰演算法
2021-06-06
機器學習演算法
一看就懂的K近鄰演算法(KNN)，K-D樹，並實現手寫數字識別！
2019-08-02
演算法KNN
機器學習-K近鄰演算法-KNN
2024-04-27
機器學習演算法KNN
K近鄰模型
2024-03-11
模型
機器學習_K近鄰Python程式碼詳解
2018-10-03
機器學習Python
機器學習-11-k近鄰演算法
2020-10-29
機器學習演算法
Opencv學習筆記（3）---紙牌數字識別練習實踐專案
2020-09-24
OpenCV筆記
機器學習演算法（三）：K近鄰(k-nearest neighbors)初探
2020-12-21
機器學習演算法REST
[OpenCV實戰]1 基於深度學習識別人臉性別和年齡
2019-03-04
OpenCV深度學習
基於OPENCV的手勢識別技術
2020-12-11
OpenCV
opencv學習之基礎
2022-05-11
OpenCV
機器學習實戰筆記-k近鄰演算法
2018-07-17
機器學習筆記演算法
K近鄰演算法
2022-03-03
演算法
K - 近鄰演算法
2020-12-19
演算法
Pytorch 手寫數字識別深度學習基礎分享
2024-12-09
PyTorch深度學習
用定租問題學透機器學習的K近鄰演算法
2021-09-09
機器學習演算法
opencv python 基於KNN的手寫體識別
2019-02-16
OpenCVPythonKNN
opencv python 基於SVM的手寫體識別
2019-02-16
OpenCVPython
機器學習演算法——kNN（k-近鄰演算法）
2020-10-12
機器學習演算法KNN
k-近鄰演算法
2018-06-11
演算法
K近鄰演算法：機器學習萌新必學演算法
2020-10-30
演算法機器學習
基於OpenCV的車牌識別(Sobel、顏色定位)
2018-11-15
OpenCV
基於 OpenCv 和 Python 的手指識別及追蹤
2018-12-16
OpenCVPython
【實戰】基於OpenCV的水錶字元識別（OCR）
2020-06-13
OpenCV字元
【機器學習】手寫數字識別
2022-07-04
機器學習
機器學習實戰----k值近鄰演算法（Python語言）
2021-09-09
機器學習演算法Python
K-鄰近均值演算法
2020-10-08
演算法
機器學習演算法（九）: 基於線性判別模型的LDA手寫數字分類識別
2023-03-29
機器學習演算法模型LDA
OpenCV + sklearnSVM 實現手寫數字分割和識別
2024-06-17
OpenCV
【Get】用深度學習識別手寫數字
2018-10-19
深度學習
機器學習——KNN近鄰演算法
2020-11-04
機器學習KNN演算法
k近鄰演算法的實現：kd樹
2018-05-10
演算法
Action Recognition——基於深度學習的動作識別綜述
2018-12-12
深度學習
python學習之數字
2018-12-09
Python
分類演算法-k 鄰近演算法
2020-01-19
演算法
《手寫數字識別》神經網路學習筆記
2020-10-26
神經網路筆記

opencv 學習之 基於K近鄰的數字識別

相關文章

opencv 學習之基於K近鄰的數字識別