字串匹配KMP演算法初探

pengfoo發表於2012-09-05

先來看基本的串的匹配演算法。

給定一父串和一子串,判斷子串是否匹配父串,匹配則返回父串開始匹配處的座標,不匹配則返回-1.可配合下面的過程圖看程式碼:

#include <stdio.h>
#include <string.h>

int Index(char s[], char t[], int pos)//s存放父串,t放子串。
{
	int i,j,slen,tlen;//i,j代表遊標,分別指向父串和子串
	i = pos;//父串從pos位置開始
	j = 0;
	slen = strlen(s);
	tlen = strlen(t);

	while( i<slen && j<tlen)
	{
		if( s[i]==t[j] )
		{
			i++;
			j++;
		}
		else
		{
			i = i-j+1;//不能寫成i=1是因為pos不一定從0開始
			j = 0;
		}
	}

	if( j >= tlen)
		return i-tlen;//返回父串匹配子串開始點的下標
	else 
		return -1;//沒有匹配則返回-1
}
int main()
{
	char s[]="goodgoogle";
	char t[]="google";
	int index = Index(s,t,0);
	printf("%d\n",index);//應該返回4
	return 0;
}

KMP演算法:

參考:http://blog.sina.com.cn/s/blog_67947d740100nwwl.html

#include <stdio.h>
#include <string.h>

void GetNext(char t[],int next[])
{
	int i, j, tlen;
	tlen = strlen(t);
	i = 0;
	j = -1;
	next[0] = -1;
	while(i < tlen)
	{
		if((j == -1) || (t[i] == t[j]))
		{
			i++;
			j++;
			next[i] = j;
		}
		else
		{
			j = next[j];
		}
	}
}


int Index(char s[], char t[], int pos)//s存放父串,t放子串。
{
	int next[255];
	int i,j,slen,tlen;//i,j代表遊標,分別指向父串和子串
	i = pos;//父串從pos位置開始
	j = -1;
	
	slen = strlen(s);
	tlen = strlen(t);
	GetNext(t,next);

	while( i<slen && j<tlen)
	{
		if( j==-1 || s[i]==t[j] )
		{
			i++;
			j++;
		}
		else
		{
			j = next[j];
		}
	}

	if( j >= tlen)
		return i-tlen;//返回父串匹配子串開始點的下標
	else 
		return -1;//沒有匹配則返回-1
}

int main()
{
	
	int index;
	char s[]="goodgoogle";
	char t[]="ababaaaba";
		
	index = Index(s,t,0);
	printf("%d\n",index);//應該返回4

	return 0;
}



 

相關文章