kmp演算法實現原理及簡單示例

侯凱的部落格發表於2014-09-18

以前看過kmp演算法，當時接觸後總感覺好深奧啊，抱著資料結構的數啃了一中午，最終才大致看懂，後來提起kmp也只剩下“奧，它是做模式匹配的”這點乾貨。最近有空，翻出來演算法導論看看，原來就是這麼簡單（下不說程式實現，思想很簡單）。

模式匹配的經典應用：從一個字串中找到模式字串的位置。如“abcdef”中“cde”出現在原串第三個位置。從基礎看起

樸素的模式匹配演算法

A：abcdefg B：cde

首先B從A的第一位開始比較，B++==A++，如果全部成立，返回即可；如果不成立，跳出，從A的第二位開始比較，以此類推。

/*
 *侯凱,2014-9-16
 *功能：模式匹配
 */
#include<iostream>
#include <string>
using namespace std;

int index(char *a,char *b)
{
    int tarindex = 0;
    while(a[tarindex]!='\0')
    {
        int tarlen = tarindex;
        int patlen;
        for(patlen=0;b[patlen]!='\0';patlen++)
        {
            if(a[tarlen++]!=b[patlen])
            {
                break;
            }
        }
        if(b[patlen]=='\0')
        {
            return tarindex;
        }
        tarindex++;
    }
    return -1;
}
int main()
{
    char *a = "abcdef";
    char *b = "cdf";
    cout<<index(a,b)<<endl;
      system("Pause");
}

思路樸實無華，十分有效，但是時間複雜度是O(mn)，m、n分別是字串和模式串的長度。模式匹配是一個常見的應用問題，用的廣了，就有人想法去優化了。Rabin-Karp演算法、有限自動機等等，前仆後繼，最終出現了KMP(Knuth-Morris-Pratt)演算法。

kmp演算法

優化的地方：如果我們知道模式中a和後面的是不相等的，那麼第一次比較後，發現後面的的4個字元均對應相等，可見a下次匹配的位置可以直接定位到f了。說明主串對應位置i的回溯是不必要的。這是kmp最基本最關鍵的思想和目標。

再比如：

由於abc 與後面的abc相等，可以直接得到紅色的部分。而且根據前一次比較的結果，abc就不需要比較了，現在只需從f-a處開始比較即可。說明主串對應位置i的回溯是不必要的。要變化的是模式串中j的位置（j不一定是從1開始的，比如第二個例子）

j的變化取決於模式串的前字尾的相似度，例2中abc和abc（靠近x的），字首為abc，j=4開始執行。

j是前一次執行的模式子串（前幾個，上例為6）中字首的個數+1；它與模式字串中從前向後的字首和從後向前的字尾的相同子串是有關係的，因為下次這部分相同的字首就會移動到這部分字尾的位置，因為如果移動到字尾的前面位置，看圖：

所以如果這次是j，下次的位置應該就是j前面的子串的最大字首的長度+1,用這個新的位置再和原字串的i位置進行比較就很幸福了。

這次是j，下次到底是多少呢，這就涉及到怎麼計算的問題了？其實只看模式串我們就可以構建出這個j->x的關係，關係稱為字首函式，結果儲存在陣列中，稱為字首陣列。

虛擬碼：

compiter-prefix-function(P)
    m<-length[p]
    pi[1]<-0
    k<-0
    for q<-2 to m
        do while k>0 and P[k+1]!=P[q]
                    do k<-pi[k] //字首的字首...
           if P[k+1]==P[q]
                    then k<-k+1
           pi[q]<-k
    return pi

使用字首陣列可很快地實現模式匹配，程式匹配字串中模式出現的所有位置。

kmp-matcher(T, P)
    n<-length[T]
    m<-length[P]
    pi<-compiter-prefix-function(P)
    q<-0
    for i<-1 to n
        do while q>0 and P[q+1]!=T[i]
            do q<-pi[q] //字首的字首...
        if P[q+1]==T[i]
            then q<-q+1
        if q==m
            then print “Pattern occurs with shift”i-m
                    q<-pi[q]

這兩段程式碼思想完全相同,如果和字首不同就比較字首的字首…，比較巧妙。如果kmp有難理解的地方，估計就是這段偽碼的了。

KMP演算法的時間複雜度為O(n+m)。

這裡需要強調一下，KMP演算法的僅當模式與主串之間存在很多部分匹配情況下才能體現它的優勢，部分匹配時KMP的i不需要回溯，否則和樸素模式匹配沒有什麼差別。

vue 實現原理及簡單示例實現
2020-09-11
Vue
MapReduce原理及簡單實現
2021-02-21
async/await 原理及簡單實現
2019-05-08
AI
js拖拽原理及簡單實現(渣渣自學)
2020-09-10
JS
透過簡單示例瞭解執行緒池實現原理
2024-10-12
執行緒
簡單實現vuex原理
2018-10-25
Vue
KMP演算法 Java實現
2024-04-17
KMP演算法Java
Svm演算法原理及實現
2019-02-25
演算法
Redux 原理和簡單實現
2021-05-28
Redux
簡單的實現vue原理
2018-10-25
Vue
簡單的實現React原理
2018-10-25
React
【Tomcat】Tomcat工作原理及簡單模擬實現
2019-03-15
Tomcat
shell的圖形化實現簡單示例
2016-11-03
圖解 KMP 演算法（JavaScript 實現）
2014-09-11
圖解KMP演算法JavaScript
單頁面路由原理及實現
2018-08-27
路由
防抖原理以及簡單實現
2019-10-09
簡單、好懂的Svelte實現原理
2021-11-12
簡單介紹numpy實現RNN原理實現
2021-04-12
RNN
POJ3461-KMP演算法的簡單運用
2014-07-06
KMP演算法
單點登入原理與簡單實現
2016-12-01
Spark Streaming簡單入門（示例+原理）
2022-07-12
Spark
Kafka實戰－簡單示例
2015-06-01
Kafka
Java NIO原理及簡單拷貝實列
2019-04-19
Java
kmp 演算法簡介及 next 陣列推導
2018-05-02
KMP演算法陣列
CRC演算法原理、推導及實現
2024-08-16
演算法
virtual-dom原理與簡單實現
2019-03-04
vitual-dom原理與簡單實現
2017-12-01
Promise的使用及簡單實現
2018-05-29
Promise
A*演算法的簡單實現薦
2012-02-28
演算法
簡單實現類似Spring的Aop原理實現
2017-04-23
Spring
Docker(3)：Dockerfile介紹及簡單示例
2019-01-21
Docker
蟻群演算法原理及Matlab實現
2019-09-19
演算法Matlab
HMAC-MD5演算法原理及實現
2008-12-22
Mac演算法
簡單介紹Go 字串比較的實現示例
2022-02-11
Go字串
單模式匹配 KMP 演算法簡易版學習筆記
2024-10-19
模式KMP演算法筆記
視覺單目測距原理及實現
2024-03-14
視覺
自己簡單實現Spring的IOC原理
2017-04-20
Spring
Vue響應式原理以及簡單實現
2017-12-15
Vue

kmp演算法實現原理及簡單示例

相關文章