字典樹(字首樹)簡單實現

無荒111000發表於2020-11-15

什麼時字典樹

又稱單詞查詢樹,Trie樹,是一種樹形結構,是一種雜湊樹的變種。典型應用是用於統計,排序和儲存大量的字串(但不僅限於字串),所以經常被搜尋引擎系統用於文字詞頻統計。它的優點是:利用字串的公共字首來減少查詢時間,最大限度地減少無謂的字串比較,查詢效率比雜湊樹高。

基本操作

查詢、插入、刪除(此段程式碼沒有實現刪除)

實現

在每一個節點上不儲存資訊,把資訊儲存在邊(路徑)上。
在這裡插入圖片描述

如上圖所示將字串的狀態表示在節點之間的連線線上。

插入:

遍歷需要插入的字串,從樹的根節點開始查詢,是否存在當前邊,如果不存在則新建一條邊,然後指向下一個節點。如果存在直接指向下一個個節點。

查詢:

  • 查詢一個字串是否存在

    查詢一個字串是否存在需要在節點上封裝一個狀態,表示是否有字串已當前節點結尾。

    原因,假如我們向樹中插入一個字串“abcdefg”,然後查詢是否有“abc”的字串,也會查詢出來。

擴充套件:

  • 查詢是否有字串已這個字串開頭

    查詢是否有字串已這個字串開頭,只需看在這個樹中能否將這個字串走完

刪除:

刪除只需要將每條鏈上的狀態取消掉就行。

public class Trie {
    class TrieNode{
        TrieNode[] next; // 可以用 hash 實現跟複雜的狀態
        int end;

        public TrieNode() {
            next = new TrieNode[26];
            end = 0;
        }
    }

    TrieNode root;

    public Trie() {
        root = new TrieNode();
    }

    public void insert(String word) { // 插入
        int n = word.length();
        TrieNode p = root;
        for(int i = 0; i < n; i++){
            int ind = word.charAt(i) - 'a';
            if(p.next[ind] == null) p.next[ind] = new TrieNode(); // 如果不存在則新建一條邊
            p = p.next[ind]; // 指向下一個節點
        }
        p.end++;
    }

    public boolean search(String word) { // 查詢
        int n = word.length();
        TrieNode p = root;
        for(int i = 0; i < n; i++){
            int ind = word.charAt(i) - 'a';
            if(p.next[ind] == null) return false;
            p = p.next[ind];
        }
        return p.end > 0;
    }
}

相關文章