淺談演算法和資料結構（6）：符號表及其基本實現

發表於2014-11-03

前面幾篇文章介紹了基本的排序演算法，排序通常是查詢的前奏操作。從本文開始介紹基本的查詢演算法。

在介紹查詢演算法，首先需要了解符號表這一抽象資料結構，本文首先介紹了什麼是符號表，以及這一抽象資料結構的的API，然後介紹了兩種簡單的符號表的實現方式。

一符號表

在開始介紹查詢演算法之前，我們需要定義一個名為符號表（Symbol Table）的抽象資料結構，該資料結構類似我們再C#中使用的Dictionary，他是對具有鍵值對元素的一種抽象，每一個元素都有一個key和value，我們可以往裡面新增key，value鍵值對，也可以根據key來查詢value。在現實的生活中，我們經常會遇到各種需要根據key來查詢value的情況，比如DNS根據域名查詢IP地址，圖書館根據索引號查詢圖書等等：

為了實現這一功能，我們定義一個抽象資料結構，然後選用合適的資料結構來實現：

public class ST<Key, Value>

ST()	建立一個查詢表物件
void Put(Key key, Value val)	往集合中插入一條鍵值對記錄，如果value為空，不新增
Value Get(Key key)	根據key查詢value，如果沒找到返回null
void Delete(Key key)	刪除鍵為key的記錄
boolean Contains(Key key)	判斷集合中是否存在鍵為key的記錄
boolean IsEmpty()	判斷查詢表是否為空
int Size()	返回集合中鍵值對的個數
Iterable<Key> Keys()	返回集合中所有的鍵

二實現

1 使用無序連結串列實現查詢表

查詢表的實現關鍵在於資料結構的選擇，最簡單的一種實現是使用無序連結串列來實現，每一個節點記錄key值，value值以及指向下一個記錄的物件。

如圖，當我們往連結串列中插入元素的時候，從表頭開始查詢，如果找到，則更新value，否則，在表頭插入新的節點元素。

實現起來也很簡單：

public class SequentSearchSymbolTable&lt;TKey, TValue&gt; : SymbolTables&lt;TKey, TValue&gt; where TKey : IComparable&lt;TKey&gt;, IEquatable&lt;TKey&gt;
{
    private int length = 0;
    Node first;
    private class Node
    {
        public TKey key { get; set; }
        public TValue value { get; set; }
        public Node next { get; set; }

        public Node(TKey key, TValue value, Node next)
        {
            this.key = key;
            this.value = value;
            this.next = next;
        }
    }

    public override TValue Get(TKey key)
    {
        TValue result = default(TValue);
        Node temp = first;
        while (temp != null)
        {
            if (temp.key.Equals(key))
            {
                result = temp.value;
                break;
            }
            temp = temp.next;
        }

        return result;
    }

    public override void Put(TKey key, TValue value)
    {
        Node temp = first;
        while (temp != null)
        {
            if (temp.key.Equals(key))
            {
                temp.value = value;
                return;
            }
            temp = temp.next;
        }
        first = new Node(key, value, first);
        length++;
    }

    ....
}

public class SequentSearchSymbolTable<TKey, TValue> : SymbolTables<TKey, TValue> where TKey : IComparable<TKey>, IEquatable<TKey>

{

private int length = 0;

Node first;

private class Node

{

public TKey key { get; set; }

public TValue value { get; set; }

public Node next { get; set; }

public Node(TKey key, TValue value, Node next)

{

this.key = key;

this.value = value;

this.next = next;

}

public override TValue Get(TKey key)

{

TValue result = default(TValue);

Node temp = first;

while (temp != null)

{

if (temp.key.Equals(key))

{

result = temp.value;

break;

}

temp = temp.next;

}

return result;

}

public override void Put(TKey key, TValue value)

{

Node temp = first;

while (temp != null)

{

if (temp.key.Equals(key))

{

temp.value = value;

return;

}

temp = temp.next;

}

first = new Node(key, value, first);

length++;

}

....

}

分析：

從圖或者程式碼中分析可知，插入的時候先要查詢，如果存在則更新value，查詢的時候需要從連結串列頭進行查詢，所以插入和查詢的平均時間複雜度均為O(n)。那麼有沒有效率更好的方法呢，下面就介紹二分查詢。

2 使用二分查詢實現查詢表

和採用無序連結串列實現不同，二分查詢的思想是在內部維護一個按照key排好序的二維陣列，每一次查詢的時候，跟中間元素進行比較，如果該元素小，則繼續左半部分遞迴查詢，否則繼續右半部分遞迴查詢。整個實現程式碼如下：

class BinarySearchSymbolTable&lt;TKey, TValue&gt; : SymbolTables&lt;TKey, TValue&gt; where TKey : IComparable&lt;TKey&gt;, IEquatable&lt;TKey&gt;
{
    private TKey[] keys;
    private TValue[] values;
    private int length;
    private static readonly int INIT_CAPACITY = 2;
    public BinarySearchSymbolTable(int capacity)
    {
        keys = new TKey[capacity];
        values = new TValue[capacity];
        length = capacity;
    }
    public BinarySearchSymbolTable() : this(INIT_CAPACITY)
    {
    }
    /// &lt;summary&gt;
    /// 根據key查詢value。
    /// 首先查詢key在keys中所處的位置，如果在length範圍內，且存在該位置的值等於key，則返回值
    /// 否則，不存在
    /// &lt;/summary&gt;
    /// &lt;param name=&quot;key&quot;&gt;&lt;/param&gt;
    /// &lt;returns&gt;&lt;/returns&gt;
    public override TValue Get(TKey key)
    {
        int i = Rank(key);
        if (i &lt; length &amp;&amp; keys[i].Equals(key))
            return values[i];
        else
            return default(TValue);
    }

    /// &lt;summary&gt;
    /// 向符號表中插入key，value鍵值對。
    /// 如果存在相等的key，則直接更新value，否則將該key，value插入到合適的位置
    ///  1.首先將該位置往後的元素都往後移以為
    ///  2.然後再講該元素放到為i的位置上
    /// &lt;/summary&gt;
    /// &lt;param name=&quot;key&quot;&gt;&lt;/param&gt;
    /// &lt;param name=&quot;value&quot;&gt;&lt;/param&gt;
    public override void Put(TKey key, TValue value)
    {
        int i = Rank(key);
        if (i &lt; length &amp;&amp; keys[i].Equals(key))
        {
            values[i] = value;
            return;
        }
        //如果長度相等，則擴容
        if (length == keys.Length) Resize(2 * keys.Length);

        for (int j = length; j &gt; i; j--)
        {
            keys[j] = keys[j - 1];
            values[j] = values[j - 1];
        }

        keys[i] = key;
        values[i] = value;
        length++;
    }

    /// &lt;summary&gt;
    /// 返回key在陣列中的位置
    /// &lt;/summary&gt;
    /// &lt;param name=&quot;key&quot;&gt;&lt;/param&gt;
    /// &lt;returns&gt;&lt;/returns&gt;
    private int Rank(TKey key)
    {
        int lo = 0;
        int hi = length - 1;
        while (lo &lt;= hi)
        {
            int mid = lo + (hi - lo) / 2;
            if (key.CompareTo(keys[mid]) &gt; 0) lo = mid + 1;
            else if (key.CompareTo(keys[mid]) &lt; 0) hi = mid - 1;
            else return mid;
        }
        return lo;
    }
    。。。
}

class BinarySearchSymbolTable<TKey, TValue> : SymbolTables<TKey, TValue> where TKey : IComparable<TKey>, IEquatable<TKey>

{

private TKey[] keys;

private TValue[] values;

private int length;

private static readonly int INIT_CAPACITY = 2;

public BinarySearchSymbolTable(int capacity)

{

keys = new TKey[capacity];

values = new TValue[capacity];

length = capacity;

}

public BinarySearchSymbolTable() : this(INIT_CAPACITY)

{

}

/// <summary>

/// 根據key查詢value。

/// 首先查詢key在keys中所處的位置，如果在length範圍內，且存在該位置的值等於key，則返回值

/// 否則，不存在

/// </summary>

/// <param name="key"></param>

/// <returns></returns>

public override TValue Get(TKey key)

{

int i = Rank(key);

if (i < length && keys[i].Equals(key))

return values[i];

else

return default(TValue);

}

/// <summary>

/// 向符號表中插入key，value鍵值對。

/// 如果存在相等的key，則直接更新value，否則將該key，value插入到合適的位置

/// 1.首先將該位置往後的元素都往後移以為

/// 2.然後再講該元素放到為i的位置上

/// </summary>

/// <param name="key"></param>

/// <param name="value"></param>

public override void Put(TKey key, TValue value)

{

int i = Rank(key);

if (i < length && keys[i].Equals(key))

{

values[i] = value;

return;

}

//如果長度相等，則擴容

if (length == keys.Length) Resize(2 * keys.Length);

for (int j = length; j > i; j--)

{

keys[j] = keys[j - 1];

values[j] = values[j - 1];

}

keys[i] = key;

values[i] = value;

length++;

}

/// <summary>

/// 返回key在陣列中的位置

/// </summary>

/// <param name="key"></param>

/// <returns></returns>

private int Rank(TKey key)

{

int lo = 0;

int hi = length - 1;

while (lo <= hi)

{

int mid = lo + (hi - lo) / 2;

if (key.CompareTo(keys[mid]) > 0) lo = mid + 1;

else if (key.CompareTo(keys[mid]) < 0) hi = mid - 1;

else return mid;

}

return lo;

}

。。。

}

這裡面重點是Rank方法，我們可以看到首先獲取mid位置，然後將當前元素和mid位置元素比較，然後更新lo或者hi的位置用mid來替換，如果找到相等的，則直接返回mid，否則返回該元素在集合中應該插入的合適位置。上面是使用迭代的方式來實現的，也可以改寫為遞迴：

private int Rank(TKey key, int lo, int hi)
{
    if (lo &gt;= hi) return lo;

    int mid = lo + (hi - lo) / 2;
    if (key.CompareTo(keys[mid]) &gt; 0)
        return Rank(key, mid + 1, hi);
    else if (key.CompareTo(keys[mid]) &lt; 0)
        return Rank(key, lo, hi - 1);
    else
        return mid;
}

private int Rank(TKey key, int lo, int hi)

{

if (lo >= hi) return lo;

int mid = lo + (hi - lo) / 2;

if (key.CompareTo(keys[mid]) > 0)

return Rank(key, mid + 1, hi);

else if (key.CompareTo(keys[mid]) < 0)

return Rank(key, lo, hi - 1);

else

return mid;

}

二分查詢的示意圖如下：

分析：

使用有序的二維陣列來實現查詢表可以看出，採用二分查詢只需要最多lgN+1次的比較即可找到對應元素，所以查詢效率比較高。

但是對於插入元素來說，每一次插入不存在的元素，需要將該元素放到指定的位置，然後，將他後面的元素依次後移，所以平均時間複雜度O(n)，對於插入來說效率仍然比較低。

三總結

本文介紹了符號表這一抽象資料結構，然後介紹了兩種基本實現：基於無序連結串列的實現和基於有序陣列的實現，兩種實現的時間複雜度如下：

可以看到，使用有序陣列的二分查詢法提高了符號表的查詢速度，但是插入效率仍舊沒有得到提高，而且在要維護陣列有序，還需要進行排序操作。這兩種實現方式簡單直觀，但是無法同時達到較高查詢和插入效率。那麼有沒有一種資料結構既能夠在查詢的時候有較高的效率，在插入的時候也有較好的效率呢，本文只是一個引子，後面的系列文章將會介紹二叉查詢樹，平衡查詢樹以及雜湊表。

希望本文對您瞭解查詢表的基本概念以及兩種基本實現有所幫助。

資料結構與演算法——常用高階資料結構及其Java實現
2018-03-04
資料結構演算法Java
資料結構和演算法（一）線性表實現
2020-04-06
資料結構演算法
資料結構：線性表（Python實現基本操作）
2020-10-03
資料結構Python
淺談 Redis 資料結構
2019-04-21
Redis資料結構
資料結構c語言實現順序表基本操作
2019-01-27
資料結構C語言
資料結構與演算法--簡單棧實現及其應用
2020-12-04
資料結構演算法
【資料結構】淺談主席樹
2020-07-14
資料結構
資料結構和演算法-切片實現棧
2020-06-15
資料結構演算法
基本資料結構演算法
2018-10-11
資料結構演算法
資料結構和演算法的圖解和實現
2020-07-14
資料結構演算法圖解
PHPer 淺談 Python 的資料結構
2020-03-11
PHPPython資料結構
php實現基本資料結構之連結串列
2019-02-28
PHP資料結構
dotnet 6 使用 CreateSymbolicLink 建立資料夾符號連結
2021-11-09
Symbol符號
資料結構分析及其實現(Stack、Queue、Tree、LinkedList)
2019-03-01
資料結構
java基礎（二）：談談Java基本資料結構
2019-02-27
Java資料結構
JavaScript資料結構——字典和雜湊表的實現
2019-08-06
JavaScript資料結構
資料結構線性表的鏈式儲存結構（單連結串列）的表示及其基本操作
2020-10-31
資料結構
淺談資料結構最佳化DP
2024-10-30
資料結構
【演算法與資料結構專場】BitMap演算法基本操作程式碼實現
2018-09-23
演算法資料結構
資料結構和演算法-雜湊表 (HashTable)
2020-06-13
資料結構演算法
[資料結構與演算法]-排序演算法之插入排序(insertion sort)及其實現(Java)
2018-07-01
資料結構演算法排序Java
js實現資料結構及演算法之雜湊表(Hashtable)
2018-08-31
JS資料結構演算法
php實現基本資料結構之棧、佇列
2018-05-10
PHP資料結構佇列
《資料結構與演算法》——表、棧和佇列
2020-11-11
資料結構演算法佇列
資料結構和演算法(Golang實現)(25)排序演算法-快速排序
2020-04-18
資料結構演算法Golang排序
資料結構和演算法
2020-12-25
資料結構演算法
二分查詢實現符號表
2020-11-10
符號
棧的應用之平衡符號【資料結構與演算法分析 c 語言描述】
2018-12-26
符號資料結構演算法
【從蛋殼到滿天飛】JS 資料結構解析和演算法實現-雜湊表
2019-03-21
JS資料結構演算法
淺談網路架構及其演變
2019-03-23
架構
線性表及其演算法（java實現）
2019-01-19
演算法Java
基本資料結構實現--單連結串列【含測試程式碼】
2021-06-28
資料結構
基本資料結構實現--雙連結串列【含測試程式碼】
2021-06-29
資料結構
C++ 手撕--基本資料結構的簡單實現
2024-10-31
C++資料結構
＜資料結構＞靜態佇列基本功能實現
2020-10-30
資料結構佇列
資料結構和演算法-Go實現二叉搜尋樹
2020-08-20
資料結構演算法Go
資料結構基本概念和術語
2024-08-15
資料結構
資料結構-基本概念和術語
2018-10-09
資料結構
【資料結構】用C語言實現單連結串列及其常見操作
2024-03-30
資料結構C語言

淺談演算法和資料結構（6）：符號表及其基本實現

一符號表

二實現

1 使用無序連結串列實現查詢表

2 使用二分查詢實現查詢表

三 總結

相關文章

三總結