如何用 30s 給面試官講清楚跳錶

飛天小牛肉發表於2022-12-15

原文網址 : https://www.cnblogs.com/cswiki/p/16984525.html

面試

查詢

假設有如下這樣一個有序連結串列：

想要查詢 24、43、59，按照順序遍歷，分別需要比較的次數為 2、4、6

目前查詢的時間複雜度是 O(N)，如何提高查詢效率？

很容易想到二分查詢，將查詢的時間複雜度降到 O(LogN)

具體來說，我們把連結串列中的一些節點提取出來，作為索引，類似於二叉搜尋樹，得到如下結構：

這裡我們把 10、30、50、80 提取出來作為一級索引，這樣搜尋的時候就可以使用二分查詢來減少比較次數了。

我們還可以再從一級索引提取一些元素出來，作為二級索引，變成如下結構：

比如如果想要查詢 59，那麼搜尋路徑就是下面這樣的：

回顧下連結串列的定義：

class ListNode {
    private int val;
	private ListNode next;
    
    public ListNode(int val) {
        this.val = val;
        this.next = null;
    }
}

我們在每一個節點的基礎上新增一個 down 指標，用來指向下一層的節點

class Node {
    private int val;
	private ListNode next;
    private ListNode down;
    
    public ListNode(int val) {
        this.val = val;
        this.next = null;
        this.down = null;
    }
}

這樣，一個最簡單的跳錶節點就定義出來了。

我們這裡說的只是最簡單的實現，像比如 Redis 的跳錶實現和我們說的還是有所不同的，當然了，思想都是一致的

所以跳錶是什麼？簡單來說，跳錶就是支援二分查詢的有序連結串列

具體的搜尋演算法如下：

/* 如果存在 x, 返回 x 所在的節點， 否則返回 x 的後繼節點 */  
private Node find(x)  {  
    p = top;  
    while (true) {  
        while (p.next.val < x){
            p = p.next;
        }
        if (p.down == null){
            return p.next;  
        }
        p = p.down;  
    }
    return null;
}

插入

關於插入，大家可能很容易想到往最下面一層的有序連結串列中新增資料，但是索引該咋辦？索引要不要更新呢？

如果不更新索引，就可能出現兩個索引節點之間資料非常多的情況，極端情況下跳錶就會退化為單連結串列，從而使得查詢效率從 O(LogN) 退化為 O(N)。

所以，我們在插入資料的時候，索引節點也需要相應的改變來避免查詢效率的退化

比較容易想到的做法就是完全重建索引，我們每次插入資料後，都把這個跳錶的索引刪掉全部重建。因為索引的空間複雜度是 O(N)，即：索引節點的個數是 O(N) 級別，每次完全重新建一個 O(N) 級別的索引，時間複雜度也是 O(N) 。造成的後果是：為了維護索引，導致每次插入資料的時間複雜度變成了 O(N)。

那有沒有其他效率比較高的方式來維護索引呢？

最理想的索引就是在原始連結串列中每隔一個元素抽取一個元素做為一級索引。換種說法，我們在原始連結串列中【隨機】的選 n/2 個元素做為一級索引是不是也能透過索引提高查詢的效率呢？

當然可以，因為一般隨機選的元素相對來說都是比較均勻的。如下圖所示，隨機選擇了 n/2 個元素做為一級索引，雖然不是每隔一個元素抽取一個，但是對於查詢效率來講，影響不大，比如我們想找元素 16，仍然可以透過一級索引，使得遍歷路徑較少了將近一半。

當然了，如果抽取的一級索引的元素恰好是前一半的元素 1、3、4、5、7、8，那麼查詢效率確實沒有提升，但是這樣的機率太小了。所以我們可以認為：當原始連結串列中元素數量足夠大，且抽取足夠隨機的話，我們得到的索引是均勻的。所以，我們可以維護一個這樣的索引：隨機選 n/2 個元素做為一級索引、隨機選 n/4 個元素做為二級索引、隨機選 n/8 個元素做為三級索引，依次類推，一直到最頂層索引。這裡每層索引的元素個數已經確定，且每層索引元素選取的足夠隨機，所以可以透過索引來提升跳錶的查詢效率。

那程式碼具體該如何實現，使得在每次新插入元素的時候，儘量讓該元素有 1/2 的機率建立一級索引、1/4 的機率建立二級索引、1/8 的機率建立三級索引....呢？

其實很簡單啦，搞一個機率演算法就行了（具體是怎麼個機率法這裡就不詳細解釋了），當每次有資料要插入時，先透過機率演算法告訴我們這個元素需要插入到幾級索引中，然後開始維護索引並把資料插入到原始連結串列中。

如下所示，插入新元素 12，假設機率演算法返回的結果是 4，表示新元素需要插入到 4 級索引中，同時，我們還需要建立 3 級索引、2 級索引和 1 級索引（也就是原始有序連結串列）

那插入資料時維護索引的時間複雜度是多少呢？

跳錶中，每一層索引都是一個有序的單連結串列，元素插入到單連結串列的時間複雜度為 O(1)，我們索引的高度最多為 LogN，當插入一個元素 x 時，最壞的情況就是元素 x 需要插入到每層索引中，所以插入資料的最壞時間複雜度是 O(LogN)，最好的時間複雜度是 O(1)。

刪除

跳錶刪除資料時，要把索引中對應節點也要刪掉。如下圖所示，如果要刪除元素 8，需要把原始連結串列中的 8 和第 2、3 級索引的 8 都刪除掉。

刪除元素的過程跟查詢元素的過程類似，只不過在查詢的路徑上如果發現了要刪除的元素 x，則執行刪除操作。

跳錶中，每一層索引都是一個有序的單連結串列，單連結串列刪除元素的時間複雜度為 O(1)，最多需要刪除 LogN 個元素（索引層數為 LogN），所以刪除元素的總時間包 = 查詢元素的時間 + 刪除 LogN 個元素的時間 = O(LogN ) + O(LogN ) = 2O(LogN )，忽略常數部分，刪除元素的時間複雜度為 O(LogN)。

小夥伴們大家好呀，本文首發於公眾號@飛天小牛肉，阿里雲 & InfoQ 簽約作者，分享大廠面試原創高質量題解、原創技術幹活和成長經驗~）

如何用 30s 給面試官講清楚什麼是 Token
2023-01-11
面試
用萬字給面試官講清楚了hello world
2020-12-27
面試
【Nginx】面試官：給我講講Nginx如何實現四層負載均衡？
2020-09-06
Nginx面試負載
面試官：如何用LinkedHashMap實現LRU
2019-08-16
面試HashMap
我是如何用 ThreadLocal 虐面試官的？
2021-06-29
thread面試
為什麼使用訊息佇列？我這樣回答，面試官直說講得很清楚
2023-01-09
佇列面試
三面阿里，面試官:講講分散式的CAP定理
2019-05-13
阿里面試分散式
對線面試官 | 位元組跳動一面
2022-02-05
面試
給面試官講明白：一致性Hash的原理和實踐
2019-08-12
面試
太刺激了，面試官讓我手寫跳錶，而我用兩種實現方式吊打了TA！
2020-09-08
面試
以後有面試官問你跳躍表，你就把這篇文章扔給他
2019-05-20
面試
以後有面試官問你「跳躍表」，你就把這篇文章扔給他
2019-02-13
面試
面試官：講講雪花演算法，越詳細越好
2021-11-15
面試演算法
跳錶
2019-01-30
面試位元組兩輪後被完虐，一份位元組跳動面試官給你的Android技術面試指南，請查收！
2020-10-13
面試Android
【面經】面試官：講講類的載入、連結和初始化？
2020-11-03
面試
【原創】面試官:講講mysql表設計要注意啥
2019-07-12
面試MySql
面試官：你講下介面防重放如何處理？
2024-06-10
面試
深入講解拉鍊表，還怕面試官問？
2021-09-09
面試
五險一金終於有人給講清楚了
2024-03-08
試著跳一下？講講遊戲中的“跳躍”
2019-12-05
遊戲
面試官：小夥子，能聊明白JMM給你SSP！我：嘚吧嘚吧一萬字，直接征服面試官！
2024-03-16
面試
跳錶實現
2020-12-13
面試官問：“在專案中用過多執行緒嗎？”你就把這個案例講給他聽！
2021-03-06
面試執行緒
如何給小學生講清楚ECC橢圓曲線加密
2018-12-29
加密
三次給你講清楚Redis之Redis是個啥
2021-04-08
Redis
面試28k職位，老鄉面試官從HashCode到HashMap給我講了一下午！「回家趕忙整理出1.6萬字的面試材料」
2020-08-23
面試HashMap
位元組跳動面試官這樣問有關字串的問題！！
2021-02-26
面試字串
面試官讓你講講Linux核心的競爭與併發，你該如何回答？
2020-12-26
面試Linux
面試中的老大難-mysql事務和鎖，一次性講清楚！
2020-08-13
面試MySql
操蛋的面試官
2019-01-25
面試
吊打面試官——redis
2020-11-26
面試Redis
去面試位元組跳動，有些話不吐不快！面試官最青睞的候選人標準！
2020-02-28
面試
面試官：講講Redis的五大資料型別？如何使用？（內含完整測試原始碼）
2020-09-24
面試Redis大資料資料型別原始碼
征服面試官：OkHttp 原理篇掌握這篇面試題彙總，吊打面試官！
2020-12-31
HTTP面試題
詢問面試官的面試問題
2022-04-19
面試
【高併發】面試官：講講高併發場景下如何優化加鎖方式？
2020-10-15
面試優化
【高併發】面試官：講講什麼是快取穿透？擊穿？雪崩？如何解決？
2020-09-13
面試快取穿透

如何用 30s 給面試官講清楚跳錶

查詢

插入

刪除

相關文章