前幾節學習了「連結串列」、「時間與空間複雜度」的概念,本節將結合「迴圈連結串列」、「雙向連結串列」與 「用空間換時間的設計思想」來設計一個很有意思的快取淘汰策略:LRU快取淘汰演算法。
迴圈連結串列的概念
如上圖所示:單連結串列的尾結點指標指向空地址,表示這就是最後的結點了。而迴圈連結串列的尾結點指標是指向連結串列的頭結點。
因此**迴圈連結串列是一種特殊的單連結串列。**它跟單連結串列唯一的區別就在於尾結點。它像一個環一樣首尾相連,所以叫作「迴圈連結串列」。
迴圈連結串列的特點
和單連結串列相比,迴圈連結串列的優點是從鏈尾到鏈頭比較方便,當要處理的資料具有環型結構特點時,適合採用迴圈連結串列。
雙向連結串列概念
雙向連結串列也叫雙連結串列,是連結串列的一種,它的連結方向是雙向的,它的每個資料結點中都包含有兩個指標,分別指向直接後繼和直接前驅。
所以,從雙向連結串列中的任意一個結點開始,都可以很方便地訪問它的前驅結點和後繼結點。
雙向連結串列的資料結構中,會有兩個比較重要的引數: pre
和 next
。
pre
指向前一個資料結構next
指向下一個資料結構
雙向連結串列的特點
-
與單連結串列對比,雙連結串列需要多一個指標用於指向前驅節點,因此如果儲存同樣多的資料,雙向連結串列要比單連結串列佔用更多的記憶體空間
-
雙連結串列的插入和刪除需要同時維護 next 和 prev 兩個指標。
-
雙連結串列中的元素訪問需要通過順序訪問,支援雙向遍歷,這就是雙向連結串列操作的靈活性根本
雙向連結串列的基本操作
1.新增元素。
與單向連結串列相對比雙向連結串列可以在 O(1) 時間複雜度搞定,而單向連結串列需要 O(n) 的時間複雜度。
雙向連結串列的新增元素包括頭插法和尾插法。
**頭插法:**將連結串列的左邊稱為連結串列頭部,右邊稱為連結串列尾部。頭插法是將右邊固定,每次新增的元素都在左邊頭部增加。
**尾插法:**將連結串列的左邊稱為連結串列頭部,右邊稱為連結串列尾部。尾插法是將左邊固定,每次新增都在連結串列的右邊最尾部。
2.查詢元素
雙向連結串列的靈活處就是知道連結串列中的一個元素結構就可以向左或者向右開始遍歷查詢需要的元素結構。因此對於一個有序連結串列,雙向連結串列的按值查詢的效率比單連結串列高一些。因為,我們可以記錄上次查詢的位置 p,每次查詢時,根據要查詢的值與 p 的大小關係,決定是往前還是往後查詢,所以平均只需要查詢一半的資料。
3.刪除元素
在實際的軟體開發中,從連結串列中刪除一個資料無外乎這兩種情況:
-
刪除結點中“值等於某個給定值”的結點
-
刪除給定指標指向的結點
對於雙向連結串列來說,雙向連結串列中的結點已經儲存了前驅結點的指標,刪除時不需要像單連結串列那樣遍歷。所以,針對第二種情況,單連結串列刪除操作需要 O(n) 的時間複雜度,而雙向連結串列只需要在 O(1) 的時間複雜度。
雙向迴圈連結串列
如圖所示,雙向迴圈連結串列的概念很好理解:「雙向連結串列」 + 「迴圈連結串列」的組合。
快取淘汰策略
快取是一種提高資料讀取效能的技術,在硬體設計、軟體開發中都有著非常廣泛的應用,比如常見的 CPU 快取、資料庫快取、瀏覽器快取等等。
快取的大小有限,當快取被用滿時,哪些資料應該被清理出去,哪些資料應該被保留?這就需要快取淘汰策略來決定。常見的策略有三種:先進先出策略 FIFO(First In,First Out)、最少使用策略 LFU(Least Frequently Used)、最近最少使用策略 LRU(Least Recently Used)。
在各個語言的第三方框架中都大量使用到了 LRU 快取策略。程式設計師小吳接觸到的有Java中的 「 Mybatis 」,iOS中的 「YYCache」與「Lottie」等。
LRU快取淘汰演算法
LRU是最近最少使用策略的縮寫,是根據資料的歷史訪問記錄來進行淘汰資料,其核心思想是“如果資料最近被訪問過,那麼將來被訪問的機率也更高”。
連結串列實現LRU
將Cache的所有位置都用雙連結串列連線起來,當一個位置被命中之後,通過調整連結串列的指向,將該位置調整到連結串列頭的位置,新加入的Cache直接加到連結串列頭中。
這樣,在多次進行Cache操作後,最近被命中的,就會被向連結串列頭方向移動,而沒有命中的,而想連結串列後面移動,連結串列尾則表示最近最少使用的Cache。
當需要替換內容時候,連結串列的最後位置就是最少被命中的位置,我們只需要淘汰連結串列最後的部分即可。
連結串列實現LRU動畫演示
- 如果此資料之前已經被快取在連結串列中了,通過遍歷得到這個資料對應的結點,並將其從原來的位置刪除,然後再插入到連結串列的頭部。
- 如果此資料沒有在快取連結串列中,可以分為兩種情況:
- 如果此時快取未滿,則將此結點直接插入到連結串列的頭部;
- 如果此時快取已滿,則連結串列尾結點刪除,將新的資料結點插入連結串列的頭部。
通過動圖可以發現,如果快取空間足夠大,那麼儲存的資料也就足夠多,通過快取中命中資料的概率就越大,也就提高了程式碼的執行速度。這就是空間換時間的設計思想。
對於程式開發來說,時間複雜度和空間複雜度是可以相互轉化的。說通俗一點,就是:
-
對於執行的慢的程式,可以通過消耗記憶體(即構造新的資料結構)來進行優化;
-
而消耗記憶體的程式,可以通過消耗時間來降低記憶體的消耗。
本篇文章的動畫與動圖花了較多時間與精力去處理,如果讀者看完之後覺得有所收穫,煩請點一下 「贊」。
學習愉快:)