15天玩轉redis —— 第六篇 有序集合型別

一線碼農發表於2015-11-20

      今天我們說一下Redis中最後一個資料型別 “有序集合型別”,回首之前學過的幾個資料結構,不知道你會不會由衷感嘆,開源的世界真好,寫這

些程式碼的好心人真的要一生平安哈,不管我們想沒想的到的東西,在這個世界上都已經存在著,曾幾何時,我們想把所有資料按照資料結構模式組成

後灌輸到記憶體中,然而為了達到記憶體共享的方式,不得不將這塊記憶體包裝成wcf單獨部署,同時還要考慮怎麼序列化,何時序列互的問題,煩心事太多

太多。。。後來才知道有redis這麼個吊毛玩意,能把高階的,低階的資料結構單獨包裝到一個共享記憶體中(Redis),高階的資料結構,就是本篇所

說的 “有序集合”,和C#中的SortDictionary相對應,下面我來具體聊一聊。      

 

一: 有序集合(SortedSet)

   可能有些初次接觸SortedSet集合的人可能會說,這個集合的使用場景都有哪些??? 我可以明確的告訴你:“範圍查詢“的天敵就是”有序集合“,

任何大資料量下,查詢一個範圍的時間複雜度永遠都是 O[(LogN)+M],其中M:返回的元素個數。

   為了從易到難,我們還是先看一下redis手冊,挑選幾個我們常用的方法觀摩觀摩效果。。。

   

從上面17個命令中,毫無疑問,常用的命令為ZADD,ZREM,ZRANGEBYSCORE,ZRANGE。

 

1. ZADD

ZADD key score member [[score member] [score member] ...]
將一個或多個 member 元素及其 score 值加入到有序集 key 當中。

  這個是官方的解釋,賦值方式和hashtable差不多,只不過這裡的key是有序的而已。下面我舉個例子:我有一個fruits集合,其中記錄了每個水

果的price,然後我根據price的各種操作來獲取對應的水果資訊。

 

有了上面的基本資訊,接下來我逐一送他們到SortedSet中,如下圖:

從上面的圖中,不知道你有沒有發現到什麼異常???至少有兩種。

<1> 浮點數近似值的問題,比如grape,我在add的時候,寫明的是2.8,在redis中卻給我顯示近似值2.79999....,這個沒關係,本來就是這樣。

<2>  預設情況下,SortedSet是以key的升序排序的方式進行存放。

 

2.  ZRANGE,ZREVRANGE

ZRANGE key start stop [WITHSCORES]

返回有序集 key 中,指定區間內的成員。

其中成員的位置按 score 值遞增(從小到大)來排序。

  上面就是ZRange的格式模版,前面我在說ZAdd的時候其實我也已經說了,但是這個不是重點,在說ZAdd的時候留下了一個問題就是ZRange

預設是按照key升序排序的,對吧,那如果你想倒序顯示的話,怎麼辦呢???其實你可以使用ZRange的映象方法ZREVRANGE 即可,如下圖:

 

3. ZRANGEBYSCORE

ZRANGEBYSCORE key min max [WITHSCORES] [LIMIT offset count]

返回有序集 key 中,所有 score 值介於 min 和 max 之間(包括等於 min 或 max )的成員。有序整合員按 score 值遞增(從小到大)次序排列。

 這個算是對SortedSet來說最最重要的方法了,文章開頭我也說了,有序集合最利於範圍查詢,既然是查詢,你得有條件對吧,下面我舉個例子:

 

  <1>  我要找到1-4塊錢的水果種類,理所當然,我會找到【葡萄,蘋果】,如下圖:

1 127.0.0.1:6379> zrangebyscore fruits 1 4  withscores
2 1) "grape"
3 2) "2.7999999999999998"
4 3) "apple"
5 4) "3.5"
6 127.0.0.1:6379> 

 

  <2>  我要找到1-4區間中最接近4塊的水果是哪個??? 這個問題就是要找到apple這個選項,那如果找到呢??? 仔細想想我可以這麼做,

       將1-4區間中的所有數倒序再取第一條資料即可,對吧,如下圖:

127.0.0.1:6379> zrevrangebyscore fruits 4 1 withscores
1) "apple"
2) "3.5"
3) "grape"
4) "2.7999999999999998"
127.0.0.1:6379> zrevrangebyscore fruits 4 1 withscores limit 0 1
1) "apple"
2) "3.5"
127.0.0.1:6379> 

 

4. ZREM

ZREM key member [member ...]

移除有序集 key 中的一個或多個成員,不存在的成員將被忽略。

當 key 存在但不是有序集型別時,返回一個錯誤。

跟其他方法一樣,zrem的目的就是刪除指定的value成員,比如這裡我要刪除scores=3.5 的 apple記錄。

127.0.0.1:6379> zrem fruits apple
(integer) 1
127.0.0.1:6379> zrange fruits 0 -1 withscores
1) "grape"
2) "2.7999999999999998"
3) "pear"
4) "4.0999999999999996"
5) "banana"
6) "5"
7) "nut"
8) "9.1999999999999993"
127.0.0.1:6379> 

你會發現,已經沒有apple的相關記錄了,因為已經被我刪除啦。。。

 

二:探索原理

  簡單的操作都已經演示完畢了,接下來探討下sortedset到底是由什麼資料結構支撐的,大家應該早有耳聞,sortedset在CURD的攤還分析上

都是Log(N)的複雜度,可以與平衡二叉樹媲美,它就是1987年才出來的新型高效資料結構“跳躍表(SkipList)”,SkipList牛逼的地方在於跳出了樹模

型的思維,用多層連結串列的模式構造了Log(N)的時間複雜度,層的高度增加與否,採用隨機數的模式,這個和 ”Treap樹“ 的思想一樣,用它來保持”樹“

或者”連結串列”的平衡。

     詳細的我就不說了哈,不然的話又是一篇文章啦,如果非要了解的話,大家可以參見一下百度百科:http://baike.baidu.com/link?url=I8F7T

W933ZjIeBea_-dW9KeNsfKXMni0IdwNB10N1qnVfrOh_ubzcUpgwNVgRPFw3iCkhewGaYjM_o51xchS8a

 

我大概看了下百科裡面畫的這張圖,就像下面這樣:

這幅圖中有三條鏈,對吧,在SkipList中是必須要保證每條鏈中的資料必須有序才可以,這是必須的。

 

1. 如果要在level1層中找到節點6,那麼你需要逐一遍歷,需要6次查詢才能正確的找到資料。

2. 如果你在level2層中找到節點6的話,那麼你需要4次才能找到。

3. 如果你在level3層中找到節點6的話,那麼你需要3次就可以找到。。。。

 

現在巨集觀理解上,是不是有一種感覺,如果level的層數越高,相對找到資料需要遍歷的次數就越少,對吧,這就是跳躍表的思想,不然怎麼跳哈,

接下來我們來看看redis中是怎麼定義這個skiplist的,它的原始碼在redis.h 中:

 1 /* ZSETs use a specialized version of Skiplists */
 2 typedef struct zskiplistNode {
 3     robj *obj;
 4     double score;
 5     struct zskiplistNode *backward;
 6     struct zskiplistLevel {
 7         struct zskiplistNode *forward;
 8         unsigned int span;
 9     } level[];
10 } zskiplistNode;
11 
12 typedef struct zskiplist {
13     struct zskiplistNode *header, *tail;
14     unsigned long length;
15     int level;
16 } zskiplist;

從原始碼中可以看出如下幾點:

 

<1>   zskiplistnode就是skiplist中的node節點,節點中有一個level[]陣列,如果你夠聰明的話,你應該知道這個level[]就是存放著上圖中

         的 level1,level2,level3 這三條鏈。

 

<2>   level[]裡面是zskiplistLevel實體,這個實體中有一個 *forward指標,這個指標就是指向同層中的後續節點。

 

<3>   在zskiplistLevel中還有一個 robj型別的*obj指標,這個就是RedisObject物件哈,裡面存放的就是我們的value值,接下來還有一個

         score屬性,這個就是key值啦。。。skiplist就是根據它來進行排序的哈。

 

<4>  接下來就是第二個列舉zskiplist,這個沒什麼意思,純粹的包裝層,比如裡面的length是記錄skiplist中的節點個數,level記錄skiplist

    當前的層數,用*header,*tail記錄skiplist中的首節點和尾節點。。。僅此而已。。。

 

好了,不管你聽懂沒聽懂,大體上就這樣了。。。上班去啦~~~

 

相關文章