今天我們說一下Redis中最後一個資料型別 “有序集合型別”,回首之前學過的幾個資料結構,不知道你會不會由衷感嘆,開源的世界真好,寫這
些程式碼的好心人真的要一生平安哈,不管我們想沒想的到的東西,在這個世界上都已經存在著,曾幾何時,我們想把所有資料按照資料結構模式組成
後灌輸到記憶體中,然而為了達到記憶體共享的方式,不得不將這塊記憶體包裝成wcf單獨部署,同時還要考慮怎麼序列化,何時序列互的問題,煩心事太多
太多。。。後來才知道有redis這麼個吊毛玩意,能把高階的,低階的資料結構單獨包裝到一個共享記憶體中(Redis),高階的資料結構,就是本篇所
說的 “有序集合”,和C#中的SortDictionary相對應,下面我來具體聊一聊。
一: 有序集合(SortedSet)
可能有些初次接觸SortedSet集合的人可能會說,這個集合的使用場景都有哪些??? 我可以明確的告訴你:“範圍查詢“的天敵就是”有序集合“,
任何大資料量下,查詢一個範圍的時間複雜度永遠都是 O[(LogN)+M],其中M:返回的元素個數。
為了從易到難,我們還是先看一下redis手冊,挑選幾個我們常用的方法觀摩觀摩效果。。。
從上面17個命令中,毫無疑問,常用的命令為ZADD,ZREM,ZRANGEBYSCORE,ZRANGE。
1. ZADD
ZADD key score member [[score member] [score member] ...]
將一個或多個 member 元素及其 score 值加入到有序集 key 當中。
這個是官方的解釋,賦值方式和hashtable差不多,只不過這裡的key是有序的而已。下面我舉個例子:我有一個fruits集合,其中記錄了每個水
果的price,然後我根據price的各種操作來獲取對應的水果資訊。
有了上面的基本資訊,接下來我逐一送他們到SortedSet中,如下圖:
從上面的圖中,不知道你有沒有發現到什麼異常???至少有兩種。
<1> 浮點數近似值的問題,比如grape,我在add的時候,寫明的是2.8,在redis中卻給我顯示近似值2.79999....,這個沒關係,本來就是這樣。
<2> 預設情況下,SortedSet是以key的升序排序的方式進行存放。
2. ZRANGE,ZREVRANGE
ZRANGE key start stop [WITHSCORES]
返回有序集 key 中,指定區間內的成員。
其中成員的位置按 score 值遞增(從小到大)來排序。
上面就是ZRange的格式模版,前面我在說ZAdd的時候其實我也已經說了,但是這個不是重點,在說ZAdd的時候留下了一個問題就是ZRange
預設是按照key升序排序的,對吧,那如果你想倒序顯示的話,怎麼辦呢???其實你可以使用ZRange的映象方法ZREVRANGE 即可,如下圖:
3. ZRANGEBYSCORE
ZRANGEBYSCORE key min max [WITHSCORES] [LIMIT offset count]
返回有序集 key 中,所有 score 值介於 min 和 max 之間(包括等於 min 或 max )的成員。有序整合員按 score 值遞增(從小到大)次序排列。
這個算是對SortedSet來說最最重要的方法了,文章開頭我也說了,有序集合最利於範圍查詢,既然是查詢,你得有條件對吧,下面我舉個例子:
<1> 我要找到1-4塊錢的水果種類,理所當然,我會找到【葡萄,蘋果】,如下圖:
1 127.0.0.1:6379> zrangebyscore fruits 1 4 withscores 2 1) "grape" 3 2) "2.7999999999999998" 4 3) "apple" 5 4) "3.5" 6 127.0.0.1:6379>
<2> 我要找到1-4區間中最接近4塊的水果是哪個??? 這個問題就是要找到apple這個選項,那如果找到呢??? 仔細想想我可以這麼做,
將1-4區間中的所有數倒序再取第一條資料即可,對吧,如下圖:
127.0.0.1:6379> zrevrangebyscore fruits 4 1 withscores 1) "apple" 2) "3.5" 3) "grape" 4) "2.7999999999999998" 127.0.0.1:6379> zrevrangebyscore fruits 4 1 withscores limit 0 1 1) "apple" 2) "3.5" 127.0.0.1:6379>
4. ZREM
ZREM key member [member ...]
移除有序集 key 中的一個或多個成員,不存在的成員將被忽略。
當 key 存在但不是有序集型別時,返回一個錯誤。
跟其他方法一樣,zrem的目的就是刪除指定的value成員,比如這裡我要刪除scores=3.5 的 apple記錄。
127.0.0.1:6379> zrem fruits apple (integer) 1 127.0.0.1:6379> zrange fruits 0 -1 withscores 1) "grape" 2) "2.7999999999999998" 3) "pear" 4) "4.0999999999999996" 5) "banana" 6) "5" 7) "nut" 8) "9.1999999999999993" 127.0.0.1:6379>
你會發現,已經沒有apple的相關記錄了,因為已經被我刪除啦。。。
二:探索原理
簡單的操作都已經演示完畢了,接下來探討下sortedset到底是由什麼資料結構支撐的,大家應該早有耳聞,sortedset在CURD的攤還分析上
都是Log(N)的複雜度,可以與平衡二叉樹媲美,它就是1987年才出來的新型高效資料結構“跳躍表(SkipList)”,SkipList牛逼的地方在於跳出了樹模
型的思維,用多層連結串列的模式構造了Log(N)的時間複雜度,層的高度增加與否,採用隨機數的模式,這個和 ”Treap樹“ 的思想一樣,用它來保持”樹“
或者”連結串列”的平衡。
詳細的我就不說了哈,不然的話又是一篇文章啦,如果非要了解的話,大家可以參見一下百度百科:http://baike.baidu.com/link?url=I8F7T
W933ZjIeBea_-dW9KeNsfKXMni0IdwNB10N1qnVfrOh_ubzcUpgwNVgRPFw3iCkhewGaYjM_o51xchS8a
我大概看了下百科裡面畫的這張圖,就像下面這樣:
這幅圖中有三條鏈,對吧,在SkipList中是必須要保證每條鏈中的資料必須有序才可以,這是必須的。
1. 如果要在level1層中找到節點6,那麼你需要逐一遍歷,需要6次查詢才能正確的找到資料。
2. 如果你在level2層中找到節點6的話,那麼你需要4次才能找到。
3. 如果你在level3層中找到節點6的話,那麼你需要3次就可以找到。。。。
現在巨集觀理解上,是不是有一種感覺,如果level的層數越高,相對找到資料需要遍歷的次數就越少,對吧,這就是跳躍表的思想,不然怎麼跳哈,
接下來我們來看看redis中是怎麼定義這個skiplist的,它的原始碼在redis.h 中:
1 /* ZSETs use a specialized version of Skiplists */ 2 typedef struct zskiplistNode { 3 robj *obj; 4 double score; 5 struct zskiplistNode *backward; 6 struct zskiplistLevel { 7 struct zskiplistNode *forward; 8 unsigned int span; 9 } level[]; 10 } zskiplistNode; 11 12 typedef struct zskiplist { 13 struct zskiplistNode *header, *tail; 14 unsigned long length; 15 int level; 16 } zskiplist;
從原始碼中可以看出如下幾點:
<1> zskiplistnode就是skiplist中的node節點,節點中有一個level[]陣列,如果你夠聰明的話,你應該知道這個level[]就是存放著上圖中
的 level1,level2,level3 這三條鏈。
<2> level[]裡面是zskiplistLevel實體,這個實體中有一個 *forward指標,這個指標就是指向同層中的後續節點。
<3> 在zskiplistLevel中還有一個 robj型別的*obj指標,這個就是RedisObject物件哈,裡面存放的就是我們的value值,接下來還有一個
score屬性,這個就是key值啦。。。skiplist就是根據它來進行排序的哈。
<4> 接下來就是第二個列舉zskiplist,這個沒什麼意思,純粹的包裝層,比如裡面的length是記錄skiplist中的節點個數,level記錄skiplist
當前的層數,用*header,*tail記錄skiplist中的首節點和尾節點。。。僅此而已。。。
好了,不管你聽懂沒聽懂,大體上就這樣了。。。上班去啦~~~