Redis 中三種特殊的資料型別

Sun_翁航發表於2018-03-13

Reids 在 Web 應用的開發中使用非常廣泛,幾乎所有的後端技術都會有涉及到 Redis 的使用。Redis 種除了常見的字串 String、字典 Hash、列表 List、集合 Set、有序集合 SortedSet 等等之外,還有一些不常用的資料型別,這裡著重介紹三個。

BitMap

BitMap 就是通過一個 bit 位來表示某個元素對應的值或者狀態, 其中的 key 就是對應元素本身,實際上底層也是通過對字串的操作來實現。Redis 從 2.2 版本之後新增了setbit, getbit, bitcount 等幾個 bitmap 相關命令。雖然是新命令,但是本身都是對字串的操作,我們先來看看語法:

SETBIT key offset value
複製程式碼

其中 offset 必須是數字,value 只能是 0 或者 1,咋一看感覺沒啥用處,我們先來看看 bitmap 的具體表示,當我們使用命令 setbit key (0,2,5,9,12) 1後,它的具體表示為:

byte bit0 bit1 bit2 bit3 bit4 bit5 bit6 bit7
byte0 1 0 1 0 0 1 0 0
byte1 0 1 0 0 1 0 0 0

可以看出 bit 的預設值是 0,那麼 BitMap 在實際開發的運用呢?這裡舉一個例子:儲存使用者線上狀態。這裡只需要一個 key,然後把使用者 ID 作為 offset,如果線上就設定為 1,不線上就設定為 0。例項程式碼:

//設定線上狀態
$redis->setBit('online', $uid, 1);

//設定離線狀態
$redis->setBit('online', $uid, 0);

//獲取狀態
$isOnline = $redis->getBit('online', $uid);

//獲取線上人數
$isOnline = $redis->bitCount('online');
複製程式碼

Geo

Redis 的 GEO 特性在 Redis 3.2 版本中推出, 這個功能可以將使用者給定的地理位置資訊儲存起來, 並對這些資訊進行操作。GEO 的資料結構總共有六個命令:geoadd、geopos、geodist、georadius、georadiusbymember、gethash,這裡著重講解幾個。

  1. GEOADD
GEOADD key longitude latitude member [longitude latitude member ...]
複製程式碼

將給定的空間元素(緯度、經度、名字)新增到指定的鍵裡面。 這些資料會以有序集合的形式被儲存在鍵裡面, 從而使得像 GEORADIUS 和 GEORADIUSBYMEMBER 這樣的命令可以在之後通過位置查詢取得這些元素。例子:

redis> GEOADD Sicily 13.361389 38.115556 "Palermo" 15.087269 37.502669 "Catania"
(integer) 2
複製程式碼

2.GEOPOS

GEOPOS key member [member ...]
複製程式碼

從鍵裡面返回所有給定位置元素的位置(經度和緯度),例子:

redis> GEOPOS Sicily Palermo Catania NonExisting
1) 1) "13.361389338970184"
   2) "38.115556395496299"
複製程式碼

3.GEODIST

GEODIST key member1 member2 [unit]
複製程式碼

返回兩個給定位置之間的距離。如果兩個位置之間的其中一個不存在, 那麼命令返回空值。指定單位的引數 unit 必須是以下單位的其中一個:(預設為m)

m   表示單位為米。
km  表示單位為千米。
mi  表示單位為英里。
ft  表示單位為英尺。
複製程式碼
redis> GEODIST Sicily Palermo Catania
"166274.15156960039"
複製程式碼

4.GEORADIUS

GEORADIUS key longitude latitude radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] [ASC|DESC] [COUNT count]
複製程式碼

以給定的經緯度為中心, 返回鍵包含的位置元素當中, 與中心的距離不超過給定最大距離的所有位置元素。距離單位和上面的一致,其中後面的選項:

WITHDIST: 在返回位置元素的同時, 將位置元素與中心之間的距離也一併返回。距離的單位和使用者給定的範圍單位保持一致。
WITHCOORD: 將位置元素的經度和維度也一併返回。
WITHHASH: 以 52 位有符號整數的形式, 返回位置元素經過原始 geohash 編碼的有序集合分值。這個選項主要用於底層應用或者除錯, 實際中的作用並不大。
複製程式碼
redis> GEORADIUS Sicily 15 37 200 km WITHDIST
1) 1) "Palermo"
   2) "190.4424"
2) 1) "Catania"
   2) "56.4413"
複製程式碼

HyperLogLog

Redis 的基數統計,這個結構可以非常省記憶體的去統計各種計數,比如註冊 IP 數、每日訪問 IP 數、頁面實時UV)、線上使用者數等。但是它也有侷限性,就是隻能統計數量,而沒辦法去知道具體的內容是什麼。 當然用集合也可以解決這個問題。但是一個大型的網站,每天 IP 比如有 100 萬,粗算一個 IP 消耗 15 位元組,那麼 100 萬個 IP 就是 15M。而 HyperLogLog 在 Redis 中每個鍵佔用的內容都是 12K,理論儲存近似接近 2^64 個值,不管儲存的內容是什麼,它一個基於基數估算的演算法,只能比較準確的估算出基數,可以使用少量固定的記憶體去儲存並識別集合中的唯一元素。而且這個估算的基數並不一定準確,是一個帶有 0.81% 標準錯誤的近似值。 這個資料結構的命令有三個:PFADD、PFCOUNT、PFMERGE

1.PFADD

redis> PFADD  databases  "Redis"  "MongoDB"  "MySQL"
(integer) 1

redis> PFADD  databases  "Redis"    # Redis 已經存在,不必對估計數量進行更新
(integer) 0
複製程式碼

2.PFCOUNT

redis> PFCOUNT  databases
(integer) 3
複製程式碼

3.PFMERGE

PFMERGE destkey sourcekey [sourcekey ...]
複製程式碼

將多個 HyperLogLog 合併為一個 HyperLogLog, 合併後的 HyperLogLog 的基數接近於所有輸入 HyperLogLog 的可見集合的並集。合併得出的 HyperLogLog 會被儲存在 destkey 鍵裡面, 如果該鍵並不存在,那麼命令在執行之前, 會先為該鍵建立一個空的 HyperLogLog 。

redis> PFADD  nosql  "Redis"  "MongoDB"  "Memcached"
(integer) 1

redis> PFADD  RDBMS  "MySQL" "MSSQL" "PostgreSQL"
(integer) 1

redis> PFMERGE  databases  nosql  RDBMS
OK

redis> PFCOUNT  databases
(integer) 6
複製程式碼

歡迎關我的個人公眾號:左手程式碼(公眾號後臺傳送 jetbrains,你懂得~)

Redis 中三種特殊的資料型別

相關文章