Redis HyperLogLog

拿客_三產發表於2017-06-19

原文網址 : https://flycode.co/archives/105653

Redis

HyperLogLog簡介

HyperLogLog 並不是一種新的資料結構（實際型別為字串型別），而是一種基數演算法，通過 HyperLogLog 可以利用極小的記憶體空間完成獨立總數的統計，資料集可以是 IP、Email、ID 等。

命令

新增

PFADD

自2.8.9可用。

時間複雜度：每新增一個元素的複雜度為 O(1) 。

語法：PFADD key element [element …]

說明：

將任意數量的元素新增到指定的 HyperLogLog 裡面。

作為這個命令的副作用， HyperLogLog 內部可能會被更新，以便反映一個不同的唯一元素估計數量（也即是集合的基數）。

如果 HyperLogLog 估計的近似基數（approximated cardinality）在命令執行之後出現了變化，那麼命令返回 1 ，否則返回 0 。如果命令執行時給定的鍵不存在，那麼程式將先建立一個空的 HyperLogLog 結構，然後再執行命令。

呼叫 PFADD 命令時可以只給定鍵名而不給定元素：

              - 如果給定鍵已經是一個 HyperLogLog ， 那麼這種呼叫不會產生任何效果；

但如果給定的鍵不存在，那麼命令會建立一個空的 HyperLogLog ，並向客戶端返回 1 。

返回值：

整數回覆：如果 HyperLogLog 的內部儲存被修改了，那麼返回 1 ，否則返回 0 。

示例：

coderknock> PFADD  databases  "Redis"  "MongoDB"  "MySQL"
(integer) 1

coderknock> PFCOUNT  databases
(integer) 3

coderknock> PFADD  databases  "Redis"    # Redis 已經存在，不必對估計數量進行更新
(integer) 0

coderknock> PFCOUNT  databases    # 元素估計數量沒有變化
(integer) 3

coderknock> PFADD  databases  "PostgreSQL"    # 新增一個不存在的元素
(integer) 1

coderknock> PFCOUNT  databases    # 估計數量增一
4

計算總數

PFCOUNT

自2.8.9可用。

時間複雜度：當命令作用於單個 HyperLogLog 時，複雜度為 O(1) ，並且具有非常低的平均常數時間。當命令作用於 N 個 HyperLogLog 時，複雜度為 O(N) ，常數時間也比處理單個 HyperLogLog 時要大得多。

語法：PFCOUNT key [key …]

說明：

當 PFCOUNT 命令作用於單個鍵時，返回儲存在給定鍵的 HyperLogLog 的近似基數，如果鍵不存在，那麼返回 0 。

當 PFCOUNT 命令作用於多個鍵時，返回所有給定 HyperLogLog 的並集的近似基數，這個近似基數是通過將所有給定 HyperLogLog 合併至一個臨時 HyperLogLog 來計算得出的。

通過 HyperLogLog 資料結構，使用者可以使用少量固定大小的記憶體，來儲存集合中的唯一元素（每個 HyperLogLog 只需使用 12k 位元組記憶體，以及幾個位元組的記憶體來儲存鍵本身）。

命令返回的可見集合（observed set）基數並不是精確值，而是一個帶有 0.81% 標準錯誤（standard error）的近似值。

舉個例子，為了記錄一天會執行多少次各不相同的搜尋查詢，一個程式可以在每次執行搜尋查詢時呼叫一次 PFADD ，並通過呼叫 PFCOUNT 命令來獲取這個記錄的近似結果。

返回值：

整數回覆：給定 HyperLogLog 包含的唯一元素的近似數量。

示例：

coderknock> PFADD  databases  "Redis"  "MongoDB"  "MySQL"
(integer) 1

coderknock> PFCOUNT  databases
(integer) 3

coderknock> PFADD  databases  "Redis"    # Redis 已經存在，不必對估計數量進行更新
(integer) 0

coderknock> PFCOUNT  databases    # 元素估計數量沒有變化
(integer) 3

coderknock> PFADD  databases  "PostgreSQL"    # 新增一個不存在的元素
(integer) 1

coderknock> PFCOUNT  databases    # 估計數量增一
4

整合

PFMERGE

自2.8.9可用。

時間複雜度：O(N) ，其中 N 為被合併的 HyperLogLog 數量，不過這個命令的常數複雜度比較高。

語法：PFMERGE destkey sourcekey [sourcekey …]

說明：

將多個 HyperLogLog 合併（merge）為一個 HyperLogLog ，合併後的 HyperLogLog 的基數接近於所有輸入 HyperLogLog 的可見集合（observed set）的並集。

合併得出的 HyperLogLog 會被儲存在 destkey 鍵裡面，如果該鍵並不存在，那麼命令在執行之前，會先為該鍵建立一個空的 HyperLogLog 。

返回值：

字串回覆：返回 OK 。

示例：

coderknock> PFADD  nosql  "Redis"  "MongoDB"  "Memcached"
(integer) 1

coderknock> PFADD  RDBMS  "MySQL" "MSSQL" "PostgreSQL" "MySQL"
(integer) 1

coderknock> PFMERGE  databases  nosql  RDBMS
OK
# "MySQL" 重複只記一次
coderknock> PFCOUNT  databases
(integer) 6

HyperLogLog 記憶體佔用量非常小，但是存在錯誤率，開發者在進行資料結構選型時只需要確認如下兩條即可：

只為了計算獨立總數，不需要獲取單條資料。
可以容忍一定誤差率，畢竟HyperLogLog在記憶體的佔用量上有很大的優勢。

redis知識之HyperLogLog
2024-11-19
Redis
Redis 集合統計（HyperLogLog）
2021-02-13
Redis
Redis的Bitmap、HyperLogLog和Geo
2020-12-16
Redis
Redis 中 HyperLogLog 的使用場景
2020-10-13
Redis
Redis HyperLogLog介紹及應用
2020-04-04
Redis
初識Redis的資料型別HyperLogLog
2020-06-15
Redis資料型別
學透 Redis HyperLogLog，看這篇就夠了
2023-09-25
Redis
Redis 三種特殊資料型別之 Hyperloglog
2020-09-18
Redis資料型別
Redis中 HyperLogLog資料型別使用總結
2023-03-11
Redis資料型別
HyperLogLog
2024-06-26
redis個人原始碼分析1----hyperloglog（golang實現）
2018-11-17
Redis原始碼Golang
Redis Hyperloglog的原理及數學理論的通俗理解
2022-01-24
Redis
redis——集合，有序，慢查詢， pipline與事務， bitmap ，HyperLogLog geo
2024-03-21
Redis
見縫插針 —— 深入 Redis HyperLogLog 內部資料結構分析
2019-03-01
Redis資料結構
openGauss 支援HyperLogLog
2024-04-09
HyperLogLog 演算法的原理講解以及 Redis 是如何應用它的
2019-03-02
演算法Redis
使用者日活月活怎麼統計 - Redis HyperLogLog 詳解
2020-10-09
Redis
Redis 必知必會之慢查詢、Pipeline、釋出訂閱、Bitmap、HyperLogLog、GEO
2020-01-16
Redis
【Redis的那些事 · 續集】Redis的點陣圖、HyperLogLog資料結構演示以及布隆過濾器
2022-01-01
Redis資料結構過濾器
Redis基礎知識（學習筆記13--BitMap、HyperLogLog 與 Geospatial的操作命令）
2024-07-07
Redis筆記
Redis HyperLogLog 是什麼？這些場景使用它，讓我槍出如龍，一笑破蒼穹
2022-04-13
Redis
HyperLogLog：海量資料下的基數計算
2018-05-15
故事：坐在我隔壁的小王問我什麼是HyperLogLog
2020-09-14
慢查詢、pipline、釋出訂閱、 bitmap點陣圖、 hyperloglog、geo、持久化
2024-07-01
持久化
（Redis）：Redis入門
2020-10-03
Redis
【Redis】Redis 學習
2020-12-30
Redis
【Redis】redis遷移資料到redis-cluster
2018-05-23
Redis
【Redis】Redis的操作命令（一）——Redis Key命令
2024-04-22
Redis
Redis Labs更名為Redis
2021-08-12
Redis
redis面試題 redis總結 redis簡述
2018-07-02
Redis面試題
【Azure Redis 快取 Azure Cache For Redis】Redis連線池
2021-04-23
Redis快取
redis之 Redis持久化配置
2018-10-07
Redis持久化
【Redis】 redis資料遷移
2018-08-09
Redis
【Redis】Windows下安裝Redis
2024-04-21
RedisWindows
操作Redis之go-redis
2024-03-14
RedisGo
Redis服務之Redis Cluster
2020-08-06
Redis
Redis基礎：redis特點
2020-07-13
Redis
[Redis 概述] 什麼是 Redis？
2024-11-26
Redis
[Redis 系列]redis 學習二
2022-01-12
Redis

Redis HyperLogLog

HyperLogLog簡介

命令

新增

PFADD

語法：PFADD key element [element …]

說明：

返回值：

示例：

計算總數

PFCOUNT

語法：PFCOUNT key [key …]

說明：

返回值：

示例：

整合

PFMERGE

語法：PFMERGE destkey sourcekey [sourcekey …]

說明：

返回值：

示例：

相關文章