LevelDB 學習筆記1：布隆過濾器

路過的摸魚俠發表於2022-04-08

原文網址 : https://www.cnblogs.com/ljx-null/p/16120507.html

筆記過濾器

LevelDB 學習筆記1：布隆過濾器

底層是位陣列，初始都是 0
插入時，用 k 個雜湊函式對插入的數字做雜湊，並用位陣列長度取餘，將對應位置 1
查詢時，做同樣的雜湊操作，檢視這些位的值
- 如果所有位都是 1，說明數字可能存在
- 如果有某個位不是 1，說明數字一定不存在

數學結論

影響布隆過濾器精度的引數有

雜湊函式的個數 k
布隆過濾器位陣列的容量 m
布隆過濾器插入的資料數量 n

對於給定的 m 和 n，要想最小化錯誤率（假陽性），k 應該取

\[k=\frac{m}{n} \ln 2 \]

要求錯誤率不大於\(\varepsilon\)，k 取最優的情況下，m 應該至少為

\[m \geq - 1.44 \log _{2} \varepsilon * n \]

布隆過濾器的優缺點

優點

空間效率高，可以在使用有限記憶體的情況下處理海量資料
- 1% 錯誤率並使用最佳 k 值的布隆過濾器，每個元素只需要使用約 9.6 位
插入和查詢都是常數複雜度，即 O(k)

缺點

存在誤判
刪除元素困難，因為簡單地將對應的位置 0 會影響其他元素的判斷
- 可以用一種叫 Counting Bloom filter 的變體

LevelDB 中的布隆過濾器

LevelDB 中利用布隆過濾器判斷指定的 key 值是否存在於 sstable 中

若過濾器認為 key 不在 sstable 中，那麼就沒必要查詢這個 sstable 了
否則，key 有可能在 sstable 中，應該做查詢

使用布隆過濾器可以有效的減少呼叫 DB::Get() 時的訪存次數，從而減小讀放大

LevelDB 中布隆過濾器的實現是 BloomFilterPolicy，它是介面類 FilterPolicy 的實現

FilterPolicy 類決定了查詢過程中要不要讀取某個 sstable
允許使用者自定義 FilterPolicy 的子類來應用不同的過濾策略

LevelDB 實現時做了優化，它並不是使用 k 個雜湊函式，而是應用 rsa2008 中提出的方法只生成一次雜湊值，然後用 double-hashing 的方式生成一組雜湊值

uint32_t h = BloomHash(keys[i]);
      const uint32_t delta = (h >> 17) | (h << 15);  // Rotate right 17 bits
      for (size_t j = 0; j < k_; j++) {
        const uint32_t bitpos = h % bits;
        array[bitpos / 8] |= (1 << (bitpos % 8));
        h += delta;
      }

一般實現布隆過濾器時，都會選擇非加密雜湊演算法

加密雜湊演算法，比如 MD5、SHA1，安全性較高，難以找到碰撞或通過加密值反推原文
非加密雜湊演算法，比如 MurMurHash、CRC32、FNV，計算速度快
LevelDB 實現了一個類似於 MurMurHash 的非加密雜湊演算法

其他應用場景

快取穿透

做查詢的時候，快取沒有命中，就會到資料庫中去找，特別地，如果查詢一個不存在的 key，那麼是一定無法命中快取，必須去查資料庫的，如果有人惡意地使用大量請求來查不存在的 key，就會導致資料庫壓力過大，甚至崩潰，這種現象稱為快取穿透

用布隆過濾器我們可以直接將這些針對不存在的 key 發起的請求過濾掉

布隆過濾器
2021-12-31
過濾器
淺談布隆過濾器
2024-04-10
過濾器
Redis-布隆過濾器
2020-10-14
Redis過濾器
布隆過濾器（Bloom Filter）
2020-05-10
過濾器OOMFilter
大白話布隆過濾器
2019-05-23
過濾器
Guava的布隆過濾器
2019-04-28
Guava過濾器
布隆過濾器 Bloom Filter
2021-03-06
過濾器OOMFilter
Bloom Filter 布隆過濾器
2020-12-25
OOMFilter過濾器
Redis 中的布隆過濾器
2019-03-03
Redis過濾器
Redis 應用-布隆過濾器
2019-07-05
Redis過濾器
victoriaMetrics庫之布隆過濾器
2022-04-05
過濾器
布隆過濾器與 Redis BitMap
2023-03-06
過濾器Redis
PHP實現布隆過濾器
2020-12-01
PHP過濾器
LevelDB學習筆記 (1):初識LevelDB
2021-07-03
筆記
Xor過濾器：比布隆Bloom過濾器更快，更小
2019-12-20
過濾器OOM
布隆過濾器(Bloom Filter)詳解
2019-02-28
過濾器OOMFilter
還有人不懂布隆過濾器嗎？
2022-01-26
過濾器
5分鐘掌握布隆過濾器
2021-11-06
過濾器
從快取穿透聊到布隆過濾器
2019-10-30
快取穿透過濾器
演算法(3)---布隆過濾器原理
2019-07-24
演算法過濾器
布隆過濾器-使用場景的思考
2020-06-14
過濾器
Redis詳解（十三）------ Redis布隆過濾器
2020-06-03
Redis過濾器
布隆過濾器的原理及應用
2021-08-12
過濾器
Redis布隆過濾器分析與總結
2021-04-13
Redis過濾器
【實戰問題】-- 快取穿透之布隆過濾器（1）
2021-03-27
快取穿透過濾器
實現布隆過濾器的三種方式
2020-10-09
過濾器
詳解布隆過濾器原理與實現
2021-12-05
過濾器
品味布隆過濾器的設計之美
2023-04-14
過濾器
布隆過濾器實戰【防止快取擊穿】
2019-03-22
過濾器快取
那些有趣的演算法之布隆過濾器
2019-02-26
演算法過濾器
Redis快取穿透解決方案--布隆過濾器
2020-10-20
Redis快取穿透過濾器
詳解布隆過濾器的原理和實現
2021-12-09
過濾器
面試官問：什麼是布隆過濾器？
2021-11-03
面試過濾器
布隆過濾器解決快取穿透問題
2020-12-01
過濾器快取穿透
布隆過濾器(BloomFilter)原理實現和效能測試
2020-07-24
過濾器OOMFilter
AI考拉技術分享--布隆過濾器實戰
2019-02-19
AI過濾器
雜湊表擴充套件—布隆過濾器（Bloom Filter）
2018-03-03
套件過濾器OOMFilter
一文徹底弄清Redis的布隆過濾器
2024-10-21
Redis過濾器

LevelDB 學習筆記1：布隆過濾器

LevelDB 學習筆記1：布隆過濾器

數學結論

布隆過濾器的優缺點

LevelDB 中的布隆過濾器

其他應用場景

快取穿透

相關文章