布隆過濾器

譚文濤博士發表於2021-12-31

1、 為什麼出現(why):

      a) 在集合中查詢資料

      b) 一般做法使用雜湊表,時間效率高但是佔用空間,對於網際網路大資料,佔用空間可想而知

      c) 布隆過濾器可以使用1/4到1/8雜湊表佔用空間完成相同的功能

2、 其缺點:存在誤算率

3、 具體應用:

      a) 檢視拼寫的英語是否存在已有的字典裡面

      b) Fbi檢視嫌疑人名單是否在通緝名單裡面

      c) 爬蟲的時候判斷該網址是否已經爬過

4、 怎樣構成(how):一個很長的二進位制向量和幾個隨機對映函式

布隆過濾器


相關文章