使用FP-growth演算法來高效發現頻繁項集

CopperDong發表於2017-10-07

  在搜尋引擎中輸入一個單詞或者單詞的一部分,就會自動補全查詢詞項

  FP-growd基於Apriori構建,但在完成相同任務時採用了一些不同的技術.這裡的任務是將資料集儲存在一個特定的稱作FP樹的結構之後發現頻繁項集或頻繁項對,即常在一塊出現的元素項的集合FP樹.這種做法是的演算法的執行速度要快於Apriori,通常效能要好兩個數量級以上.

一,FP樹

    頻繁模式(Frequent Pattern)    

二,構建FP樹


三,從一顆FP樹中挖掘頻繁項集


四,示例:在Twitter源中發現一些共現詞


五,示例:從新聞網站點選流中挖掘



相關文章