推薦系統：關聯規則(2)

maqianmaqian發表於2011-03-17

Apriori Algorithm 是關聯規則領域裡最具影響力的基礎演算法。它是由 Rakesh Agrawal 在 1994 年提出的，詳細的介紹在這裡《Fast Algorithms for Mining Association Rules》。十幾年過去了，不少學者圍繞著 Apriori 進行了諸多改良。但與 1994 年相比，目前基於網際網路的應用，資料量大了幾十倍甚至是幾百倍，因此，基於 Apriori 的演算法逐漸暴露出其運算成本過高的問題。但不管怎樣，對於大師及其做出的貢獻，我們也只有高山仰止的份兒。

Apriori 是一種廣度優先演算法，通過多次掃描資料庫來獲取支援度大於最小支援度的頻繁項集。它的理論基礎是頻繁項集的兩個單調性原則：頻繁項集的任一子集一定是頻繁的；非頻繁項集的任一超集一定是非頻繁的。晦澀的理論我這裡就不多寫了，有興趣的可以去看論文。我把裡面的例子給翻譯一下，圖文並茂，簡明易懂。
某資料庫 DB 裡有 4 條事務記錄，取最小支援度（min support）為 0.5，則計算頻繁項集的過程如下：

TID	Items
100	A, C, D
200	B, C, E
300	A, B, C, E
400	B, E

掃描DB

Itemset	Support
{A}	2 (0.5)
{B}	3 (0.75)
{C}	3 (0.75)
{D}	1 (0.25)
{E}	3 (0.75)

取滿足
最小支援度
項集

Itemset	Support
{A}	2
{B}	3
{C}	3
{E}	3

Itemset

{A, B}

{A, C}

{A, E}

{B, C}

{B, E}

{C, E}

掃描DB

Itemset	Support
{A, B}	1 (0.25)
{A, C}	2 (0.5)
{A, E}	1 (0.25)
{B, C}	2 (0.5)
{B, E}	3 (0.75)
{C, E}	2 (0.5)

取滿足
最小支援度
項集

Itemset	Support
{A, C}	2
{B, C}	2
{B, E}	3
{C, E}	2

Itemset

{A, B, C}

{A, B, E}

{A, C, E}

{B, C, E}

掃描DB

Itemset	Support
{A, B, C}	1 (0.25)
{A, B, E}	1 (0.25)
{A, C, E}	1 (0.35)
{B, C, E}	2 (0.5)

取滿足
最小支援度
項集

Itemset	Support
{B, C, E}	2 (0.5)

如上可以看出，在海量資料的情況下，Apriori 演算法的運算過程有 2 個問題：

需要多次掃描資料庫，時間成本很高；
運算過程中需要產生大量的候選集，空間成本也非常高。

針對 Apriori 演算法所做的改進也基本上是圍繞著解決這兩個問題進行的，如在掃描DB前首先進行以便事務合併和壓縮，資料分割槽或抽樣等。

Weka 裡有 Apriori 演算法的 Java 實現，非常值得一看。

直播系統，利用關聯規則實現推薦演算法
2024-07-27
演算法
基於Apriori關聯規則的電影推薦系統(附python程式碼)
2024-03-31
Python
系統單據號生成規則推薦
2018-12-31
推薦系統: 相關推薦方法對比
2015-12-08
關於《推薦系統實踐》
2011-11-14
併發處理規則最佳推薦
2018-10-30
Prometheus監控規則推薦網站🔰
2024-08-26
Prometheus網站
【Python資料探勘課程】八.關聯規則挖掘及Apriori實現購物推薦
2016-11-28
Python
推薦系統
2013-06-08
【推薦系統篇】--推薦系統之訓練模型
2018-03-26
模型
編輯推薦之《推薦系統》
2013-04-23
資料探勘之關聯規則
2018-01-03
推薦系統相關術語知多少
2019-01-17
關於推薦系統中的特徵工程
2014-08-06
特徵工程
推薦系統之路 (2)：產品聚類
2019-05-05
聚類
【推薦系統篇】--推薦系統之測試資料
2018-03-27
《推薦系統學習》之推薦系統那點事
2016-04-17
推薦系統概述
2018-10-31
機器學習 — 推薦系統
2018-02-09
機器學習
《推薦系統實踐》筆記 01 推薦系統簡介
2020-11-22
筆記
五個有關推薦系統的資料
2013-07-18
《推薦系統實踐》關於Latent Factor Model
2011-12-22
推薦系統論文之序列推薦：KERL
2021-05-17
推薦系統一——深入理解YouTube推薦系統演算法
2020-10-11
演算法
【推薦系統篇】--推薦系統介紹和基本架構流程
2018-03-26
架構
第2-4-4章規則引擎Drools規則屬性-業務規則管理系統-元件化-中臺
2022-11-25
元件化
《推薦系統》-DIN模型
2020-10-22
模型
《推薦系統》-PNN模型
2020-10-21
模型
python 推薦系統
2022-02-28
Python
推薦系統雜談
2016-11-12
推薦系統評估
2017-09-19
推薦：看板系統Trello
2017-02-16
圖靈推薦系統
2013-04-29
圖靈
推薦系統概念篇
2024-07-05
關聯規則方法之apriori演算法
2018-08-23
演算法
關聯規則挖掘（二）-- Apriori 演算法
2017-12-11
演算法
關聯規則挖掘之apriori演算法
2015-07-03
演算法
雲音樂推薦系統（二）：推薦系統的核心演算法
2020-11-11
演算法

推薦系統：關聯規則(2)

相關文章