關聯規則分析 Apriori 演算法 簡介與入門
關聯規則的幾個概念:
關聯規則是形如 X -> Y 的蘊含式,表示通過 X 可以推匯出 Y,X稱為關聯規則的左部(Left Hand Side,LHS),Y 稱為關聯規則的右部(Right Hand Side,RHS)。
關聯規則有兩個指標,分別是支援度(Support)和置信度(Confidence)。關聯規則A -> B 的支援度(support)= P(AB),指的是事件 A 和事件 B 同時發生的概率。置信度(confidence) = P(B|A) = P(AB) / P(A),指的是發生事件A的基礎上,發生事件B的概率。比如,如果尿布->啤酒關聯規則的支援度為 30%,置信度60%,那麼就表示所有的商品交易中,30% 交易同時購買了尿布和啤酒,在購買尿布的交易中,60% 的交易同時購買了啤酒。
關聯規則分析需要從基礎資料中挖掘出支援度和置信度都超過一定閾值的關聯規則,以便在決策中應用。同時滿足最小支援度閾值和最小置信度閾值的規則,稱為強規則。
挖掘關聯規則的主流演算法為 Apriori 演算法。它的基本思想是在資料集中找出同時出現概率符合預定義(Pre-defined)支援度的頻繁項集,而後從以上頻繁項集中,找出符合預定義置信度的關聯規則。
原理:
如果某個項集是頻繁的,那麼它的所有子集也是頻繁的。它的逆否命題是,如果一個項集是非頻繁的,那麼它的所有超集也是頻繁的。
在上圖中,已知陰影項集{商品2,商品3}是非頻繁的。利用這個基礎知識,我們可以知道項集 {商品0,商品2,商品3},{商品1,商品2,商品3} 以及 {商品0,商品1,商品2,商品3} 也是非頻繁的,因為它們是 {商品2,商品3} 的超集。於是在計算過程中,一旦計算出 {商品2,商品3} 的支援度,知道它是非頻繁的後,就可以緊接著排除它的超集,節省了計算工作量。
相關文章
- 關聯規則方法之apriori演算法演算法
- Apriori 演算法-如何進行關聯規則挖掘演算法
- 關聯規則挖掘:Apriori演算法的深度探討演算法
- 機器學習系列文章:Apriori關聯規則分析演算法原理分析與程式碼實現機器學習演算法
- 關聯分析(二)--Apriori演算法演算法
- 關聯分析Apriori演算法和FP-growth演算法初探演算法
- 基於Apriori關聯規則的電影推薦系統(附python程式碼)Python
- Drools規則引擎簡介
- 《Flink入門與實戰》簡介
- RAP簡介教程&常用規則
- Evrete 規則引擎簡介 | baeldungVR
- Spring事物入門簡介及AOP陷阱分析Spring
- PHP入門:常量基本規則PHP
- Fiddler 入門簡介
- Kubernetes入門簡介
- ElasticSearch入門簡介Elasticsearch
- Docker入門簡介Docker
- GraphQL 入門簡介
- CSS 入門簡介CSS
- Redis 入門 - 簡介Redis
- ElasticSearch 入門簡介Elasticsearch
- 直播系統,利用關聯規則實現推薦演算法演算法
- Vue入門到關門之Vue介紹與使用Vue
- Spring Cloud Alibaba系列——Sentinel降級規則簡介與實踐SpringCloud
- Frequent Pattern 資料探勘關聯規則演算法(Aprior演算法) FT-Tree演算法
- 小白入門 - PHP簡介PHP
- Java FX 簡介 與 IDEA JavaFX 開發入門JavaIdea
- 【機器學習】--關聯規則演算法從初識到應用機器學習演算法
- jscodeshift入門簡介&程式碼重構&程式碼分析&&ReactJSReact
- re正規表示式庫的簡介、入門、使用方法
- Python - pydantic 入門介紹與 Models 的簡單使用Python
- phyon快速入門(python簡介)Python
- Android入門教程 | SharedPreferences 簡介Android
- GraphQL 快速入門【1】簡介
- Azure Terraform(一)入門簡介ORM
- 第八篇.HFM規則入門(二)
- ARouter簡單入門和介紹
- Vue.js入門 (一) - 簡介Vue.js