大資料丨Sogou搜狗業務OP任嘉興帶你解讀“網際網路醫美商品推薦機制”
2023年"FI-BI資料競賽"將圍繞十大行業主題展開:零售電商、銀行金融、醫藥健康、交通物流、地產建築、能源化工、機械製造、教育培訓、公共服務、社會熱點。旨在幫助相關從業人員提升資料分析技能,引領開啟關注資料價值、釋放資料無限潛能的科技風尚。
網際網路醫美髮展之本在於直擊傳統醫美的行業痛點,透過多種手段建立高效資訊溝通渠道,鑑別正規醫美機構,最終重建消費者對於醫美消費的慾望,降低獲客難度,促進網際網路醫美平臺向良性發展。
本期我們將圍繞線上醫療美容的商品推薦模組,詳解其資料背後的演算法及推薦邏輯。
Sogou搜狗作為知名網際網路上市公司,一直致力於AI實用導向,同時在醫療搜尋方面有所建樹,成功取得了線上醫院牌照,獲准透過網際網路開展醫療業務。
本期分享嘉賓任嘉興,來自Sogou搜尋業務線,在產品設計、運營運維、資料分析方面有著多項行業優秀案例。
專案簡介
本案例為嘉賓過往真實案例分享,其中涉及商業機密數值均進行了模糊處理
-
專案TOB:四川省某醫美網際網路巨頭(年營業額≈4億)
-
專案背景:隨著線上使用者量的不斷增長,需要對使用者潛在消費需求進行精準洞察,從而 幫助企業挖掘使用者最大價值
-
專案需求:構建醫美線上商城個性化推薦演算法,實現商品關聯推薦
專案目標
透過對醫美線上商城的購買資料進行科學分析,得到自主使用者的購買行為特徵,挖掘商品的關聯性規律,建設商品智慧推薦機制
-
構建線上商品的關聯規則模型,分析商品之間的關聯性
-
根據模型輸出結果實現商品推薦
分析思路
關聯分析主要透過以下指標進行衡量
過程簡述
一、資料基礎處理:
1.1資料欄位獲取
獲取線上商城近1年的自主使用者訂單資料(排除非自主下單)
-
使用者id
-
使用者型別(新客/老客)
-
商品品類id
-
商品A(完成購買並核銷)
-
商品A瀏覽次數
-
商品B(瀏覽次數高且未購買)
-
商品B瀏覽次數
1.2異常值處理
-
四分位數分箱(QUARTILE(col:col,1,2,3))
-
四分位數差(IQR)
-
空值(NONE)
-
極大值(MAX(col:col))
-
極小值(MIN(col:col))
-
異常值
-
標準化
-
其它條件規則
二、資料細化處理
2.1計算商品A/B出現次數
商品A是使用者在對應品類下購買核銷商品的集合,並獲取每個商品出現的次數,例如透過在表單中使用"關鍵詞萬用字元"模糊匹配商品A/B,從而獲取每個商品的出現次數,並求和計數項
=VLOOKUP("*"關鍵詞"*",商品A,1,)
=VLOOKUP("*"關鍵詞"*",商品B,1,)
2.2計算商品A和商品B共現次數
當商品A與商品B共現次數越多,則可以認為商品A和商品B的關聯度越高;反之則關聯度越低
=IF(AND(商品A=”【急納美眼第八代】”,商品B=”【急納美眼第9代】”),1,IF(AND(商品B=”【急納美眼第八代】”,商品A=”【急納美眼第9代】”),1);無論"A共現B"還是"B共現A",都視為一次共現關係,並求和計數項
2.3計算商品AB總數
=COUNTA(表單區域)商品A和商品B,並求和計數項
三、資料建模處理
3.1計算支援度
P(AnB),即商品A和商品B同時出現的機率,可以判斷該共現組合的可信程度
支援度=AB共現次數/商品總數*100%
3.2計算置信度
P(A|B) ,即AB共現次數佔商品A出現次數的佔比,可以衡量商品A對商品B產生了多大的影響
置信度=AB共現次數/商品A出現次數*100%
3.3計算提升度
L= P(AnB)/[P(A)*P(B)],即判斷AB商品被購買的次數是否高於單獨商品的購買次數,可自定義區間值以簡化模型
提升度=支援度/((購買A的訂單數/總購買訂單數)*(購買B的訂單數/總購買訂單數))
3.4計算推薦值
推薦值=SUM(支援度+置信度+提升度),數值越大則判斷商品關聯程度越高;理論上當使用者產生的行為資料越多,則該推薦模型越準確
最終生成全品類醫美商品的相關性網路,並透過權重倒序,實現對不同的使用者推薦不同的商品
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70026929/viewspace-2936184/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【工業網際網路】重磅推薦:工業網際網路成熟度評估模型模型
- 淺談“政務網際網路+”&“政務大資料”大資料
- 規範網際網路資訊服務演算法推薦活動WIOT演算法
- 中醫藥產業資訊分會:2021年網際網路+中醫醫療資料包告產業
- 揭開網際網路公司的神秘面紗,資料解讀那些slay整個行業的網際網路公司行業
- 網際網路如何推廣 網際網路推廣
- 工信部:發展工業網際網路平臺 推進製造業和網際網路、大資料、人工智慧深度融合...大資料人工智慧
- 醫療大資料Topic推薦-AMiner大資料
- 2023年最全YouTube推薦演算法機制解讀:帶你瞭解影片爆量的秘密演算法
- 網際網路怎樣推廣 網際網路如何推廣
- 海通國際:網際網路醫療行業投資策略(附下載)行業
- 網際網路如何推廣 揭祕網際網路推廣方法
- 10 款網際網路運營必備工具推薦
- 網際網路技術大佬獨立部落格推薦
- 智慧制動器參加“匯新杯”新興科技+網際網路創新大賽
- 企業工商大資料API在網際網路行業的應用大資料API行業
- 【工業網際網路】郭朝暉:工業網際網路平臺背景下的工業大資料與智慧製造大資料
- 行業分析| 網際網路醫療的發展行業
- 資料探勘與分析(網際網路行業)行業
- 網際網路,IT,大資料,機器學習,AI知識tag雲大資料機器學習AI
- 新氧收購網路小貸,掀起網際網路醫美生態進階
- “匯新杯”新興科技+網際網路創新大賽
- Fastdata:2020年中國網際網路醫美行業發展分析報告AST行業
- 揭祕網際網路是如何的推廣 網際網路如何推廣
- 【工業網際網路】苗凱翔 : 大資料與霧計算:端到端工業網際網路的重要趨勢大資料
- “網際網路+”在醫療行業中的應用行業
- 網際網路巨頭究竟拿了你的哪些資料?
- 【工業網際網路】ThingWorx賦能工業創新平臺;解讀智慧製造與工業網際網路前沿趨勢
- 【工業網際網路】ThingWorx賦能工業創新平臺;解讀智慧製造與工業網際網路前沿趨勢...
- 網際網路如何推廣
- 觀點解讀:工業網際網路安全能力構建
- 知物由學 | 一文讀懂網際網路內容稽核機制
- 淺談網際網路公司業務安全
- 【工業網際網路】透析富士康上市:工業網際網路不可錯過的投資機會?
- 推進“網際網路+政府採購”,完善評標專家考核和退出機制
- 守護工業網際網路安全|綠盟工業網際網路平臺企業安全綜合防護方案榮獲嘉獎
- 大資料在網際網路時代的意義!大資料
- 【乾貨】最全最豐富的工業網際網路方案及報告資源平臺推薦!