如何利用機器學習創造價值?
想象一下這樣一個場景:老闆要求你構建一個機器學習模型,對每個月訂閱服務中流失的客戶進行預測。而客戶流失被定義為超過31天沒有活動。你可以透過人工的辦法統計客戶流失的數量,並採用頭腦風暴和工程師特徵的歷史例項來精心估測,然後訓練並人工調整機器學習模型以進行預測。
你可能對於測試集的指標感到滿意,然後將這個結果提交給到你的老闆。但現在你必須要開發一個不同的解決方案:每兩週進行一次預測,並將客戶流失定義為14天沒有活動。令人沮喪的是,你可能發現以前的工作都不能重複使用,因為它是針對單個預測問題而設計的。
於是,你要為這個狹窄的流失定義編寫了一個標記函式,並且管道中的特徵工程和建模中下游步驟也依賴於初始引數,並且必須重做。由於對一組特定值進行硬編碼,你必須構建一個全新的管道來解決問題定義中的微小變化。
構建機器學習過程
這種情況表明目前將如何解決機器學習問題。該過程是臨時的,即使使用相同的資料,也需要為每個引數集提供自定義解決方案。其結果是錯過了機器學習的全部好處,因為它們僅限於用時間密集的方法解決少數問題。
缺乏標準化的方法意味著不存在解決機器學習問題的框架,而機器學習可以快速地適應並部署為問題變化的引數。
我們如何改進這個過程?使機器學習更容易獲取將需要一個用於建立和解決問題的通用框架。該框架應適應現有工具,能夠快速適應不斷變化的引數,適用於不同行業,並提供足夠的結構,為資料科學家提供一條明確的途徑,用於佈置和解決機器學習中的具有意義的問題。
我們在特徵實驗室(Feature Labs)對如何解決這個問題進行了大量思考,並開發了我們認為透過機器學習解決有用問題的更好方法。在本系列接下來的三部分中,我將介紹如何以結構化、可重複的方式構建框架和構建機器學習解決方案,這些方法是圍繞預測工程、特徵工程和建模的步驟構建的。
我們將逐步介紹完全應用於預測客戶流失的一個用例的方法,並瞭解如果問題的引數發生變化,將如何調整解決方案。此外,我們將能夠採用用於機器學習的Pandas、Scikit-Learn、Featuretools等現有的特徵工具。
通用的機器學習框架概述如下:
(1)預測工程:陳述業務需求,轉化為機器學習問題,並從資料集生成標記示例。
(2)特徵工程:從每個標籤的原始資料中提取預測變數,也就是特徵。
(3)建模:在部署到新資料之前,針對特徵訓練機器學習模型,調整業務需求並驗證預測。
我們將逐步介紹每個步驟的基礎知識以及如何在程式碼中實現它們。完整的專案在GitHub上以Jupyter Notebooks的形式提供。(我在Feature Labs工作,Jupyter Notebooks是一個初創的開發工具,包括用於解決機器學習問題的Featuretools。這裡記錄的所有工作都是用開源工具和資料完成的。) https://github.com/Featuretools/predicting-customer-churn
雖然該專案僅討論了一個應用程式,但可以跨行業應用相同的流程來構建有用的機器學習解決方案。最終交付成果是一個框架,可用於解決任何領域的機器學習問題,並且可直接應用於你自己的客戶流失資料集的特定解決方案。
商業動機:確保解決正確的問題
除非可以為公司創造價值,否則最複雜的機器學習管道將不會產生任何影響。因此,構建機器學習任務的第一步是瞭解業務需求,以便確定要解決的正確問題。在這個系列中,我們將處理解決客戶流失的常見問題。
對於基於訂閱的商業模式,預測哪些客戶會流失,並停止在指定的時間段內支付服務費用,這至關重要。準確預測客戶是否流失以及何時會流失,可以讓企業與那些有退訂風險的客戶進行互動,或者為降低費率提供優惠,以此作為維持訂閱的激勵動力。有效的客戶流失預測模型使公司能夠積極主動地擴大客戶群。
對於客戶流失問題,業務需求是:
透過降低客戶流失率來增加付費使用者的數量。
減少客戶流失傳統的方法需要使用生存分析技術來預測哪些客戶會流失,但是,考慮到大量的歷史客戶行為資料,這提供了監督機器學習的理想應用。
https://towardsdatascience.com/survival-analysis-in-python-a-model-for-customer-churn-e737c5242822
我們可以透過構建監督演算法來解決機器學習的業務問題,該演算法從過去的資料中學習以預測客戶流失。
陳述業務目標並根據機器學習可解決的任務表達它是管道中關鍵的第一步。一旦我們知道我們希望模型預測到什麼,就可以繼續使用可用資料來開發和解決受監督的機器學習問題。
下一步發展
在接下來的三篇文章中,我們將應用預測工程、特徵工程和建模框架來解決亞洲最大的訂閱音樂流媒體服務KKBOX的客戶流失問題。
查詢以下帖子(或檢視GitHub儲存庫):
https://github.com/Featuretools/predicting-customer-churn
1.預測工程:如何設定機器學習問題
2.特徵工程:為機器學習提供動力(即將推出)
3.建模:訓練演算法進行預測(即將推出)
我們將看到如何使用現有的資料科學工具填充細節,以及如何在不重寫整個管道的情況下更改預測問題。最後,我們將有一個有效的模型來預測流失,並調整以滿足業務需求。
透過這些文章,我們將看到一種機器學習方法,可以讓我們快速構建多個預測問題的解決方案。下次你的老闆再次要求更改問題引數時,你就可以啟動並執行新的解決方案,只需對程式碼進行更改即可。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545819/viewspace-2220766/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 用 AI 發電?機器學習激發風能利用價值AI機器學習
- 夜遊專案如何創造價值及實現價值
- 機器學習就業形勢降至冰點?對創造價值的人來講,前景依然光明機器學習就業
- 如何創造資料資產價值?如何對內賦能業務運營,對外創造市場價值?
- 機器學習到底能創造什麼價值?我們精選了9位從業者的答案機器學習
- 如何輕鬆利用GPU加速機器學習?GPU機器學習
- 把握融合之道 推進價值創造
- 疫情之下,IT部門該如何為企業創造更多價值?
- L.E.K.:人工智慧如何創造商業價值?人工智慧
- 學習Web前端,如何提升自我價值Web前端
- 麥肯錫:虛擬世界的價值創造虛擬世界
- 數字化趨勢與創造價值《轉》
- 如何學習機器學習機器學習
- 價值創造的驅動力 看華為伺服器的“智變”伺服器
- 如何利用機器學習甄別淘寶優質店鋪機器學習
- ERP系統能夠為企業創造哪些價值
- 普華永道:交易價值創造之道(附下載)
- ContentBox 用“數字內容+區塊鏈”創造價值區塊鏈
- 機器在數學上能否擁有創造性
- 機器學習之分類:指定閾值機器學習
- 強化學習-學習筆記2 | 價值學習強化學習筆記
- 《創造力:內容元價值之AIGC核心價值與生態影響洞察》重磅釋出,聚焦AIGC創造能力與內容新生態AIGC
- 協同儲存,為邊緣計算創造更大價值
- 人工智慧:汽車行業的新價值創造引擎人工智慧行業
- 醫療機器人的臨床價值≠商業價值、創新≠創業,關於產業轉化,這些值得思考機器人創業產業
- 【機器學習】2018年機器學習技術改變製造業的十種方式機器學習
- 機器人想要什麼:利用機器學習有效地進行教學機器人機器學習
- 如何管理機器學習模型機器學習模型
- 波士頓諮詢:2023年保險價值創造者報告
- 讓技術創造價值之手把手教你薅羊毛篇
- 埃森哲:通過基本建設專案創造更多價值
- YottaChain:數字貨幣YTA助力資料儲存創造價值AI
- Gartner:AI增強將創造2.9萬億美元的商業價值AI
- 電信:在顛覆性時代創造價值(附下載)
- 【機器學習】數值分析02——任意方程求根機器學習
- 機器學習之迴歸分析--預測值機器學習
- 老生常談:什麼樣的(機器學習)結果才有推廣(泛化)價值機器學習
- 學習觀察-價值流程圖(VSM)流程圖