一文教會你用資料探勘看全國兩會“熱詞”
全國兩會上週在北京召開。兩會集眾智,聚群力,開新篇,謀新篇。全國兩會作為每年定期召開的關係國計民生的政治性會議,是外國瞭解中國的重要視窗,也是與人民生活息息相關的風向標。
全國兩會集中了全國各族人們的智慧,凝聚了人民的需求和意見。就業、婚戀等民生議題關係到人民的日常生活,巨集觀經濟政策關係到企業的發展方向,企業需要根據政策改動調整戰略目標才能提高自身的競爭力。
兩會提及了這麼多的內容,怎樣才能快速地知曉兩會“熱詞”及相關內容呢?Smartbi Mining來教你快速看“熱詞”。Smartbi Mining是一站式視覺化的 ,是廣州思邁特軟體公司的明星產品。Smartbi Mining可以通過資料探勘迅速生成兩會“熱詞”,無需程式設計技術,新手小白也可以掌握,只要簡單的滑鼠操作便可完成資料探勘。
下面來演示一下。
1.新建實驗
開啟預設介面,即‘實驗管理’介面,該介面可以進行‘新建實驗’:
新建方式1:在資料夾右鍵選單‘新建’中單擊‘實驗’;
新建方式2:單擊‘新建實驗’。
2.選擇資料來源
根據原始資料存放的方式在選擇資料來源節點,將資料來源節點拖拽至畫布區域,並在引數皮膚上進行資料來源資訊的設定。
3.模型搭建
特徵選擇:將你關注的關鍵詞,比如放假、假期、春假作為特徵列,而‘是否提及’做為標籤列;
拆分:將資料集進行拆分,一部分資料用來訓練模型,另一部分用來驗證經過訓練的模型效果如何;
4.訓練&預測
訓練:訓練節點的輸入分為兩部分,左邊為演算法節點,右邊為訓練資料集,模型通過對訓練集資料中特徵列的資料進行學習,並根據標籤列的資料,確認具有何種特徵的資料可能與“假期”有關,進而使模型獲得能夠識別關於“假期”的能力;
預測:預測節點的輸入分為兩部分,左邊為訓練好的模型,右邊為測試資料集,模型運用識別流失客戶的能力,對測試集中的特徵列資料進行處理,並獲得是否為放假的標記,這裡的標記是模型給出的結論,並非測試集中標籤列的資料。
5.結果評估
評估:通過對比模型預測結果與測試集資料之間的差異,可以評價模型的效果。
從下面最終輸出評價結果可以看到這個模型的準確率高達95%。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69985379/viewspace-2871776/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 《資料探勘:實用機器學習技術》——資料探勘、機器學習一舉兩得機器學習
- 大資料看兩會,引領數字經濟浪潮!代表們熱議話題你Get了嗎?大資料
- Hippo如何進入WebAssembly?一文教會你Web
- 大資料成兩會熱詞阿里雲釋出“郡縣圖治”2.0版本大資料阿里
- 一文教會你認識Vuex狀態機Vue
- 兩會報導大資料:近9成網路受眾用手機看兩會大資料
- 資料分析之全國熱門景點分析
- 一文教會你如何寫複雜業務程式碼
- 一文教會你mock(Mockito和PowerMock雙劍合璧)Mockito
- 用Python做商業資料探勘,你學廢了嗎?Python
- 《資料探勘R語言實戰》圖書介紹,資料探勘相關人員看過來!R語言
- 一招教會你處理Flutter中的資料Flutter
- 你用 Python 做過什麼有趣的資料探勘專案?Python
- 【python資料探勘課程】十三.WordCloud詞雲配置過程及詞頻分析PythonCloud
- Python 中的實用資料探勘Python
- 資料探勘,人工智慧,機器學習會議總結人工智慧機器學習
- 一文講清:資料分析與資料探勘到底有什麼區別?
- 自學資料探勘
- Web資料探勘Web
- 序列資料探勘
- 資料探勘概念
- 大資料應用——資料探勘之推薦系統大資料
- 如果不會這兩招,千萬不要說你懂大資料大資料
- 資料探勘——認識資料
- 資料探勘在醫學大資料研究中的應用大資料
- 資料探勘者與資料探勘青年的對話(轉)
- 資料探勘( TO DO LIST)
- 資料探勘與生活
- 資料探勘的功能
- 神奇的資料探勘
- 資料探勘概述 (轉)
- 資料探勘方向分析
- 資料探勘技術
- 資料探勘的資料分析方法
- 資料探勘與資料抽樣
- 用R讀取PDF並進行資料探勘
- ES 實現實時從Mysql資料庫中讀取熱詞,停用詞MySql資料庫
- 資料探勘技術在軌跡資料上的應用實踐