一文教會你用資料探勘看全國兩會“熱詞”

環音儀資料發表於2022-03-17

全國兩會上週在北京召開。兩會集眾智,聚群力,開新篇,謀新篇。全國兩會作為每年定期召開的關係國計民生的政治性會議,是外國瞭解中國的重要視窗,也是與人民生活息息相關的風向標。

 

全國兩會集中了全國各族人們的智慧,凝聚了人民的需求和意見。就業、婚戀等民生議題關係到人民的日常生活,巨集觀經濟政策關係到企業的發展方向,企業需要根據政策改動調整戰略目標才能提高自身的競爭力。


兩會提及了這麼多的內容,怎樣才能快速地知曉兩會“熱詞”及相關內容呢?Smartbi Mining來教你快速看“熱詞”。Smartbi Mining是一站式視覺化的 ,是廣州思邁特軟體公司的明星產品。Smartbi Mining可以通過資料探勘迅速生成兩會“熱詞”,無需程式設計技術,新手小白也可以掌握,只要簡單的滑鼠操作便可完成資料探勘。

下面來演示一下。

1.新建實驗


開啟預設介面,即‘實驗管理’介面,該介面可以進行‘新建實驗’:


新建方式1:在資料夾右鍵選單‘新建’中單擊‘實驗’;


新建方式2:單擊‘新建實驗’。


一文教會你用資料探勘看全國兩會“熱詞”577.png 

2.選擇資料來源


根據原始資料存放的方式在選擇資料來源節點,將資料來源節點拖拽至畫布區域,並在引數皮膚上進行資料來源資訊的設定。


一文教會你用資料探勘看全國兩會“熱詞”640.png 

3.模型搭建


特徵選擇:將你關注的關鍵詞,比如放假、假期、春假作為特徵列,而‘是否提及’做為標籤列;


拆分:將資料集進行拆分,一部分資料用來訓練模型,另一部分用來驗證經過訓練的模型效果如何;


一文教會你用資料探勘看全國兩會“熱詞”738.png 

4.訓練&預測


訓練:訓練節點的輸入分為兩部分,左邊為演算法節點,右邊為訓練資料集,模型通過對訓練集資料中特徵列的資料進行學習,並根據標籤列的資料,確認具有何種特徵的資料可能與“假期”有關,進而使模型獲得能夠識別關於“假期”的能力;


預測:預測節點的輸入分為兩部分,左邊為訓練好的模型,右邊為測試資料集,模型運用識別流失客戶的能力,對測試集中的特徵列資料進行處理,並獲得是否為放假的標記,這裡的標記是模型給出的結論,並非測試集中標籤列的資料。


  一文教會你用資料探勘看全國兩會“熱詞”961.png

5.結果評估


評估:通過對比模型預測結果與測試集資料之間的差異,可以評價模型的效果。


一文教會你用資料探勘看全國兩會“熱詞”1007.png 


從下面最終輸出評價結果可以看到這個模型的準確率高達95%。

 

一文教會你用資料探勘看全國兩會“熱詞”1040.png


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69985379/viewspace-2871776/,如需轉載,請註明出處,否則將追究法律責任。

相關文章