一文教會你用資料探勘看全國兩會“熱詞”
全國兩會上週在北京召開。兩會集眾智,聚群力,開新篇,謀新篇。全國兩會作為每年定期召開的關係國計民生的政治性會議,是外國瞭解中國的重要視窗,也是與人民生活息息相關的風向標。
全國兩會集中了全國各族人們的智慧,凝聚了人民的需求和意見。就業、婚戀等民生議題關係到人民的日常生活,巨集觀經濟政策關係到企業的發展方向,企業需要根據政策改動調整戰略目標才能提高自身的競爭力。
兩會提及了這麼多的內容,怎樣才能快速地知曉兩會“熱詞”及相關內容呢?Smartbi Mining來教你快速看“熱詞”。Smartbi Mining是一站式視覺化的 ,是廣州思邁特軟體公司的明星產品。Smartbi Mining可以通過資料探勘迅速生成兩會“熱詞”,無需程式設計技術,新手小白也可以掌握,只要簡單的滑鼠操作便可完成資料探勘。
下面來演示一下。
1.新建實驗
開啟預設介面,即‘實驗管理’介面,該介面可以進行‘新建實驗’:
新建方式1:在資料夾右鍵選單‘新建’中單擊‘實驗’;
新建方式2:單擊‘新建實驗’。
2.選擇資料來源
根據原始資料存放的方式在選擇資料來源節點,將資料來源節點拖拽至畫布區域,並在引數皮膚上進行資料來源資訊的設定。
3.模型搭建
特徵選擇:將你關注的關鍵詞,比如放假、假期、春假作為特徵列,而‘是否提及’做為標籤列;
拆分:將資料集進行拆分,一部分資料用來訓練模型,另一部分用來驗證經過訓練的模型效果如何;
4.訓練&預測
訓練:訓練節點的輸入分為兩部分,左邊為演算法節點,右邊為訓練資料集,模型通過對訓練集資料中特徵列的資料進行學習,並根據標籤列的資料,確認具有何種特徵的資料可能與“假期”有關,進而使模型獲得能夠識別關於“假期”的能力;
預測:預測節點的輸入分為兩部分,左邊為訓練好的模型,右邊為測試資料集,模型運用識別流失客戶的能力,對測試集中的特徵列資料進行處理,並獲得是否為放假的標記,這裡的標記是模型給出的結論,並非測試集中標籤列的資料。
5.結果評估
評估:通過對比模型預測結果與測試集資料之間的差異,可以評價模型的效果。
從下面最終輸出評價結果可以看到這個模型的準確率高達95%。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69985379/viewspace-2871776/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料看兩會,引領數字經濟浪潮!代表們熱議話題你Get了嗎?大資料
- 兩會報導大資料:近9成網路受眾用手機看兩會大資料
- Python資料分析(一)--numpy全知全會Python
- 全圖文教你Chrome瀏覽器如何加入brupsuite新增ssl證書(一看就會)Chrome瀏覽器UI
- Hippo如何進入WebAssembly?一文教會你Web
- 一文教會你認識Vuex狀態機Vue
- 一文教會你mock(Mockito和PowerMock雙劍合璧)Mockito
- 如果不會這兩招,千萬不要說你懂大資料大資料
- 資料探勘,人工智慧,機器學習會議總結人工智慧機器學習
- 一文教會你如何寫複雜業務程式碼
- 用Python做商業資料探勘,你學廢了嗎?Python
- 你真的會看異常堆疊資訊麼
- 你是否 STL 不會用一點?
- 學會用這些“套路”,你才算資料分析師
- 資料探勘比賽/專案全流程介紹
- 資料分析之全國熱門景點分析
- 盤點實用資料分析工具,你若一個都不會,那就太可惜了!
- 這3款資料探勘工具,你看中了哪一款?
- 一招教會你處理Flutter中的資料Flutter
- 【前端詞典】繼承(一) – 面試官問的你都會嗎?前端繼承面試
- 【前端詞典】繼承(一) - 面試官問的你都會嗎?前端繼承面試
- 個人資訊保護成兩會熱點 各方獻計力求更進一步
- 國家能源局:2020年中國全社會用電量資料
- 大資料應用——資料探勘之推薦系統大資料
- 千鋒1024程式設計師節,熱門崗位雙選會全國開啟,你準備好了麼?程式設計師
- 中國(北京)國際大資料及雲端計算展覽會暨第四屆中國資料分析行業峰會火熱報名中大資料行業
- 你真的會使用資料庫的索引嗎?資料庫索引
- 你真的會用mysql行級鎖嗎?mysql 行級鎖全解析MySql
- 談一談資料探勘的軍規
- 一週熱門IT技術大會
- 大資料很難?職場老鳥告訴你,會用EXCEL就行大資料Excel
- 資料探勘在醫學大資料研究中的應用大資料
- 如果你也用Chrome,你會發現這樣一條警告!!!Chrome
- 阿里雲資料視覺化峰會——喚醒資料,看見未來阿里視覺化
- 2020年帶你學會全網營銷
- 資料探勘( TO DO LIST)
- 資料探勘技術
- 資料探勘與生活