太愛了!一款基於智慧推薦的Python資料探索(EDA)工具來了!
作為一名資料科學家,資料探索(EDA) 是我們的日常工作。對於資料科學家來說,沒有比資料探索技能更重要的了。雖然這很重要,但我們知道這個過程很麻煩,有時也非常浪費時間。此外,很多時候,我們不知道從哪裡開始探索資料。
下面以 mpg 資料集為例進行分析:
import pandas as pd
import seaborn as sns
mpg = pd.read_csv('seaborn-data-master/mpg.csv')
mpg.head()
我們知道 Python 中有 Pandas Profiling、PandasGUI 這樣的資料探索工具包,但論實用性方面,我更推薦使用 Lux 這款工具!
Lux
Lux 是 Python 中的開源包,它通過自動化資料探索過程使資料科學更加容易,幫助我們更智慧地利用它們的建議來探索資料。
讓我們從安裝包開始。
pip install lux-api
安裝完軟體包後,我們需要在 jupyter notebook 中啟用 lux 小部件。
jupyter nbextension install --py luxwidget
jupyter nbextension enable --py luxwidget
現在,讓我們嘗試使用 Lux 包來瀏覽我們的資料。首先需要匯入包以在 notebook 中自動設定小部件。我們使用上面所講述的 mpg 資料集。
import lux
mpg
使用 Lux 包,我們可以看到一個新的按鈕稱為"pandas/Lux",我們可以嘗試按下該按鈕。
Lux 基本視覺化
Lux 會自動根據資料集建立一組視覺化效果。預設情況下,建立三個視覺化類別:相關性、分佈和發生。
"相關性"選項卡包含兩個變數之間的所有數值關係,這些變數由散點圖視覺化。你可以在上面的圖片中看到示例。
"分佈"選項卡顯示一個數字變數,其中變數使用直方圖圖進行視覺化。
"發生"選項卡顯示分類變數的計數圖。它顯示分類變數中的每個類頻率,如下圖所示。
基於 Lux 推薦的視覺化
除了資料框視覺化之外,我們還可以在 Lux 中指定我們感興趣的 Lux 屬性和值,以指導資料探索的潛在下一步。
如果我對 “mpg” 和"horsepower" 屬性都感興趣。我們可以在 Lux 包中指定它,以指導我們使用該方法。
mpg.intent = ['mpg', 'horsepower']
Lux 為我們提供了視覺化建議。我們可以看到三種不同的選項:增強、篩選和概括。
"增強"選項卡通過將附加變數新增到當前意圖中來顯示視覺化建議。
"篩選"選項卡將篩選器新增到已設定的當前意圖中;"篩選"選項卡將"篩選"新增到已設定的當前意圖中。在固定屬性(X 軸和 Y 軸上)時完成此設定。該建議將向我們顯示從另一個變數篩選的變數之間的關係。從下圖中可以看到散點圖由列具有的每個 model_year 變數篩選。
"概括"選項卡將刪除屬性以顯示更通用的趨勢,顯示屬性的分佈。目的是關注我們感興趣的當前屬性。
Lux 匯出視覺化效果
上圖中我給出一個紅色圓圈。有了這個,我們已經成功地匯出了圖表。
結論
Lux是一個基於推薦的系統 EDA,可幫助我們快速訪問資料。該包幫助我們提供所有可能的資料組合,並基於我們自己的意圖探索資料。如果你對lux非常感興趣,可以閱讀如下連結:
https://github.com/lux-org/lux#
更多技術交流
為方便技術交流,本號開通了技術交流群,有問題請新增小助手微訊號:connect_we,備註:CSDN。
相關文章
- 太香了,牆裂推薦3個Python資料分析EDA神器!Python
- AI來了,國產EDA工具的春天到了?AI
- 愛了愛了!豐巢智慧政務櫃真的太實用了
- 想要一款iOS向量繪圖程式設計工具?推薦來了iOS繪圖程式設計
- 推薦 12 個提升程式設計師軟技能與效率的必備工具,愛了愛了 ?程式設計師
- 愛了愛了!推薦一個Github 70k+點讚的Java學習指南!GithubJava
- 個性化推薦系統來了
- 資料清洗太難了?那是你沒有好工具,讓Smartbi來幫你!
- 這兩個小工具,真是推薦了還想推薦。
- 不推薦別的了,IDEA 自帶的資料庫工具就很牛逼!Idea資料庫
- 推薦一款Python資料視覺化神器Python視覺化
- linux ln 軟連結的妙用 -太愛了Linux
- 資料庫開發工具界的ChatGPT來了資料庫ChatGPT
- 資料探索很麻煩?推薦一款史上最強大的特徵分析視覺化工具:yellowbrick特徵視覺化
- 你的 Mac 用對了嗎,好用的Mac工具推薦Mac
- 推薦一款簡歷神器,找工作再也不愁了
- HTML5來了:推薦5個好用的混合式App開發工具HTMLAPP
- 做資料分析,推薦7款好用的Python工具!Python
- 推薦六個用於大資料分析的最好工具大資料
- 推薦一款好用的資料一致性校驗工具
- 推薦一款專為新手用的Python開發工具Python
- 這8個工具,用來做python應用程式開發太合適了!Python
- LibRec: 基於機器學習的大資料推薦系統機器學習大資料
- 推薦一款基於vue的滾動條外掛vuescrollVue
- 推薦一款MySQL優化工具MySql優化
- "探索未來智慧:AI技術一網打盡!"(推薦收藏)AI
- 知了 | 基於NLP的智慧問答推薦系統
- 肝了一週的 UDP 基礎知識終於出來了。UDP
- python 人工智慧資源推薦Python人工智慧
- 太強了!這款仿微信的聊天工具開源了!
- 小夥伴說VuePress太簡潔了,還有沒有其他部落格推薦?Vue
- 推薦一款網路資料抓包分析工具:Debookee 7 Mac版Mac
- 推薦一款基於Vue的Markdown編輯器外掛——mavonEditorVue
- 基於物件特徵的推薦物件特徵
- 推薦一款基於nodejs+koa+vue開發的開源智慧物業系統NodeJSVue
- 基於AI+資料驅動的慢查詢索引推薦AI索引
- 給大家推薦一個整合了python和bash的神器,xonshPython
- 來了來了,CSS 版的冰墩墩來了……CSS