PyCon2018：兩款最新ML資料視覺化庫：Altair和Yellowbrick

金正皓發表於2018-06-08

原文網址 : https://juejin.im/post/5b1a1d6b6fb9a01e700ffceb

視覺化AI

原作者：David 9

原文發於作者個人部落格，點選檢視原文，掘金已獲得轉載授權。再次感謝作者。

PyCon2018兩款最新ML資料視覺化庫：Altair和Yellowbrick，函數語言程式設計的視覺化庫和scikit-learn增強視覺化庫

資料科學的視覺化庫和深度學習框架庫一樣，雖然層出不窮，但是大致分為兩種：

一種是通用視覺化庫任何類似json schema的靜態資料都可以用它作圖如： Pandas, Seaborn , ggplot, Bokeh, pygal, Plotly 。

另一種是和框架耦合較高的視覺化庫，如TensorFlow的TensorBoard，scikit-learn增強視覺化庫Yellowbrick。

對於第一種通用庫，方便簡潔、易用的趨勢一直沒有改變。這屆PyCon2018上的talk：Exploratory Data Visualization with Vega, Vega-Lite, and Altair 就介紹了Altair這種新的函數語言程式設計視覺化庫，其簡潔程度，只要拿到panda的dataframe資料，多加一句宣告程式碼，就可以進行視覺化了：

import altair as alt# to use with Jupyter notebook (not JupyterLab) run the following# alt.renderers.enable('notebook')# load a simple dataset as a pandas DataFramefrom vega_datasets import datacars = data.cars()# 這裡是宣告程式碼，是不是有函數語言程式設計的味道 ？alt.Chart(cars).mark_point().encode(    x='Horsepower',    y='Miles_per_Gallon',    color='Origin',)複製程式碼

Altair例程

如果要把點的樣式改成線的樣式，只需把函式mark_point()改成mark_line()即可：

alt.Chart(cars).mark_line().encode(    x='Horsepower',    y='Miles_per_Gallon',    color='Origin',)複製程式碼

這裡可以注意到無論你的car資料集有多少特徵，視覺化時你需要什麼特徵，在encode函式中宣告就可以了。當然，Altair API還有許多便捷的地方，許多例項的jupyterNOTEBOOK例子可以先試試。

而對於和scikit-learn耦合較高的視覺化庫Yellowbrick，甚至在視覺化的過程中，已經融入的訓練過程：

from sklearn.linear_model import LogisticRegressionfrom yellowbrick.classifier import ROCAUC# 初始化分類模型和視覺化logistic = LogisticRegression()visualizer = ROCAUC(logistic)visualizer.fit(X_train, y_train)  # visualizer物件其實就是estimater類的繼承，可以進行fit訓練visualizer.score(X_test, y_test)  # 在測試集上得分g = visualizer.poof()             # 獲得ROCAUC的分析圖複製程式碼

如上述程式碼，在logistic迴歸模型訓練完畢就立即輸出分析圖：

來自：http://www.scikit-yb.org/en/latest/api/classifier/rocauc.html

同樣，PCA分析也一樣，視覺化和訓練程式碼是耦合的：

from yellowbrick.features.pca import PCADecompositionvisualizer = PCADecomposition(scale=True, center=False, color=y)visualizer.fit_transform(X,y)visualizer.poof()複製程式碼

上述程式碼直接實現了兩維的PCA視覺化：

參考文獻：

本文采用署名 – 非商業性使用 – 禁止演繹 3.0 中國大陸許可協議進行許可。著作權屬於“David 9的部落格”原創，如需轉載，請聯絡微信: david9ml，或郵箱：yanchao727@gmail.com

或直接掃二維碼:

Python中2種常用資料視覺化庫：Bokeh和Altair
2024-04-17
Python視覺化AI
Python視覺化神器Yellowbrick使用
2020-04-06
Python視覺化
最新Python爬蟲和資料視覺化
2020-12-12
Python爬蟲視覺化
4款開源免費的資料視覺化JavaScript庫
2020-04-04
視覺化JavaScript
Python資料視覺化matplotlib庫
2019-03-04
Python視覺化
11個React Native 元件庫和 Javascript 資料視覺化庫
2019-04-28
React Native元件JavaScript視覺化
資料視覺化——Matpoltlib庫的使用
2024-03-23
視覺化
資料探索很麻煩？推薦一款史上最強大的特徵分析視覺化工具：yellowbrick
2019-09-04
特徵視覺化
Python基礎演算法庫及視覺化庫使用實踐-大資料ML樣本集案例實戰
2018-12-11
Python演算法視覺化大資料
推薦一款Python資料視覺化神器
2020-05-07
Python視覺化
資料視覺化【十五】
2020-10-14
視覺化
資料看板視覺化
2022-12-15
視覺化
Matlab資料視覺化
2021-04-08
Matlab視覺化
資料視覺化基本原理——視覺化模型
2019-03-01
視覺化模型
python資料視覺化神庫：Matplotlib快速入門
2023-04-27
Python視覺化
【推薦】常見的Python資料視覺化庫
2021-06-10
Python視覺化
常見的6個Python資料視覺化庫！
2023-01-29
Python視覺化
使用 TensorBoard 視覺化模型、資料和訓練
2021-01-20
ORB視覺化模型
什麼是資料視覺化，為什麼資料視覺化很重要？
2022-03-14
視覺化
資料視覺化--實驗五：高維非空間資料視覺化
2021-01-01
視覺化
七款Python資料視覺化利器，任何一款都能滿足你
2018-12-15
Python視覺化
什麼是資料視覺化？hightopo資料視覺化助力企業數字化
2021-12-08
視覺化
視覺化之資料視覺化最強工具推薦
2023-02-27
視覺化
視覺化！一款基於實體連線圖的資料庫設計工具！
2024-10-10
視覺化資料庫
資料視覺化實踐
2018-10-25
視覺化
python資料視覺化——echarts
2018-10-16
Python視覺化Echarts
如何看待資料視覺化？
2019-03-06
視覺化
視覺化中的資料
2019-02-27
視覺化
python 資料視覺化利器
2019-02-28
Python視覺化
資料視覺化的秘密
2020-02-06
視覺化
【matplotlib教程】資料視覺化
2024-08-23
視覺化
資料視覺化的作用
2020-12-11
視覺化
12個流行的Python資料視覺化庫總結
2019-01-11
Python視覺化
資料視覺化，BizCharts圖表庫入坑歷程
2018-12-11
視覺化
視覺化資料庫管理工具：SQLPro Studio for Mac
2024-01-24
視覺化資料庫SQLMac
大神總結：做資料視覺化，謹記三要、兩不要
2023-11-02
視覺化
資料視覺化能否代替資料分析
2021-12-01
視覺化
如何使用Plotly和Dash進行資料視覺化
2024-04-15
視覺化

PyCon2018：兩款最新ML資料視覺化庫：Altair和Yellowbrick

相關文章