Python Seaborn綜合指南，成為資料視覺化專家

磐创AI發表於2019-10-22

原文網址 : https://www.jiqizhixin.com/articles/2019-10-22-5

Python視覺化

概述

Seaborn是Python流行的資料視覺化庫
Seaborn結合了美學和技術,這是資料科學專案中的兩個關鍵要素
瞭解其Seaborn作原理以及使用它生成的不同的圖表

介紹

一個精心設計的視覺化程式有一些特別之處。顏色突出，層次很好地融合在一起，整個輪廓流動，整個程式不僅有一個很好的美學質量，它也為我們提供了有意義的技術洞察力。

這在資料科學中非常重要，因為我們經常處理大量雜亂的資料。對於資料科學家來說，具有視覺化的能力是至關重要的。我們的利益相關者或客戶將更多地依賴於視覺提示，而不是複雜的機器學習模型。

有大量優秀的Python視覺化庫可用，包括內建的matplotlib。但Seaborn對我來說很重要。它將美學魅力與技術洞察力無縫地結合在一起，我們很快就會看到這一點。

在本文中，我們將瞭解什麼是seaborn以及為什麼應該使用它而不是matplotlib。然後我們將使用seaborn在Python中為資料生成各種不同的視覺化。

什麼是Seaborn?

你曾經在R中使用過ggplot2庫嗎?它是任何工具或語言中最好的視覺化包之一。Seaborn給了我同樣的感覺。

Seaborn是一個構建在matplotlib之上的一個非常完美的Python視覺化庫。

它使我們能夠建立放大的資料視覺效果。這有助於我們理解資料，通過在可視上下文中顯示資料來發現變數或趨勢之間的任何隱藏相關性，而這些相關性最初可能並不明顯。與Matplotlib的低階介面相比，Seaborn具有高階介面。

為什麼應該使用Seaborn而不是matplotlib?

我一直在談論Seaborn是多麼的棒，所以你可能想知道我為什麼這麼大驚小怪。

當我們使用seaborn生成圖時，我將以實際的方式全面地回答這個問題。現在，讓我們快速討論一下seaborn為什麼在matplotlib之上。

Seaborn使我們的圖表和繪圖看起來很吸引人，並支援一些常見的資料視覺化需求(比如將顏色對映到變數或使用分面(faceting))。從根本上說，它使資料視覺化和探索變得很容易。相信我，這在資料科學中不是一件容易的事。

如果Matplotlib"試圖讓簡單的事情變得簡單，而讓困難的事情變得可能"，那麼seaborn也嘗試讓一組定義良好的困難事情變得簡單。——邁克爾·瓦斯科姆(Seaborn的創始人)

在matplotlib中有幾個(很大的)限制是Seaborn已經修復的:

Seaborn提供了大量的高階介面和自定義主題，而matplotlib沒有這些介面，因為很難確定哪些設定使圖表更吸引人
Matplotlib函式不能很好地處理資料流，而seaborn可以

這第二點在資料科學中很突出，因為我們經常使用資料模型。

搭建環境

seaborn庫具有四個必需的必需依賴項:

NumPy (>= 1.9.3)
SciPy (>= 0.14.0)
matplotlib (>= 1.4.3)
Pandas (>= 0.15.2)

要安裝Seaborn並有效地使用它，首先需要安裝前面提到的依賴項。一旦這一步完成，我們都準備安裝Seaborn和享受其迷人的繪圖。要安裝Seaborn，可以使用以下程式碼

要安裝最新版本的seaborn，你可以使用pip:

pip install seaborn

你也可以使用conda安裝最新版本的seaborn:

conda install seaborn

要在程式碼中匯入依賴項和seaborn本身，可以使用以下程式碼

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
from scipy import stats

就是這樣!我們都準備好了詳細地探索seaborn。

用於資料視覺化的資料集

我們將主要處理兩個資料集:

人力資源分析
(https://datahack.analyticsvidhya.com/contest/wns-analytics-hackathon-2018-1/)
預測投票數
(https://datahack.analyticsvidhya.com/contest/enigma-codefest-machine-learning-1/)

之所以選擇這兩個，是因為它們包含多個變數，因此我們有很多選擇可以使用。這兩個資料集還可以模擬現實情況，因此你將瞭解資料視覺化和了解業內的資料視覺化方式。

你可以在DataHack平臺上檢視這個和其他高質量的資料集。因此，請在繼續之前下載上述兩個資料集。我們將一起使用它們。

NumPy 正態分佈與 Seaborn 視覺化指南
2024-05-23
視覺化
從靜態到動態化，Python資料視覺化中的Matplotlib和Seaborn
2024-03-25
Python視覺化
資料視覺化Seaborn從零開始學習教程（三）資料分佈視覺化篇
2019-03-01
視覺化
綜合能源電力視覺化
2022-05-16
視覺化
NumPy 隨機資料分佈與 Seaborn 視覺化詳解
2024-05-21
隨機視覺化
Pandas資料視覺化工具——Seaborn用法整理
2019-01-30
視覺化
python資料視覺化——echarts
2018-10-16
Python視覺化Echarts
python 資料視覺化利器
2019-02-28
Python視覺化
Python 視覺化 | Seaborn5 分鐘入門 (五)——lmplot
2020-01-17
Python視覺化
Python 視覺化 | Seaborn5 分鐘入門 (七)——pairplot
2020-01-17
Python視覺化AI
地理資料視覺化的神奇組合：Python和Geopandas
2024-05-15
視覺化Python
Python資料視覺化matplotlib庫
2019-03-04
Python視覺化
資料視覺化如何選擇合適的視覺化圖表？
2022-11-30
視覺化
什麼是資料視覺化，為什麼資料視覺化很重要？
2022-03-14
視覺化
seaborn和pandas-missingno 的資料視覺化--使用畫圖--缺失值分析
2019-01-01
視覺化
Python 視覺化 | Seaborn5 分鐘入門 (三)——boxplot 和 violinplot
2020-01-17
Python視覺化
Python 視覺化 | Seaborn5 分鐘入門 (四)——stripplot 和 swarmplot
2020-01-17
Python視覺化Swarm
Python 視覺化 | Seaborn5 分鐘入門 (一)——kdeplot 和 distplot
2020-01-17
Python視覺化
資料庫索引：綜合詳細指南
2024-05-25
資料庫索引
Python資料視覺化---pygal模組
2020-04-20
Python視覺化
Python 如何實現資料視覺化
2019-05-11
Python視覺化
使用 Python 進行資料視覺化
2024-07-26
Python視覺化
為什麼要做資料視覺化
2023-12-19
視覺化
資料視覺化Seaborn從零開始學習教程（一）風格選擇
2018-05-18
視覺化
Python 視覺化 | Seaborn5 分鐘入門 (六)——heatmap 熱力圖
2020-01-17
Python視覺化
如何成為資料分析師系列（一）：視覺化圖表初階
2019-01-02
視覺化
python資料分析與視覺化基礎
2024-08-02
Python視覺化
最新Python爬蟲和資料視覺化
2020-12-12
Python爬蟲視覺化
如何使用Python 進行資料視覺化
2020-12-01
Python視覺化
探究為什麼在專案管理中使用資料視覺化？
2022-07-12
專案管理視覺化
資料視覺化Seaborn從零開始學習教程（二）顏色調控篇
2019-03-01
視覺化
為什麼資料視覺化很重要
2022-03-31
視覺化
為什麼要建立資料視覺化
2022-03-22
視覺化
Python疫情資料分析，並做資料視覺化展示
2022-03-08
Python視覺化
[資料分析與視覺化] Python繪製資料地圖2-GeoPandas地圖視覺化
2023-04-09
視覺化Python地圖
NumPy 二項分佈生成與 Seaborn 視覺化技巧
2024-05-27
視覺化
多項分佈模擬及 Seaborn 視覺化教程
2024-06-03
視覺化
資料視覺化平臺由哪些要素組成
2022-03-31
視覺化

Python Seaborn綜合指南，成為資料視覺化專家

概述

介紹

目錄

什麼是Seaborn?

為什麼應該使用Seaborn而不是matplotlib?

搭建環境

用於資料視覺化的資料集

相關文章