【Pandas】簡單介紹
Pandas(panel data & Data Analysis):Python資料分析庫。
是基於Numpy的,專用於資料分析的Python第三方庫,最適用於處理大型結構化表格資料
- Pandas最初是對衝基金公司開發出來做金融量化資料分析的Python庫
- Pandas借鑑了R的資料結構
- Pandas基於Numpy搭建,支援Numpy中定義的大部分計算
- Pandas提供了大量和其他技術互動的介面(比如IO工具 (CSV, XLSX, HDF5, ...),視覺化(封裝pyplot),方便和其他語言技術的互動和功能擴充套件
- Pandas底層用Cython和C做了速度優化,極大提高了執行效率
Pandas庫的資料型別:
- Series 一維
- DataFrame 二維,Series容器,最常用
- Panel 三維,DataFrame容器
Python的list列表,Numpy的ndarray陣列和Pdandas的Series
- list:Python自帶資料型別,功能簡單,操作複雜,效率低
- ndarray(Numpy):基礎資料型別,關注資料結構/運算/維度(資料間關係)
- Series(DataFrame):擴充套件資料型別,關注資料實際應用,資料與索引的關係
三種資料型別的區別
- list/Series/DataFrame的值型別可以不同,ndarray的值型別必須相同
- 從實用性、功能強弱和和可操作性比較:list < ndarray < Series(DataFrame),實踐中儘量使用Pandas資料型別。
Pdandas資料型別例子:
import pandas as pd #載入pandas庫
se = pd.Series([2,4,6,8,10]) # 建立Series資料型別
da = pd.DataFrame([ # 建立DataFrame資料型別
[2,4,6,8,10],
[12,14,16,18,20]
])
se
da
相關文章
- Map簡單介紹
- SVG簡單介紹SVG
- Clickjacking簡單介紹
- ActiveMQ簡單介紹MQ
- JSON簡單介紹JSON
- RPC簡單介紹RPC
- Python簡單介紹Python
- KVM簡單介紹
- RMI簡單介紹
- HTML簡單介紹HTML
- HTML 簡單介紹HTML
- JavaScript 簡單介紹JavaScript
- CSS 簡單介紹CSS
- ajax簡單介紹
- Pandas基礎介紹
- AOP的簡單介紹
- 簡單介紹克隆 JavaScriptJavaScript
- 禪道簡單介紹
- Apache Curator簡單介紹Apache
- spark簡單介紹(一)Spark
- Flutter key簡單介紹Flutter
- Ansible(1)- 簡單介紹
- Webpack 的簡單介紹Web
- Git_簡單介紹Git
- jQuery Validate簡單介紹jQuery
- JSON物件簡單介紹JSON物件
- <svg>元素簡單介紹SVG
- 簡單介紹 ldd 命令
- Flownet 介紹 及光流的簡單介紹
- form表單的簡單介紹ORM
- mt19937 簡單介紹
- mitmproxy中libmproxy簡單介紹MITIBM
- 函子的簡單介紹
- 元學習簡單介紹
- 簡單介紹JavaScript閉包JavaScript
- 檔案管理簡單介紹
- 簡單介紹靜態路由路由
- canvas標籤簡單介紹Canvas