Python中pandas是什麼?資料結構介紹!

老男孩IT教育機構發表於2021-04-23

  Python中pandas是什麼?Pandas是基於numpy的一種工具,該工具是為了解決資料分析任務而建立的。

  Pandas納入了大量的庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。Pandas提供了大量能使我們快速便捷地處理資料的函式和方法,你很快就會發現,它是使Python成為強大而高效的資料分析環境的重要因素之一。

  Pandas是Python的一個資料分析包,最初由AQR Capital Management於2008年4月開發,並於2009年底開源出來,目前由專注於Python資料包開發的Pydata開發team繼續開發和維護,屬於PyData專案的一部分,pandas最初被作為金融資料分析工具而開發出來,因此pandas為時間序列分析提供了很好的支援。

  Pandas的名稱來自於皮膚資料和python資料分析。panel data是經濟學中關於多維資料集的一個術語,在Pandas中也提供了panel的資料型別。

  Pandas資料結構:

  Series:一維陣列,與numpy中的一維array類似。二者與Python基本的資料結構list相近,Series如今能儲存不同種資料型別,字串、boolean值、數字等都能儲存在series中。

  Time-series:以時間為索引的series。

  DataFrame:二維的表格型資料結構,很多功能與R中的data.frame類似,可以將DataFrame理解為Series的容器。

  Panel :三維的陣列,可以理解為DataFrame的容器。

  Panel4D:是像Panel一樣的4維資料容器。

  PanelND:擁有factory集合,可以建立像Panel4D一樣N維命名容器的模組。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2769596/,如需轉載,請註明出處,否則將追究法律責任。

相關文章