基於python的大資料分析-pandas資料讀取(程式碼實戰)

testingbang發表於2019-08-29
我們常見的資料儲存格式無非就是csv、excel、txt以及資料庫等形式。
資料讀取
在pandas中可以使用一些函式完成資料的讀取。比如read_csv、read_excel、read_table、read_sql等,這些分別是啥意思呢。。。。自己看字尾就能明白啦~
下面我們就透過擼程式碼來了解它們
txt檔案
格式:read_table(檔案路徑與檔名, names=[列名1,列名2,.....], sep="",......)
其中names為列名,預設為檔案中的第一行作為列名
sep為分隔符,預設為空
from pandas import read_table
#txt
df=read_table(r'D:python_workspaceanacondarz.txt')
#檢視前五行資料
df.head(5)
#檢視後兩行資料
#df.tail(2)
rz.txt的內容如下
csv檔案
格式:read_csv(檔案路徑與檔名, names=[列名1,列名2,.....], sep="",......)
解釋同上,不在廢話
#csv
from pandas import read_csv
df=read_csv(r'D:python_workspaceanacondarz.csv')
df
rz.csv的內容如下
excel檔案
格式:read_excel(檔案路徑與檔名, sheetname=sheet的名稱, header=0)
sheetname可以指定讀取幾個sheet,sheet數目從0開始。如果sheetname=[0,2]則代表讀取第一個和第三個sheet
header為0表示以檔案第一行作為表頭顯示;為1則把檔案第一行丟棄不作為表頭顯示。
#exel
from pandas import read_excel
df=read_excel(r'D:python_workspaceanacondarz.xls', sheetname='Sheet3')
df
mysql
首先安裝pymysql,透過pip命令即可安裝
格式:read_sql(要查詢的sql語句, 資料庫的連結物件)
import pandas as pd
import pymysql
#具體的資料庫連結資訊自行替換
conn=pymysql.connect(host='xxxx',database='xxx',user='root',
password='',port=3306,charset='utf8')
sql='select * from a'
r=pd.read_sql(sql,conn)
#關閉資料庫連結
conn.close()
print(r.head(5))


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69942496/viewspace-2655342/,如需轉載,請註明出處,否則將追究法律責任。

相關文章