資料預處理之 pandas 讀表

Galois發表於2020-03-01

讀表基本操作:

  • 表標題
  • 表檔案讀取
  • 檢視錶
    資料檔案支援.dat.csv
    import pandas as pd
    users_title = ['UserID', 'Gender', 'Age', 'OccupationID', 'Zip-code']
    users = pd.read_table('./data/users.dat', sep='::', header=None, names=users_title, engine='python')
    jupyter notebook中,可以使用:
    users.head()
    來簡單閱覽資料的情況,只顯示五行資料。

如果是用print()列印來檢視資料內容,對於多列多行的資料表不太友好,可以看到列印結果是前 5 行資料 … 到最後 5 行資料,列的話,如果欄位名長,只能看到 首 … 尾 資料。
在閱覽資料的時候,最好使用jupyter環境,對資料閱讀非常友好。

最後可以使用type(users)來檢視錶檔案型別:

Out: pandas.core.frame.DataFrame

使用pd.read_csv讀表也一樣。

本作品採用《CC 協議》,轉載必須註明作者和本文連結
不要試圖用百米衝刺的方法完成馬拉松比賽。

相關文章