Python中建立DataFrame的方法

qq_33412699發表於2020-11-27

Python中建立DataFrame的方法

1. 從外部檔案生成(如csv、xlsx、json、html等)

import pandas as pd
df = pd.read_excel('./data.xlsx')
print(df)
print(df.columns)

2. 通過字典dictionary生成

單值情況:

import pandas as pd
students = {'name':'小明',
            'age':18,
            'grade':'七年級'}
df_stu = pd.DataFrame(students,index=[0])
# 或者 df_stu = pd.DataFrame({'name':'小明','age':18,'grade':'七年級'},index=[0])
print(df_stu)

輸出:在這裡插入圖片描述

注意:如果不指定index會報錯: ValueError: If using all scalar values, you must pass an index

多值情況:

import pandas as pd
students = {'name':['小明','小紅','小馬'],
            'age':[13,14,15],
            'grade':['七年級','八年級','九年級']}
df_stu = pd.DataFrame(students)
#df_stu = pd.DataFrame(students,index=['stu1','stu2','stu3']) 指定索引值
print(df_stu)

輸出:
在這裡插入圖片描述

3. 通過list生成

import pandas as pd
list1 = [['小明',13,'七年級'],['小紅',14,'八年級'],['小馬',15,'九年級']]
list2 = ['name','age','grade']
df_stu = pd.DataFrame(columns=list2,data=list1)
print(df_stu)

輸出:
在這裡插入圖片描述

4. 通過numpy的array生成

import pandas as pd
import numpy as np
arr = np.arange(12).reshape(3,4)
df_arr = pd.DataFrame(arr)
print(df_arr)

輸出:
在這裡插入圖片描述

5. 通過pandas的Series

import pandas as pd
students = {'name':['小明','小紅','小馬'],
            'age':[13,14,15],
            'grade':['七年級','八年級','九年級']}
s1 = pd.Series(students['name'])
s2 = pd.Series(students['age'])
s3 = pd.Series(students['grade'])
df_stu = pd.DataFrame([s1,s2,s3],index=['name','age','grade'])
print(df_stu.T)

輸出:
在這裡插入圖片描述

相關文章