import pandas as pd # pd.set_option('display.unicode.east_asian_width', True) # 規整格式 # df = pd.read_excel(r'C:\Users\hui\Desktop\統計結果(1).xlsx') # new_df = df.T # print(df.dtypes) # 檢視屬性 # print(df.columns) # 檢視列索引 # print(new_df) # 行列資料轉換 # print(df.head(2)) # 檢視前N條資料 # print(df.tail(2)) # 檢視後N條資料 # print(df.shape[0], df.shape[1]) # 檢視多少行,多少列。shape[0]表示多少行,shape[1]表示多少列 # print(df.info) # 檢視索引,資料型別,記憶體資訊 # DataFrame 重要功能函式 # print(df.describe()) # print(df.count()) # print(df['恢復總數'].sum()) # 求和 # print(df.max()) # 最大值 # print(df.min()) # 最小值
在 Pandas 中,DataFrame 和 Series 是兩個核心的資料結構。下面是一些 Pandas 基礎屬性的介紹: 1.DataFrame: shape:返回 DataFrame 的行數和列數。 columns:返回 DataFrame 的列標籤。 index:返回 DataFrame 的行索引。 dtypes:返回 DataFrame 中每列的資料型別。 head(n):返回 DataFrame 的前 n 行資料,預設為前 5 行。 tail(n):返回 DataFrame 的後 n 行資料,預設為後 5 行。 2.Series: values:返回 Series 的值部分,以 Numpy 陣列形式展示。 index:返回 Series 的索引。 dtype:返回 Series 的資料型別。 head(n):返回 Series 的前 n 個值,預設為前 5 個值。 tail(n):返回 Series 的後 n 個值,預設為後 5 個值。
import pandas as pd # 示例 DataFrame data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'City': ['New York', 'London', 'Paris', 'Tokyo']} df = pd.DataFrame(data) # 示例 Series s = pd.Series([10, 20, 30, 40, 50], index=['a', 'b', 'c', 'd', 'e'])
# DataFrame 屬性 print("DataFrame shape:", df.shape) print("DataFrame columns:", df.columns) print("DataFrame index:", df.index) print("DataFrame dtypes:", df.dtypes) print("DataFrame head:") print(df.head()) print("DataFrame tail:") print(df.tail()) # Series 屬性 print("Series values:", s.values) print("Series index:", s.index) print("Series dtype:", s.dtype) print("Series head:") print(s.head()) print("Series tail:") print(s.tail())