pandas包 問題彙總

明天依舊可好 | 柯尊柏發表於2018-09-03

跳過錯誤行

在資料檔案中可能會出現小部分髒資料,在髒資料對資料整體沒有較大影響我們又不知道髒資料位置的情況下,可以選擇跳過那部分髒資料,不進行處理。

import pandas as pd
#error_bad_lines=False表示跳過錯誤資料行
data = pd.read_csv('file1.csv', error_bad_lines=False)

遍歷DataFrame資料的行

  • DataFrame.iterrows()
for index, row in df.iterrows():
    print row["c1"], row["c2"]

注:iterrows()迭代返回物件物件被修改,df也會被修改

import pandas as pd
from pandas import DataFrame

#任意的多組列表
a = [1,2,3]
b = [4,5,6]

#字典中的key值即為csv中的列名
data = {'a_name':a,'b_name':b}

#設定DataFrame列的排列順序
dataFrame = DataFrame(data, columns=['a_name', 'b_name'])
"""
dataFrame:
  a_name  b_name
0     1     4
1     2     5
2     3     6
"""
for index, row in dataFrame.iterrows():
    if row['b_name']==4:
           row['b_name']=10
"""
dataFrame:
  a_name  b_name
0     1     10
1     2     5
2     3     6
"""
for each in dataFrame['b_name']:
    each=20
"""
dataFrame:
  a_name  b_name
0     1     10
1     2     5
2     3     6
"""

相關文章