pd.to_datetime方法將字串轉為datetime型

專注的阿熊發表於2020-12-16

  pd.to_datetime(arg errors=“raise” dayfirst=False yearfirst=False utc=None box=True format=None exact=True unit=None infer_datetime_format=False origin=“unix” cache=False)

arg :指定轉換的資料物件,可以是整型、浮點型、字串、列表、元組、一維陣列、 Serise DataFrame 和字典

errors :設定出錯提示方式,可選 {"ignore","raise","coercec"} ,預設值為 "raise" ,如果轉換失敗,則給出出錯提示資訊; "ignore" 則不出發出錯提示資訊; "coercec" 在轉換過程存在無效時間值時,自動轉為 NaT

dayfirst :指定 arg 引數轉換時的順序,設定為 True 時,則先轉換日期,再轉換時間,預設值為 False

yearfirst :值為 True 時則先轉換日期,預設值為 False

utc :值為 True 返回 UTC DatetimeIndex ,預設值為 None

box :預設值為 True 返回 DatetimeIndex 或相關索引物件;值為 False 則返回多維陣列

format :字串,跟單網預設值為 None ,指定字串時間轉化為時間時的 strftime 的格式,類似 strftime 方法轉化為時間的使用方法

exact :預設值為 True 表示精確匹配格式,值為 False 則允許匹配目標字串中的任何位置

unit :字串,預設值為 "ns" ,對轉換物件指定時間單位( D 天、 s 秒、 ma 毫秒、 ns 納秒)

infer_datetime_format :預設值為 False ,如果為 True ,且沒有給出轉換固定格式( format 引數),且字串日期時間格式確定,則可以提高轉換速度

origin :確定日期的開始點,預設值為 "unix" ,則日期的開始點為 1970-01-01 ,若提供值為 Timestamp 日期,則以 Timestamp 的起點日期作為開始點日期

cache :預設值為 False ,如果為 True ,則是用唯一的轉換日期快取來應用日期時間轉換,解析重複的日期字串時可以提高轉換速度

import  pandas as pdfrom datetime import datetime

filename = r"D:\data_test.xlsx"

df = pd.read_excel(filename)

print(df.head())print("="*30)print(df.info())

  name gender   birthday start_work  income          tel            email  \

0    趙一      男   1989/8/10 2012-09-08   15000  13611011234    zhaoyi@qq.com   

1    王二      男   1990/10/2 2014-03-06   12500  13500012234   wanger@163.com   

2    張三      女   1987/3/12 2009-01-08   18500  13515273330  zhangsan@qq.com   

3    李四      女   1991/8/16 2014-06-04   13000  13923673388   lisi@gmail.com   

4    劉五      女   1992/5/24 2014-08-10    8500  17823117890     liuwu@qq.com   

                   other  

0  { 教育:本科,專業:電子商務,愛好:運動 }  

1      { 教育:大專,專業:汽修,愛好: }  

2   { 教育:本科,專業:數學,愛好:打籃球 }  

3   { 教育:碩士,專業:統計學,愛好:唱歌 }  

4      { 教育:本科,專業:美術,愛好: }  

==============================

<class 'pandas.core.frame.DataFrame'>

RangeIndex: 8 entries, 0 to 7

Data columns (total 8 columns):

 #   Column      Non-Null Count  Dtype         

---  ------      --------------  -----         

 0   name        8 non-null      object        

 1   gender      8 non-null      object        

 2   birthday    8 non-null      object        

 3   start_work  8 non-null      datetime64[ns]

 4   income      8 non-null      int64         

 5   tel         8 non-null      int64         

 6   email       8 non-null      object        

 7   other       8 non-null      object        

dtypes: datetime64[ns](1), int64(2), object(5)

memory usage: 640.0+ bytes

None

df.birthday=pd.to_datetime(df.birthday,format="%Y-%m-%d")

df.info()

1

2

<class 'pandas.core.frame.DataFrame'>

RangeIndex: 8 entries, 0 to 7

Data columns (total 8 columns):

 #   Column      Non-Null Count  Dtype         

---  ------      --------------  -----         

 0   name        8 non-null      object        

 1   gender      8 non-null      object        

 2   birthday    8 non-null      datetime64[ns]

 3   start_work  8 non-null      datetime64[ns]

 4   income      8 non-null      int64         

 5   tel         8 non-null      int64         

 6   email       8 non-null      object        

 7   other       8 non-null      object        

dtypes: datetime64[ns](2), int64(2), object(4)

memory usage: 640.0+ bytes

data = pd.DataFrame({" 客戶 ":[" "," "," "," "]," 工資 ":[3500,2500,1500,500]," 日期 ":["2020-11-19","2020-11-20","2020-12-19","2020-12-20"]},index = ["A","B","C","D"])print(data.info)

<bound method DataFrame.info of    客戶    工資          日期

A   李   3500  2020-11-19

B   張   2500  2020-11-20

C   劉   1500  2020-12-19

D   宋    500  2020-12-20>


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946337/viewspace-2742665/,如需轉載,請註明出處,否則將追究法律責任。

相關文章