Numpy庫基礎分析——詳解datetime型別的處理

lvxfcjf發表於2021-09-09

關於時間的處理,Python中自帶的處理時間的模組就有time 、datetime、calendar,另外還有擴充套件的第三方庫,如dateutil等等。透過這些途徑可以隨心所欲地用Python去處理時間。當我們用NumPy庫做資料分析時,如何轉換時間呢?

在NumPy 1.7版本開始,它的核心陣列(ndarray)物件支援datetime相關功能,由於’datetime’這個資料型別名稱已經在Python自帶的datetime模組中使用了, NumPy中時間資料的型別稱為’datetime64’。

單個時間格式字串轉換為numpy的datetime物件,可使用datetime64例項化一個物件,如下所示:

#時間字串轉numpy.datetime64
datetime_nd=np.datetime64('2019-01-01')
print(type(datetime_nd))#<class 'numpy.datetime64'>

反過來numpy的datetime物件轉換為時間格式字串,可使用datetime_as_string()函式,如下所示:

#numpy.datetime64轉時間字串
datetime_str=np.datetime_as_string(datetime_nd)
print(type(datetime_str))#<class 'numpy.str_'>

從時間格式字串陣列去建立numpy的datetime物件陣列(array)時,可以直接使用numpy.array()函式,指定dtype為’datetime64’,這樣的話陣列中的元素為’datetime64’型別,如下所示:

datetime_array = np.array(['2019-01-05','2019-01-02','2019-01-03'], dtype='datetime64')
print(datetime_array)#['2019-01-05' '2019-01-02' '2019-01-03']
print(type(datetime_array))#<class 'numpy.ndarray'>
print(type(datetime_array[0]))#<class 'numpy.datetime64'>

也可以透過numpy.arange()函式,給定時間起始範圍去建立numpy的datetime物件陣列(array),指定dtype為’datetime64’時預設以日為時間間隔,如下所示:

datetime_array = np.arange('2019-01-05','2019-01-10', dtype='datetime64')
print(datetime_array)#['2019-01-05' '2019-01-06' '2019-01-07' '2019-01-08' '2019-01-09']

設定numpy.arange()函式中的dtype引數,可以調整時間的間隔,比如以年、月、周,甚至小時、分鐘、毫秒程度的間隔生成時間陣列,這點和Python的datetime模組是一樣的,分為了date單位和time單位。如下所示:

圖片描述

# generate year datetime array
datetime_array = np.arange('2018-01-01','2020-01-01', dtype='datetime64[Y]')
print(datetime_array)#['2018' '2019']

# generate month datetime array
datetime_array = np.arange('2019-01-01','2019-10-01', dtype='datetime64[M]')
print(datetime_array)#['2019-01' '2019-02' '2019-03' '2019-04' '2019-05' '2019-06' '2019-07' '2019-08' '2019-09']

# generate week datetime array
datetime_array = np.arange('2019-01-05','2019-02-10', dtype='datetime64[W]')
print(datetime_array)#['2019-01-03' '2019-01-10' '2019-01-17' '2019-01-24' '2019-01-31']

# generate ms datetime array
datetime_array = np.arange('2019-01-05','2019-01-10', dtype='datetime64[ms]')
print(datetime_array)
#['2019-01-05T00:00:00.000' '2019-01-05T00:00:00.001'
# '2019-01-05T00:00:00.002' ... '2019-01-09T23:59:59.997'
# '2019-01-09T23:59:59.998' '2019-01-09T23:59:59.999']

將numpy.datetime64轉化為datetime格式轉換為datetime格式,可使用astype()方法轉換資料型別,如下所示:

#numpy.datetime64轉化為datetime格式
datetime_df=datetime_nd.astype(datetime.datetime)
print(type(datetime_df))#<class 'datetime.date'>

另外,numpy也提供了datetime.timedelta類的功能,支援兩個時間物件的運算,得到一個時間單位形式的數值。因為numpy的核心陣列(ndarray)物件沒有物理量系統(physical quantities system),所以建立了timedelta64資料型別來補充datetime64。datetime和timedelta結合提供了更簡單的datetime計算方法。如下所示:

# numpy.datetime64 calculations
datetime_delta = np.datetime64('2009-01-01') - np.datetime64('2008-01-01')
print(datetime_delta)#366 days
print(type(datetime_delta))#<class 'numpy.timedelta64'>

datetime_delta = np.datetime64('2009') + np.timedelta64(20, 'D')
print(datetime_delta)#2009-01-21

datetime_delta = np.datetime64('2011-06-15T00:00') + np.timedelta64(12, 'h')
print(datetime_delta)#2011-06-15T12:00

datetime_delta = np.timedelta64(1,'W') / np.timedelta64(1,'D')
print(datetime_delta)#7.0

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/3486/viewspace-2822935/,如需轉載,請註明出處,否則將追究法律責任。

相關文章