掌握時間序列特徵工程:常用特徵總結與 Feature-engine 的應用

deephub發表於2024-04-20

時間序列資料的特徵工程是一種技術,用於從時間序列資料中提取資訊或構造特徵,這些特徵可用於提高機器學習模型的效能。以下是一些常見的時間序列特徵工程技術:

  1. 滾動統計量:計算時間視窗內的統計量,如平均值、中位數、標準偏差、最小值和最大值。這些統計量可以捕捉到時間序列在不同時間段的行為變化。
  2. 滯後特徵:建立時間序列的過去值作為新的特徵,以揭示序列的自相關性質。例如,可以使用前一天(滯後1)或前一週(滯後7)的資料作為預測當前值的特徵。
  3. 差分和季節差分:計算時間序列的一階差分(即當前值與前一個值的差)或季節性差分(如當前值與前一年同一天的值的差)來幫助去除趨勢和季節性影響。
  4. 變換:應用變換如對數變換、平方根變換等,可以幫助穩定時間序列的方差,使其更適合某些統計模型。
  5. 時間戳資訊:提取時間戳的特定部分,如小時、周天、月份等,用於捕捉週期性模式。
  6. 傅立葉變換:透過傅立葉變換將時間序列轉換為頻域表示,提取週期性特徵。
  7. 波動性度量:對於金融時間序列,可以計算歷史波動性或返回序列的標準偏差等度量。
  8. 視窗函式:使用滑動視窗操作,如滑動平均或指數平滑,以平滑時間序列並減少噪聲。

本文將透過使用feature-engine來簡化這些特徵的提取,首先我們看看資料。

https://avoid.overfit.cn/post/db4091bc5c8d489aa6f4df807ff7894f

相關文章