【機器學習】--時間序列演算法從初識到應用

LHBlog發表於2018-06-26

一、前述

指數平滑法對時間序列上連續的值之間的相關性沒有要求。但是,如果你想使用指數平滑法計算出預測區間, 那麼預測誤差必須是不相關的, 且必須是服從零均值、 方差不變的正態分佈。即使指數平滑法對時間序列連續數值之間相關性沒有要求,在某種情況下, 我們可以通過考慮資料之間的相關性來建立更好的預測模型。
自迴歸移動平均模型( ARIMA)是最常用的時間序列預測模型。

二、具體

1、自迴歸模型(AR)

描述當前值與歷史值之間的關係,用變數自身的歷史時間資料對自身進行預測。

自迴歸模型必須滿足平穩性的要求

p階自迴歸過程的公式定義:

p階表示當前值和之前多少天有關。

自相關係數類似於迴歸裡面的w引數

自迴歸模型的限制:

移動平均模型(MA)

 

自迴歸移動平均模型(ARMA)

 p,q分別是階數,d是差分。d一般1階即可。

ARIMA(p,d,q)模型全稱為差分自迴歸移動平均模型
(Autoregressive Integrated Moving Average Model,簡記ARIMA)

AR是自迴歸, p為自迴歸項; MA為移動平均
q為移動平均項數,d為時間序列成為平穩時所做的差分次數

原理:將非平穩時間序列轉化為平穩時間序列然後將因變數
僅對它的滯後值以及隨機誤差項的現值和滯後值進行迴歸所建立的模型。

滯後和p階數是對應上的。

自相關函式ACF(autocorrelation function)

有序的隨機變數序列與其自身相比較
自相關函式反映了同一序列在不同時序的取值之間的相關性

公式:

Pk的取值範圍為[-1,1]

 偏自相關函式(PACF)(partial autocorrelation function)

 

ARIMA(p,d,q)階數確定:

截尾:落在置信區間內(95%的點都符合該規則)

ARIMA(p,d,q)階數確定:

AR(p) 看PACF
MA(q) 看ACF

未完待續。。

 

 

相關文章