Time Series Analysis (Best MSE Predictor & Best Linear Predictor)

車天健發表於2023-02-08

原文網址 : https://www.cnblogs.com/chetianjian/p/17103664.html

Time Series Analysis

Best MSE (Mean Square Error) Predictor

對於所有可能的預測函式 \(f(X_{n})\)，找到一個使 \(\mathbb{E}\big[\big(X_{n} - f(X_{n})\big)^{2} \big]\) 最小的 \(f\) 的 predictor。這樣的 predictor 假設記為 \(m(X_{n})\)，稱作 best MSE predictor，i.e.，

\[m(X_{n}) = \mathop{\arg\min}\limits_{f} \mathbb{E}\big[ \big( X_{n+h} - f(X_{n}) \big)^{2} \big] \]

我們知道：\(\mathop{\arg\min}\limits_{f} \mathbb{E}\big[ \big( X_{n+h} - f(X_{n}) \big)^{2} \big]\) 的解即為：

\[\mathbb{E}\big[ X_{n+h} ~ \big| ~ X_{n} \big] \]

證明：

基於 \(X_{n}\) 求 \(\mathbb{E}\big[ \big( X_{n+h} - f(X_{n}) \big)^{2} \big]\) 的最小值，實際上：

\[\mathop{\arg\min}\limits_{f} \mathbb{E}\big[ \big( X_{n+h} - f(X_{n}) \big)^{2} \big] \iff \mathop{\arg\min}\limits_{f} \mathbb{E}\big[ \big( X_{n+h} - f(X_{n}) \big)^{2} ~ \big| ~ X_{n} \big] \]

私以為更嚴謹的寫法是 \(\mathop{\text{argmin}}\limits_{f} ~ \mathbb{E}\Big[\Big(X_{n+h} - f\big( X_{n}\big)\Big)^{2} ~ | ~ \mathcal{F}_{n}\Big]\)，其中 \(\left\{ \mathcal{F}_{t}\right\}_{t\geq 0}\) 為 \(\left\{ X_{t} \right\}_{t\geq 0}\) 相關的 natural filtration，but whatever。

等式右側之部分：

\[\begin{align*} \mathbb{E}\big[ \big( X_{n+h} - f(X_{n}) \big)^{2} ~ \big| ~ X_{n} \big] & = \mathbb{E}[X_{n+h}^{2} ~ | ~ X_{n}] - 2f(X_{n})\mathbb{E}[X_{n+h} ~ | ~ X_{n}] + f^{2}(X_{n}) \\ \end{align*} \]

其中由於：

\[\begin{align*} Var(X_{n+h} ~ | ~ X_{n}) & = \mathbb{E}\Big[ \big( X_{n+h} - \mathbb{E}\big[ X_{n+h}^{2} ~ | ~ X_{n} \big] \big)^{2} ~ \Big| ~ X_{n} \Big] \\ & = \mathbb{E}\big[ X_{n+h}^{2} ~ \big| ~ X_{n} \big] - 2\mathbb{E}^{2}\big[ X_{n+h}^{2} ~ \big| ~ X_{n} \big] + \mathbb{E}^{2}\big[ X_{n+h}^{2} ~ \big| ~ X_{n} \big] \\ & = \mathbb{E}\big[ X_{n+h}^{2} ~ \big| ~ X_{n} \big] - \mathbb{E}^{2}\big[ X_{n+h}^{2} ~ \big| ~ X_{n} \big] \end{align*} \]

which gives that:

\[\implies Var(X_{n+h} ~ | ~ X_{n}) = \mathbb{E}\big[ X_{n+h}^{2} ~ \big| ~ X_{n} \big] - \mathbb{E}^{2}\big[ X_{n+h} ~ \big| ~ X_{n} \big] \]

因此，

\[\begin{align*} \mathbb{E}\big[ \big( X_{n+h} - f(X_{n}) \big)^{2} ~ \big| ~ X_{n} \big] & = Var(X_{n+h} ~ | ~ X_{n}) + \mathbb{E}^{2}\big[ X_{n+h} ~ \big| ~ X_{n}\big] - 2f(X_{n})\mathbb{E}[X_{n+h} ~ | ~ X_{n}] + f^{2}(X_{n}) \\ & = Var(X_{n+h} ~ | ~ X_{n}) + \Big( \mathbb{E}\big[ X_{n+h} ~ \big| ~ X_{n}\big] - f(X_{n}) \Big)^{2} \end{align*} \]

方差 \(Var(X_{n+h} ~ | ~ X_{n})\) 為定值，那麼 optimal solution \(m(X_{n})\) 顯而易見：

\[m(X_{n}) = \mathbb{E}\big[ X_{n+h} ~ \big| ~ X_{n} \big] \]

此時 \(\left\{ X_{t} \right\}\) 為一個 Stationary Gaussian Time Series, i.e.,

\[\begin{pmatrix} X_{n+h}\\ X_{n} \end{pmatrix} \sim N \begin{pmatrix} \begin{pmatrix} \mu \\ \mu \end{pmatrix}, ~ \begin{pmatrix} \gamma(0) & \gamma(h) \\ \gamma(h) & \gamma(0) \end{pmatrix} \end{pmatrix} \]

那麼我們有：

\[X_{n+h} ~ | ~ X_{n} \sim N\Big( \mu + \rho(h)\big(X_{n} - \mu\big), ~ \gamma(0)\big(1 - \rho^{2}(h)\big) \Big) \]

其中 \(\rho(h)\) 為 \(\left\{ X_{t} \right\}\) 的 ACF，因此，

\[\mathbb{E}\big[ X_{n+h} ~ \big| ~ X_{n} \big] = m(X_{n}) = \mu + \rho(h) \big( X_{n} - \mu \big) \]

注意：

若 \(\left\{ X_{t} \right\}\) 是一個 Gaussian time series，則一定能計算 best MSE predictor。而若 \(\left\{ X_{t} \right\}\) 並非 Gaussian time series，則計算通常十分複雜。

因此，我們通常不找 best MSE predictor，而尋找 best linear predictor。

Best Linear Predictor (BLP)

在 BLP 假設下，我們尋找一個形如 \(f(X_{n}) \propto aX_{n} + b\) 的 predictor。

則目標為：

\[\text{minimize: } ~ S(a,b) = \mathbb{E} \big[ \big( X_{n+h} - aX_{n} -b \big)^{2} \big] \]

推導：

分別對 \(a, b\) 求偏微分：

\[\begin{align*} \frac{\partial}{\partial b} S(a, b) & = \frac{\partial}{\partial b} \mathbb{E} \big[ \big( X_{n+h} - aX_{n} -b \big)^{2} \big] \\ & = -2 \mathbb{E} \big[ X_{n+h} - aX_{n} - b \big] \\ \end{align*} \]

令：

\[\frac{\partial}{\partial b} S(a, b) = 0 \]

則：

\[\begin{align*} -2 \cdot & \mathbb{E} \big[ X_{n+h} - aX_{n} - b \big] = 0 \\ \implies & \qquad \mathbb{E}[X_{n+h}] - a\mathbb{E}[X_{n}] - b = 0\\ \implies & \qquad \mu - a\mu - b = 0 \\ \implies & \qquad b^{\star} = (1 - a^{\star}) \mu \end{align*} \]

回代並 take partial derivative on \(a\)：

\[\begin{align*} \frac{\partial}{\partial a} S(a, b) & = \frac{\partial}{\partial a} \mathbb{E} \big[ \big( X_{n+h} - aX_{n} - (1 - a)\mu \big)^{2} \big] \\ & = \frac{\partial}{\partial a} \mathbb{E} \Big[ \Big( \big(X_{n+h} - \mu \big) - \big( X_{n} - \mu \big) a \Big)^{2} \Big] \\ & = \mathbb{E} \Big[ - \big( X_{n} - \mu \big) \Big( \big(X_{n+h} - \mu \big) - \big( X_{n} - \mu \big) a \Big)\Big] \\ \end{align*} \]

令：

\[\frac{\partial}{\partial a} S(a, b) = 0 \]

則：

\[\begin{align*} & \mathbb{E} \Big[ - \big( X_{n} - \mu \big) \Big( \big(X_{n+h} - \mu \big) - \big( X_{n} - \mu \big) a \Big)\Big] = 0 \\ \implies & \qquad \mathbb{E} \Big[\big( X_{n} - \mu \big) \Big( \big(X_{n+h} - \mu \big) - \big( X_{n} - \mu \big) a \Big)\Big] = 0 \\ \implies & \qquad \mathbb{E} \Big[\big( X_{n} - \mu \big) \big(X_{n+h} - \mu \big) - a \big( X_{n} - \mu \big) \big( X_{n} - \mu \big) \Big] = 0 \\ \implies & \qquad \mathbb{E} \Big[\big( X_{n} - \mu \big) \big(X_{n+h} - \mu \big) \Big] = a \cdot \mathbb{E} \Big[\big( X_{n} - \mu \big) \big( X_{n} - \mu \big) \Big] \\ \implies & \qquad \mathbb{E} \Big[\big( X_{n} - \mathbb{E}[X_{n}] \big) \big(X_{n+h} - \mathbb{E}[X_{n+h}] \big) \Big] = a \cdot \mathbb{E} \Big[\big( X_{n} - \mathbb{E}[X_{n}] \big)^{2} \Big] \\ \implies & \qquad \text{Cov}(X_{n}, X_{n+h}) = a \cdot \text{Var}(X_{n}) \\ \implies & \qquad a^{\star} = \frac{\gamma(h)}{\gamma(0)} = \rho(h) \end{align*} \]

綜上，time series \(\left\{ X_{n} \right\}\) 的 BLP 為：

\[f(X_{n}) = l(X_{n}) = \mu + \rho(h) \big( X_{n} - \mu \big) \]

且 BLP 相關的 MSE 為：

\[\begin{align*} \text{MSE} & = \mathbb{E}\big[ \big( X_{n+h} - l(X_{n}) \big)^{2} \big] \\ & = \mathbb{E} \Big[ \Big( X_{n+h} - \mu - \rho(h) \big( X_{n} - \mu \big) \Big)^{2} \Big] \\ & = \rho(0) \cdot \big( 1 - \rho^{2}(h) \big) \end{align*} \]

Branch Predictor Simulator
2024-11-20
Best Time to Buy and Sell Stock系列
2018-08-13
121|Best Time to Buy and Sell Stock
2020-10-23
[leetcode]Best Time to Buy and Sell Stock
2020-04-04
LeetCode
121. Best Time to Buy and Sell Stock
2019-02-16
Best Time to Buy and Sell Stock系列分析
2018-06-21
貪心法-Best Time to Buy and Sell Stock
2018-06-08
[LeetCode] 121. Best Time to Buy and Sell Stock
2024-07-02
LeetCode
leetcode_best-time-to-buy-and-sell-stock-ii
2020-12-25
LeetCode
LeetCode 309. Best Time to Buy and Sell Stock with Cooldown
2019-02-16
LeetCode
leetcode best-time-to-buy-and-sell-stock-iii(Java)
2019-05-01
LeetCodeJava
[LeetCode] 122. Best Time to Buy and Sell Stock II
2024-07-02
LeetCode
【Lintcode】393. Best Time to Buy and Sell Stock IV
2020-12-12
The best LeetCode Nodes
2024-05-02
LeetCode
Best Team With No Conflicts
2020-10-18
Best Wishes「兔」You！
2023-01-24
MSE 609 Quantitative Data Analysis
2024-11-09
攻防世界-best_rsa
2024-12-01
25 Best Java Books In 2022
2022-07-15
Java
大資料分析筆記 (7) - 時間序列分析(Time Series Analysis)
2020-11-24
大資料筆記
【論文閱讀】N-BEATS Neural basis expansion analysis for interpretable time series forecasting
2024-03-11
AST
The Best Way to Export an SVG from Sketch
2018-11-05
ExportSVG
[ARC060F] Best Representation
2024-04-08
矩陣樹定理 BEST 定理
2024-04-25
矩陣
Time Series Databases
2020-10-17
Database
Oracle 12.2 RAC on Linux Best Practice Documentation
2019-08-21
OracleLinux
【貪心】POJ 3617：Best Cow Line
2020-10-03
矩陣樹定理與BEST定理
2024-09-26
矩陣
【leetcode】40-best-time-to-buy-and-sell-stock 力扣 121. 買賣股票的最佳時機
2024-11-06
LeetCode力扣
PostgreSQL DBA(57) - Could not choose a best candidate operator
2019-07-17
SQL
Codeforces Global Round 19 E. Best Pair
2024-10-02
AI
[20220708]PLSQL – choosing the BEST data type.txt
2022-07-18
SQL
ME5701 Linear stability analysis of Mathieu equation
2024-11-02
線性判別分析（Linear Discriminant Analysis）
2022-02-04
NaN
42-best-time-to-buy-and-sell-stock-iii 力扣 123. 買賣股票的最佳時機 III
2024-11-08
力扣
java單元測試：unit testing best practices
2019-01-11
Java
Oracle 統一審計- Best 實踐三
2024-03-31
Oracle
Oracle 統一審計- Best 實踐一
2024-02-17
Oracle

Time Series Analysis (Best MSE Predictor & Best Linear Predictor)

Time Series Analysis

Best MSE (Mean Square Error) Predictor

證明：

Best Linear Predictor (BLP)

推導：

相關文章