在時間序列預測領域中,模型的體系結構通常依賴於多層感知器(MLP)或Transformer體系結構。
基於mlp的模型,如N-HiTS, TiDE和TSMixer,可以在保持快速訓練的同時獲得非常好的預測效能。基於Transformer的模型,如PatchTST和ittransformer也取得了很好的效能,但需要更多的記憶體和時間來訓練。
有一種架構在預測中仍未得到充分利用:卷積神經網路(CNN)。CNN已經應用於計算機視覺,但它們在預測方面的應用仍然很少,只有TimesNet算是最近的例子。但是CNN已經被證明在處理序列資料方面是有效的,並且它們的架構允許平行計算,這可以大大加快訓練速度。
在本文中,我們將詳細介紹了BiTCN,這是2023年3月在《Parameter-efficient deep probabilistic forecasting》一文中提出的模型。透過利用兩個時間卷積網路(TCN),該模型可以編碼過去和未來的協變數,同時保持計算效率。
https://avoid.overfit.cn/post/ea66d229a5c041a6bd27af74205bdaee