機器學習金融預測領域2023部分綜述論文閱讀記錄

zhaot1993發表於2024-03-23

23年的綜述最近讀了3篇,總結筆記如下:

本期所有論文連結:2023綜述 https://www.alipan.com/s/ySur3StxKip 點選連結儲存,或者複製本段內容,開啟「阿里雲盤」APP ,無需下載極速線上檢視,影片原畫倍速播放。

(2023)A_Systematic_Survey_of_AI_Models_in_Financial_Mark
評價:原文寫的一般,可以不看。

這篇綜述概述了當前的混合模型、評價指標、未來方向,指出金融市場傳統的交易策略是基本面分析fundamental analysis (FA)和技術分析technical analysis(TA)。目前AI通常用在三個領域:最佳化投資組合、預測未來價格或趨勢、對新聞或媒體進行情緒分析,其中最佳化投資組合涉及選股最佳化、管理和評估交易的資產,預測涉及股票、加密貨幣、外匯、期貨。

作者從三個來源(Springer Link、the IEEE Xplore database、ACM digital library)按關鍵字(table 4 裡的)搜了585篇2018~2023年的論文,
篩選摘要挑出95篇滿足標準的,讀了讀並打分,最終挑了51篇,在table 5(ref就是下面參考文獻裡的論文索引)。透過對這51篇分析,得出以下結論:
市場:股票67%、加密貨幣16%、外匯12%、期貨6%
資料:92%都用的日線,多用1~5年或5~10年的。用商業收費資料的多,雅虎財經的免費(但只有日線)。
深度學習演算法: gated recurrent unit (GRU) and LSTM 在時序預測中表現出很大潛力。LSTM(49%),SVM and MLP (35%),CNN、random forest (RF)、and bi-LSTM (18% each)
混合模型:CNN + LSTM(55%),neuro-fuzzy logic (18%),LSTM-GRU, LSTM-RNN, and MLP-CNN (9% each)
評價指標:主要用sharpe ratio,ROI,max drawdown
評估模型效能的指標:主要用mean absolute percentage error (MAPE) - 33%, root mean square error (RMSE) - 33%, accuracy (31%),
mean absolute error (MAE) - 29%, mean squared error (MSE) - 29%, F measure (F1) - 20% and precision (20%)
模型輸出:通常為預測的價格,或者趨勢方向(上,下,不動)

table7顯示9個論文用了策略,除了這9個,其餘42篇論文的策略 are specialized techniques and thus require a financial, economic, and statistical understanding of the financial market to implement.Figure17是挑出的51篇文章對應的期刊,最下面6個是頂刊

最終結論:混合模型比傳統機器學習技術表現更好.


(2023)Machine learning-based approaches for financial market prediction: A comprehensive review
評價:原文不值得看
作者找了1995~2019得2326篇論文,基於此分析了AI在股票市場的應用。這篇綜述就是把一堆論文概括了一下,按照時間順序,講哪個作者用了啥技術,結論是啥。
我從近5年的開始記錄了幾篇結論有價值的論文(就是從本論文11頁最後一段開始),其餘的論文作者也沒說清楚有啥重點:
11頁最下面ref37,2022,發現僅靠歷史資料不夠,加上對社交媒體上情緒的分析,可以使預測準確率增加到80%.
12頁ref38,2020,第一個把詞嵌入和深度學習結合,用including LSTM networks, RNNs, and CNNs, word embedding models Word2Vec, GloVe, and FastText 比了一圈,發現詞嵌入和深度學習結合可以預測方向。測試是用伊斯坦布林的銀行股,收集它的新聞、評論。
12頁ref39,2020,是個綜述,盤點了關於股票預測的機器學習演算法。
12頁ref40,2021,發現單一預測模型不夠用,得用混合模型,他用機器學習和均值最佳化投資組合,提出極端梯度增強(XGBoost)和增強螢火蟲演算法(IFA,用來微調XGBoost)組合模型來預測股票價格。說用在A股優於現狀,但沒說現狀是啥樣。
12頁ref41,2021,綜述,看了353篇論文,說神經網路和模糊邏輯能用來預測,the most frequently cited authors in this area are Markowitz and Lebaron.
13頁ref42,2021,綜述,說用 root-mean-square error (RMSE)評估,LSTM最強;用夏普率評估,強化學習最強。 建議大家按需選擇
13頁ref44,2021,調查,異常推斷在機器學習領域應用,用基於regression trees的整合演算法準確預測了一天內的價格異常變動。
14頁ref46,2022,對比了SVM,CNN,Regression-based model,LSTM,發現SVM and the mix of CNN and LSTM are effective at forecasting stock prices.


(2023)A Comprehensive Review on Financial Explainable AI
評價:原文不值得看
這篇綜述研究AI可解釋性在金融領域現狀,作者起了個名:FinXAI。因為傳統策略像白盒能看懂但難滿足預期效能,AI像黑盒但大部分情況能滿足預期效能,所以想讓黑盒變白盒,從而讓人放心用使用AI。作者從Scopus搜尋並分析了69篇論文,講了這些論文怎麼解釋模型,怎麼解釋特徵,還解釋了哪些內容。

-------------正文結束-------------
我的研究方向是機器學習在金融預測領域的應用,啃論文是體力活,大家資源共享能少走彎路,
我篩選出的所有論文及程式碼連結,都放在公眾號-想啃論文了
裡面還有我開發的機器人,用於實盤驗證論文策略,並輸出交易訊號,大家可免費使用,僅供科研交流。

相關文章