機器學習金融預測領域2023部分綜述論文閱讀記錄

zhaot1993發表於2024-03-23

原文網址 : https://www.cnblogs.com/zhaot1993/p/18091248

23年的綜述最近讀了3篇，總結筆記如下：

本期所有論文連結：2023綜述 https://www.alipan.com/s/ySur3StxKip 點選連結儲存，或者複製本段內容，開啟「阿里雲盤」APP ，無需下載極速線上檢視，影片原畫倍速播放。

（2023）A_Systematic_Survey_of_AI_Models_in_Financial_Mark
評價：原文寫的一般，可以不看。

這篇綜述概述了當前的混合模型、評價指標、未來方向，指出金融市場傳統的交易策略是基本面分析fundamental analysis (FA)和技術分析technical analysis（TA）。目前AI通常用在三個領域：最佳化投資組合、預測未來價格或趨勢、對新聞或媒體進行情緒分析，其中最佳化投資組合涉及選股最佳化、管理和評估交易的資產，預測涉及股票、加密貨幣、外匯、期貨。

作者從三個來源(Springer Link、the IEEE Xplore database、ACM digital library)按關鍵字（table 4 裡的）搜了585篇2018~2023年的論文，
篩選摘要挑出95篇滿足標準的，讀了讀並打分，最終挑了51篇，在table 5（ref就是下面參考文獻裡的論文索引）。透過對這51篇分析，得出以下結論：
市場：股票67%、加密貨幣16%、外匯12%、期貨6%
資料：92%都用的日線，多用1~5年或5~10年的。用商業收費資料的多，雅虎財經的免費（但只有日線）。
深度學習演算法： gated recurrent unit (GRU) and LSTM 在時序預測中表現出很大潛力。LSTM(49%)，SVM and MLP (35%)，CNN、random forest (RF)、and bi-LSTM (18% each)
混合模型：CNN + LSTM(55%)，neuro-fuzzy logic (18%)，LSTM-GRU, LSTM-RNN, and MLP-CNN (9% each)
評價指標：主要用sharpe ratio,ROI,max drawdown
評估模型效能的指標：主要用mean absolute percentage error (MAPE) - 33%, root mean square error (RMSE) - 33%, accuracy (31%),
mean absolute error (MAE) - 29%, mean squared error (MSE) - 29%, F measure (F1) - 20% and precision (20%)
模型輸出：通常為預測的價格，或者趨勢方向（上，下，不動）

table7顯示9個論文用了策略，除了這9個，其餘42篇論文的策略 are specialized techniques and thus require a financial, economic, and statistical understanding of the financial market to implement.Figure17是挑出的51篇文章對應的期刊，最下面6個是頂刊

最終結論：混合模型比傳統機器學習技術表現更好.

（2023）Machine learning-based approaches for financial market prediction: A comprehensive review
評價：原文不值得看
作者找了1995~2019得2326篇論文，基於此分析了AI在股票市場的應用。這篇綜述就是把一堆論文概括了一下，按照時間順序，講哪個作者用了啥技術，結論是啥。
我從近5年的開始記錄了幾篇結論有價值的論文（就是從本論文11頁最後一段開始），其餘的論文作者也沒說清楚有啥重點：
11頁最下面ref37，2022，發現僅靠歷史資料不夠，加上對社交媒體上情緒的分析，可以使預測準確率增加到80%.
12頁ref38，2020，第一個把詞嵌入和深度學習結合，用including LSTM networks, RNNs, and CNNs, word embedding models Word2Vec, GloVe, and FastText 比了一圈，發現詞嵌入和深度學習結合可以預測方向。測試是用伊斯坦布林的銀行股，收集它的新聞、評論。
12頁ref39，2020，是個綜述，盤點了關於股票預測的機器學習演算法。
12頁ref40，2021,發現單一預測模型不夠用，得用混合模型，他用機器學習和均值最佳化投資組合，提出極端梯度增強(XGBoost)和增強螢火蟲演算法(IFA，用來微調XGBoost)組合模型來預測股票價格。說用在A股優於現狀，但沒說現狀是啥樣。
12頁ref41,2021，綜述，看了353篇論文，說神經網路和模糊邏輯能用來預測，the most frequently cited authors in this area are Markowitz and Lebaron.
13頁ref42,2021，綜述，說用 root-mean-square error (RMSE)評估，LSTM最強；用夏普率評估，強化學習最強。建議大家按需選擇
13頁ref44,2021，調查，異常推斷在機器學習領域應用，用基於regression trees的整合演算法準確預測了一天內的價格異常變動。
14頁ref46,2022，對比了SVM，CNN，Regression-based model，LSTM，發現SVM and the mix of CNN and LSTM are effective at forecasting stock prices.

（2023）A Comprehensive Review on Financial Explainable AI
評價：原文不值得看
這篇綜述研究AI可解釋性在金融領域現狀，作者起了個名：FinXAI。因為傳統策略像白盒能看懂但難滿足預期效能，AI像黑盒但大部分情況能滿足預期效能，所以想讓黑盒變白盒，從而讓人放心用使用AI。作者從Scopus搜尋並分析了69篇論文，講了這些論文怎麼解釋模型，怎麼解釋特徵，還解釋了哪些內容。

-------------正文結束-------------
我的研究方向是機器學習在金融預測領域的應用，啃論文是體力活，大家資源共享能少走彎路，
我篩選出的所有論文及程式碼連結，都放在公眾號-想啃論文了，
裡面還有我開發的機器人，用於實盤驗證論文策略，並輸出交易訊號，大家可免費使用，僅供科研交流。

如何入門論文閱讀&綜述小解答
2021-01-02
聯邦學習綜述性論文
2024-08-08
聯邦學習
Deep Transfer Learning綜述閱讀筆記
2023-03-24
筆記
領域綜述 | 知識圖譜概論（一）
2019-03-22
並行多工學習論文閱讀（五）：論文閱讀總結
2021-11-12
並行
【論文閱讀】增量學習近期進展及未來趨勢預測
2020-05-12
【讀論文】 -- 推薦系統研究綜述
2024-04-10
李航「機器學習」最全綜述
2020-04-06
機器學習
《learn to count everything》論文閱讀、實驗記錄
2024-05-01
《基於深度學習的目標檢測綜述》論文獲發表
2023-01-30
深度學習
【論文筆記】A review of applications in federated learning（綜述）
2022-05-01
筆記ViewAPP
深度學習論文閱讀路線圖
2018-08-06
深度學習
MapReduce 論文閱讀筆記
2020-06-24
筆記
AutoEmbedding論文閱讀筆記
2023-03-29
筆記
NLP相關論文綜述
2018-11-26
隱私計算綜述閱讀
2022-03-18
論文閱讀筆記 --- 圖模互補：知識圖譜與大模型融合綜述 --- 按參考文獻整理
2024-09-13
筆記大模型
入侵檢測系統綜述文獻研讀
2024-06-01
Attention模型方法綜述 | 多篇經典論文解讀
2018-06-11
模型
計算機視覺、機器學習相關領域論文和原始碼大集合
2020-04-06
計算機視覺機器學習原始碼
自動機器學習：最近進展研究綜述
2019-08-11
機器學習
presto官網閱讀記錄: Functions and Operators 部分
2021-12-18
RESTFunction
7 Papers | 深度強化學習綜述、圖靈71年前未發表的智慧機器論文
2019-06-30
強化學習圖靈
論文速讀記錄 - 202409
2024-09-29
一文講述如何將預測正規化引入到機器學習模型中
2018-06-11
機器學習模型
解讀NeurIPS2019最好的機器學習論文
2020-01-09
機器學習
【論文筆記】Federated Learning for Wireless Communications: Motivation, Opportunities, and Challenges（綜述）
2022-05-03
筆記
CornerNet-Lite論文閱讀筆記
2020-10-31
筆記
Visual Instruction Tuning論文閱讀筆記
2024-06-07
Struct筆記
機器學習記錄
2021-08-01
機器學習
收藏！機器學習演算法優缺點綜述
2020-05-14
機器學習演算法
論文閱讀：SiameseFC
2018-04-09
論文閱讀20241117
2024-11-22
GeoChat論文閱讀
2024-10-29
機器學習如何解決「看病難」？Jeff Dean等詳述機器學習在醫療領域的應用。
2019-04-19
機器學習
機器閱讀理解與文字問答技術研究 | 博士學位論文
2019-12-20
【阿菜讀論文】區塊鏈共識演算法綜述
2021-08-01
區塊鏈演算法
並行多工學習論文閱讀（一）：多工學習速覽
2021-10-29
並行

機器學習金融預測領域2023部分綜述論文閱讀記錄

相關文章