利用CNN對股票「圖片」進行漲跌分類——一次嘗試

宽邦科技發表於2019-01-23

原文網址 : http://www.jiqizhixin.com/articles/2019-01-23-2

摘要：本文嘗試用CNN對股票圖片進行了一個漲跌分類，並在文末附上實現程式碼，為大家提供一個新的思路，大家可以直接點選文末連結，前往BigQuant人工智慧量化投資平臺直接進行實現。

首先解釋一下標題：

CNN：卷積神經網路（Convolutional Neural Network）, 在影象處理方面有出色表現，不是被川普怒懟的那個新聞網站；
股票漲跌：大家都懂的，呵呵；
股票圖片：既然使用CNN，那麼如果輸入資料是股票某個週期的K線圖片就太好了。當然，本文中使用的圖片並不是在看盤軟體上一張一張截下來的，而是利用OHLC資料“畫”出來的；
嘗試：這個詞委婉一點說就是“一個很好的想法"，比較直白的說法是“沒啥效果T_T”。

進入正題：
首先是畫出圖片。本文目前是仿照柱線圖畫的。

利用CNN對股票「圖片」進行漲跌分類——一次嘗試

大致的想法是：

對每個樣本，將32time_steps×4features(OHLC)資料歸一化處理，即所有取值均在[0,1]之間；
構建一個128×128畫素的全0陣列，將[0,1]區間等分為128份，分到每列的128個畫素點上；
然後使用每四列構建一根K線（前三列畫柱狀線，第四列作為間隔行）：第一列描繪開盤價，開盤價與該列的哪個畫素點最近，那麼這個畫素點取值就由0變為1；第二列描繪高低價區間，將最高價至最低價範圍內的畫素點取值由0變為1；第三列描繪收盤價，收盤價與該列的哪個畫素點最近，那麼這個畫素點取值就由0變為1。

這樣每個樣本就構建了一張由32根K線組成，類似柱線圖的“圖片”，下面是一個樣本畫的一張圖（為了便於觀看，將0替換成空格，將1替換成圓點）：

利用CNN對股票「圖片」進行漲跌分類——一次嘗試

其實還蠻像柱線圖的。

測試階段：

原始資料：最終選擇的資料是100只2005年以前上市的股票。1只股票資料太少，全部股票資料又太多，所以股票三千，我只取一百；“上市時間前於2005年”這個條件主要考慮在每隻股票上取樣數量不會太少。
生成樣本：每隻股票每32根K線生成一個樣本，每隔8根K線取一次樣。然後按照上述作圖方法將其變成圖片。標籤：若未來五日收益為正，標籤為[1,0]，否則，標籤為[0,1]。15年1月1日之前資料用作train和evaluate，之後資料用作test。
構建模型：本文所用模型共5層，先後順序為卷積層-池化層-卷積層-池化層-全連線層，中間還夾雜了兩個Dropout和一個Flatten，用來防止過擬合和一維化資料，不過由於他們是無權重的，所以沒將他們算作一層。

利用CNN對股票「圖片」進行漲跌分類——一次嘗試

預測效果：

在train和evaluate階段，看起來還是不錯的：

但是在test階段：

利用CNN對股票「圖片」進行漲跌分類——一次嘗試第一個值是loss，第二個值是準確率，不要看反。。。呵呵

聽說有一種很厲害的操作——去除label不明顯的樣本——可能會提高模型效果。所以本文又對訓練樣本進行了一次篩選，只保留了未來五日收益在最前30%和最後30%的樣本。然後input到模型做訓練。最終test集上效果：

利用CNN對股票「圖片」進行漲跌分類——一次嘗試有(mei)所(sha)改(xiao)善(guo)!

利用CNN對股票「圖片」進行漲跌分類——一次嘗試

問題分析：

目前發現的一個問題：一幅圖中被標記的畫素點太少了。下面兩張圖為train-evaluate樣本和test樣本中值為1的畫素點佔總畫素點（128×128=16384）比重的分佈。

利用CNN對股票「圖片」進行漲跌分類——一次嘗試

利用CNN對股票「圖片」進行漲跌分類——一次嘗試

值為1的畫素點佔總畫素點比重平均不到5%，最大的比重也未超過10%。這說明在模型訓練階段有些畫素點對應的weights僅僅被訓練了很少的次數甚至未經訓練，這影響了模型在test資料上的表現。之後可能會針對這一問題做一些改進，以增加每張圖值為1的畫素點佔總畫素點比例

程式碼部分：

《利用CNN對股票“圖片”進行漲跌分類》

本文由BigQuant人工智慧量化投資平臺原創推出，版權歸BigQuant所有，轉載請註明出處。

相關文章

CNN-簡單圖片分類
2019-08-24
CNN
仿支付寶股票猜漲跌View
2019-03-26
View
利用 JS 進行圖片處理並生成對應粒子圖
2019-01-31
JS
亞馬遜：用CNN進行影象分類的Tricks
2019-02-20
亞馬遜CNN
使用 Transformers 進行圖分類
2023-04-18
ORM
python：利用iloc語句對列表的分類變數進行操作
2021-02-22
Python變數
NLP-使用CNN進行文字分類
2018-04-20
CNN文字分類
使用CNN，RNN和HAN進行文字分類的對比報告
2019-02-21
CNNRNN文字分類
對html進行截圖並儲存為本地圖片
2018-11-14
HTML地圖
利用機器學習進行惡意程式碼分類
2020-08-19
機器學習
python對英雄皮膚進行圖片採集~
2022-08-03
Python
Python實現利用樸素貝葉斯模型（NBC）進行問句意圖分類
2021-07-15
Python模型
嘗試用python開發一款圖片壓縮工具1：嘗試 pillow庫
2020-04-24
Python
利用Tushare資料介面+pandas進行股票資料分析
2022-06-05
如何在 CSS 背景圖片中對 SVG 圖片進行著色，修改svg圖片顏色
2018-10-22
CSSSVG
2.CNN圖片多標籤分類（基於TensorFlow實現驗證碼識別OCR）
2018-12-05
CNN
vue 上傳圖片進行壓縮圖片
2020-09-25
Vue
用 matlab 對圖片進行對比度和均衡度調整
2019-03-09
Matlab
如果利用 python 對 java 程式碼進行單元測試？
2020-10-20
PythonJava
jquery圖片直接貼上上傳的失敗嘗試
2024-06-26
jQuery
1.CNN圖片單標籤分類（基於TensorFlow實現基礎VGG16網路）
2018-12-05
CNN
Mac電腦如何對檔案進行分類和整理
2020-10-16
Mac
使用tinypng對需要上傳Gitee圖床的圖片進行壓縮
2021-10-18
Gitee圖床
《大廚》：一次仍需改進的餐廳營業嘗試
2021-04-06
如何利用Photoshop進行快速切圖
2018-11-19
對於 sway 的嘗試
2019-06-04
grpc 的第一次嘗試
2019-12-24
RPC
如何使用Python、Transformers和scikit-learn對文字進行分類？
2022-02-24
PythonORM
圖片雜亂無章、分享麻煩？HMS Core圖片分類服務教你快速篩選、分類、整合相簿
2022-04-12
手把手教你用DGL框架進行批次圖分類
2019-01-29
框架
手把手教你用DGL框架進行批量圖分類
2019-01-29
框架
Tensorflow2 自定義資料集圖片完成圖片分類任務
2020-06-21
kaggle季軍新手筆記：利用fast.ai對油棕人工林影象進行快速分類（附程式碼）
2019-05-23
筆記ASTAI
kaggle季軍新手筆記：利用fast.ai對油棕人工林影像進行快速分類（附程式碼）
2019-05-23
筆記ASTAI
TensorFlow2基礎：CNN影像分類
2020-03-13
CNN
使用 Intervention/image 對 Laravel 專案中的圖片進行處理
2018-08-30
Laravel
iOS股票K線圖、分時圖繪製
2019-04-28
iOS
記b站的一次react嘗試
2019-01-28
React