為K線序列管理新增變動百分比屬性，和一個簡單分析

張國平發表於2019-04-18

原文網址 : http://blog.itpub.net/22259926/viewspace-2641780/

一般K線資料，主要是記錄HLOC（High，Low，Open，Close）四個值，再加上Volume交易量。在做基於K線分析時候，變動百分比也是一個經常考慮數值。這裡說下增加變動百分比的屬性。

其實還是很簡單，如果不考慮跳空的話，就是（Close - Open）* 100.0 / Open; 考慮到跳空的話，就是當前K線結束值前取上個K線結束值，再處於上個K線結束值即可。

如果有個close的值佇列的，示例程式碼如下

closelist = [100,99,101,103,105,109]
def getPrecentlist(inputlist):
    precentlist = []
    for i in range(1,len(inputlist)):
        precent = (inputlist[i] - inputlist[i-1])*100.0/inputlist[i-1]
        precentlist.append(precent)
    return precentlist
getPrecentlist(closelist)

返回就是如下百分比佇列。

[-1.0,2.0202020202020203,1.9801980198019802,1.941747572815534,3.8095238095238093]

同理，在VNPY的K線序列管理工具ArrayManager，可以加入下面程式碼。按照屬性返回百分比序列

@property
def percent(self):
    """獲取百分比序列"""
    arrayold = self.closeArray[0:self.size - 1]
    arraynew = self.closeArray[1:self.size]
    return map(lambda (closenew, closeold): (closenew - closeold)*100.0/closeold,zip(arraynew, arrayold))

這裡稍微有點玄機，就是利用了lambda把原來function簡化，同時用zip生成一個當前close和前一個close的元祖，來調來計算。

下面使用之前做的DataFrame anaylzer做的一些分析。對於豆粕m1905，從2018年09月1日到現在，10分鐘K的變動百分比。

首先不出所料，precent以0為中軸的高斯分佈。

比較出乎意料的是，對於最大和最小的百分之一到百分之五的K線，之後的2，4，6個K線結束時候，過半數是反轉掉頭的。我原來以為如果有個大的K線向上，之後回順著向上，但是看起來，反轉更能多出現。

Precent 大於 0.4312038575295748, 99時候，k線數量為 54，第二根K線結束價格上漲概率為 31.48148148148148%;
Precent 小於於 -0.4345589035350628, 1時候，k線數量為 54, 第二根K線結束價格下跌概率為 38.888888888888886%
Precent 大於 0.4312038575295748, 99時候，第四根K線結束價格上漲概率為 33.333333333333336%
Precent 小於於 -0.4345589035350628, 1時候，第四根K線結束價格下跌概率為 48.148148148148145%
Precent 大於 0.4312038575295748, 99時候，第六根K線結束價格上漲概率為 35.18518518518518%
Precent 小於於 -0.4345589035350628, 1時候，第六根K線結束價格下跌概率為 46.2962962962963%
Precent 大於 0.31567899447202463, 98時候，k線數量為 107，第二根K線結束價格上漲概率為 38.3177570093458%;
Precent 小於於 -0.3369829012686155, 2時候，k線數量為 107, 第二根K線結束價格下跌概率為 36.44859813084112%
Precent 大於 0.31567899447202463, 98時候，第四根K線結束價格上漲概率為 37.38317757009346%
Precent 小於於 -0.3369829012686155, 2時候，第四根K線結束價格下跌概率為 41.12149532710281%
Precent 大於 0.31567899447202463, 98時候，第六根K線結束價格上漲概率為 33.64485981308411%
Precent 小於於 -0.3369829012686155, 2時候，第六根K線結束價格下跌概率為 40.18691588785047%
Precent 大於 0.27096928404930803, 97時候，k線數量為 160，第二根K線結束價格上漲概率為 39.375%;
Precent 小於於 -0.2776041810690485, 3時候，k線數量為 160, 第二根K線結束價格下跌概率為 36.25%
Precent 大於 0.27096928404930803, 97時候，第四根K線結束價格上漲概率為 40.625%
Precent 小於於 -0.2776041810690485, 3時候，第四根K線結束價格下跌概率為 41.875%
Precent 大於 0.27096928404930803, 97時候，第六根K線結束價格上漲概率為 40.0%
Precent 小於於 -0.2776041810690485, 3時候，第六根K線結束價格下跌概率為 42.5%
Precent 大於 0.23543815932988155, 96時候，k線數量為 213，第二根K線結束價格上漲概率為 37.55868544600939%;
Precent 小於於 -0.24673951357067325, 4時候，k線數量為 214, 第二根K線結束價格下跌概率為 38.78504672897196%
Precent 大於 0.23543815932988155, 96時候，第四根K線結束價格上漲概率為 40.375586854460096%
Precent 小於於 -0.24673951357067325, 4時候，第四根K線結束價格下跌概率為 43.925233644859816%
Precent 大於 0.23543815932988155, 96時候，第六根K線結束價格上漲概率為 39.436619718309856%
Precent 小於於 -0.24673951357067325, 4時候，第六根K線結束價格下跌概率為 43.925233644859816%

但是，我嘗試用這個規律做繼續分析收益的時候，發現雖然繼續向上或者向下次數不多，但是往往是巨量的，這樣如果下一個反轉的單子意味著鉅虧。這個就是雖然小於50%出現，但是來一次都是高風險呀。

DataFrame 分析程式碼如下：

# encoding: UTF-8
from pymongo import MongoClient, ASCENDING
import pandas as pd
import numpy as np
from datetime import datetime
import talib
import matplotlib.pyplot as plt
import scipy.stats as scs
class DataAnalyzer(object):
    def __init__(self, exportpath="C:\Project\\", datformat=['datetime', 'high', 'low', 'open', 'close','volume']):
        self.mongohost = None
        self.mongoport = None
        self.db = None
        self.collection = None
        self.df = pd.DataFrame()
        self.exportpath = exportpath
        self.datformat = datformat
    def db2df(self, db, collection, start, end, mongohost="localhost", mongoport=27017, export2csv=False):
        """讀取MongoDB資料庫行情記錄，輸出到Dataframe中"""
        self.mongohost = mongohost
        self.mongoport = mongoport
        self.db = db
        self.collection = collection
        dbClient = MongoClient(self.mongohost, self.mongoport, connectTimeoutMS=500)
        db = dbClient[self.db]
        cursor = db[self.collection].find({'datetime':{'$gte':start, '$lt':end}}).sort("datetime",ASCENDING)
        self.df = pd.DataFrame(list(cursor))
        self.df = self.df[self.datformat]
        self.df = self.df.reset_index(drop=True)
        path = self.exportpath + self.collection + ".csv"
        if export2csv == True:
            self.df.to_csv(path, index=True, header=True)
        return self.df
    def csv2df(self, csvpath, dataname="csv_data", export2csv=False):
        """讀取csv行情資料，輸入到Dataframe中"""
        csv_df = pd.read_csv(csvpath)
        self.df = csv_df[self.datformat]
        self.df["datetime"] = pd.to_datetime(self.df['datetime'])
        self.df = self.df.reset_index(drop=True)
        path = self.exportpath + dataname + ".csv"
        if export2csv == True:
            self.df.to_csv(path, index=True, header=True)
        return self.df
    def df2Barmin(self, inputdf, barmins, crossmin=1, export2csv=False):
        """輸入分鐘k線dataframe資料，合併多多種資料，例如三分鐘/5分鐘等，如果開始時間是9點1分，crossmin = 0；如果是9點0分，crossmin為1"""
        dfbarmin = pd.DataFrame()
        highBarMin = 0
        lowBarMin = 0
        openBarMin = 0
        volumeBarmin = 0
        datetime = 0
        for i in range(0, len(inputdf) - 1):
            bar = inputdf.iloc[i, :].to_dict()
            if openBarMin == 0:
                openBarmin = bar["open"]
            if highBarMin == 0:
                highBarMin = bar["high"]
            else:
                highBarMin = max(bar["high"], highBarMin)
            if lowBarMin == 0:
                lowBarMin = bar["low"]
            else:
                lowBarMin = min(bar["low"], lowBarMin)
            closeBarMin = bar["close"]
            datetime = bar["datetime"]
            volumeBarmin += int(bar["volume"])
            # X分鐘已經走完
            if not (bar["datetime"].minute + crossmin) % barmins:  # 可以用X整除
                # 生成上一X分鐘K線的時間戳
                barMin = {'datetime': datetime, 'high': highBarMin, 'low': lowBarMin, 'open': openBarmin,
                          'close': closeBarMin, 'volume' : volumeBarmin}
                dfbarmin = dfbarmin.append(barMin, ignore_index=True)
                highBarMin = 0
                lowBarMin = 0
                openBarMin = 0
                volumeBarmin = 0
        if export2csv == True:
            dfbarmin.to_csv(self.exportpath + "bar" + str(barmins)+ str(self.collection) + ".csv", index=True, header=True)
        return dfbarmin
    #--------------------------------------------------------------
    def Percentage(self, inputdf, export2csv=True):
        """ 計算 Percentage """
        dfPercentage = inputdf
        for i in range(1, len(inputdf)):
            if dfPercentage.loc[ i - 1, "close"] == 0.0:
                percentage = 0
            else:
                percentage = ((dfPercentage.loc[i, "close"] - dfPercentage.loc[i - 1, "close"]) / dfPercentage.loc[ i - 1, "close"]) * 100.0
            dfPercentage.loc[i, "Perentage"] = percentage
        dfPercentage = dfPercentage.fillna(0)
        dfPercentage = dfPercentage.replace(np.inf, 0)
        if export2csv == True:
            dfPercentage.to_csv(self.exportpath + "Percentage_" + str(self.collection) + ".csv", index=True, header=True)
        return dfPercentage
    def resultValuate(self,inputdf, nextBar, export2csv=True):
        summayKey = ["Percentage","TestValues"]
        dft = pd.DataFrame(columns=summayKey)
    def addResultBar(self, inputdf, export2csv = False):
        dfaddResultBar = inputdf
        ######cci在（100 - 200),(200 -300）後的第2根，第4根，第6根的價格走勢######################
        dfaddResultBar["next2BarClose"] = None
        dfaddResultBar["next4BarClose"] = None
        dfaddResultBar["next6BarClose"] = None
        dfaddResultBar["next5BarCloseMakrup"] = None
        for i in range(1, len(dfaddResultBar) - 6):
            dfaddResultBar.loc[i, "next2BarPercentage"] = dfaddResultBar.loc[i + 2, "close"] - dfaddResultBar.loc[i, "close"]
            dfaddResultBar.loc[i, "next4BarPercentage"] = dfaddResultBar.loc[i + 4, "close"] - dfaddResultBar.loc[i, "close"]
            dfaddResultBar.loc[i, "next6BarPercentage"] = dfaddResultBar.loc[i + 6, "close"] - dfaddResultBar.loc[i, "close"]
            if dfaddResultBar.loc[i, "close"] > dfaddResultBar.loc[i + 2, "close"]:
                dfaddResultBar.loc[i, "next2BarClose"] = -1
            elif dfaddResultBar.loc[i, "close"] < dfaddResultBar.loc[i + 2, "close"]:
                dfaddResultBar.loc[i, "next2BarClose"] = 1
            if dfaddResultBar.loc[i, "close"] > dfaddResultBar.loc[i + 4, "close"]:
                dfaddResultBar.loc[i, "next4BarClose"] = -1
            elif dfaddResultBar.loc[i, "close"] < dfaddResultBar.loc[i + 4, "close"]:
                dfaddResultBar.loc[i, "next4BarClose"] = 1
            if dfaddResultBar.loc[i, "close"] > dfaddResultBar.loc[i + 6, "close"]:
                dfaddResultBar.loc[i, "next6BarClose"] = -1
            elif dfaddResultBar.loc[i, "close"] < dfaddResultBar.loc[i + 6, "close"]:
                dfaddResultBar.loc[i, "next6BarClose"] = 1
        dfaddResultBar = dfaddResultBar.fillna(0)
        if export2csv == True:
            dfaddResultBar.to_csv(self.exportpath + "addResultBar" + str(self.collection) + ".csv", index=True, header=True)
        return dfaddResultBar
def PrecentAnalysis(inputdf):
    dfPercentage = inputdf
    #######################################分析分佈########################################
    plt.figure(figsize=(10,3))
    plt.hist(dfPercentage['Perentage'],bins=300,histtype='bar',align='mid',orientation='vertical',color='r')
    plt.show()
    for Perentagekey in range(1,5):
        lpHigh = np.percentile(dfPercentage['Perentage'], 100-Perentagekey)
        lpLow = np.percentile(dfPercentage['Perentage'], Perentagekey)
        de_anaylsisH = dfPercentage.loc[(dfPercentage["Perentage"]>= lpHigh)]
        HCount = de_anaylsisH['Perentage'].count()
        de_anaylsisL = dfPercentage.loc[(dfPercentage["Perentage"] <= lpLow)]
        LCount = de_anaylsisL['Perentage'].count()
        percebtage = de_anaylsisH[de_anaylsisH["next2BarClose"]>0]["next2BarClose"].count()*100.000/HCount
        de_anaylsisHsum = de_anaylsisH["next2BarPercentage"].sum()
        de_anaylsisLsum = de_anaylsisL["next2BarPercentage"].sum()
        print('Precent 大於 %s, %s時候，k線數量為 %s，第二根K線結束價格上漲概率為 %s%%;' %(lpHigh,100-Perentagekey,HCount , percebtage))
        print('和值 %s' %(de_anaylsisHsum))
        de_anaylsisL = dfPercentage.loc[(dfPercentage["Perentage"]<= lpLow)]
        percebtage = de_anaylsisL[de_anaylsisL["next2BarClose"]<0]["next2BarClose"].count()*100.000/LCount
        print('Precent 小於於 %s, %s時候，k線數量為 %s, 第二根K線結束價格下跌概率為 %s%%' %(lpLow,Perentagekey,LCount, percebtage))
        print('和值 %s' %(de_anaylsisLsum))
        de_anaylsisHsum = de_anaylsisH["next4BarPercentage"].sum()
        de_anaylsisLsum = de_anaylsisL["next4BarPercentage"].sum()
        percebtage = de_anaylsisH[de_anaylsisH["next4BarClose"] > 0]["next2BarClose"].count() * 100.000 / HCount
        print('Precent 大於 %s, %s時候，第四根K線結束價格上漲概率為 %s%%' % (lpHigh, 100 - Perentagekey, percebtage))
        # print('和值 %s' % (de_anaylsisHsum))
        percebtage = de_anaylsisL[de_anaylsisL["next4BarClose"] < 0]["next2BarClose"].count() * 100.000 / LCount
        print('Precent 小於於 %s, %s時候，第四根K線結束價格下跌概率為 %s%%' % (lpLow, Perentagekey, percebtage))
        print('和值 %s' % (de_anaylsisLsum))
        de_anaylsisHsum = de_anaylsisH["next6BarPercentage"].sum()
        de_anaylsisLsum = de_anaylsisL["next6BarPercentage"].sum()
        percebtage = de_anaylsisH[de_anaylsisH["next6BarClose"] > 0]["next2BarClose"].count() * 100.000 / HCount
        print('Precent 大於 %s, %s時候，第六根K線結束價格上漲概率為 %s%%' % (lpHigh, 100 - Perentagekey, percebtage))
        print('和值 %s' % (de_anaylsisHsum))
        percebtage = de_anaylsisL[de_anaylsisL["next6BarClose"] < 0]["next2BarClose"].count() * 100.000 /LCount
        print('Precent 小於於 %s, %s時候，第六根K線結束價格下跌概率為 %s%%' % (lpLow, Perentagekey, percebtage))
        print('和值 %s' % (de_anaylsisLsum))
if __name__ == '__main__':
    DA = DataAnalyzer()
    #資料庫匯入
    start = datetime.strptime("20180901", '%Y%m%d')
    end = datetime.today()
    df = DA.db2df(db="VnTrader_1Min_Db", collection="m1905", start = start, end = end)
    #csv匯入
    # df = DA.csv2df("rb1905.csv")
    df10min = DA.df2Barmin(df,10)
    dfPercentage = DA.Percentage(df10min)
    dfPercentage = DA.addResultBar(dfPercentage)
    PrecentAnalysis(dfPercentage)

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/22259926/viewspace-2641780/，如需轉載，請註明出處，否則將追究法律責任。

WPF一個簡單的屬性編輯控制元件
2024-05-25
控制元件
一個超級簡單的PHP超全域性變數管理擴充套件
2019-03-30
PHP變數套件
JS/JQ動態建立（新增）optgroup和option屬性
2022-04-09
JS
簡單介紹實體類或物件序列化時,忽略為空屬性的操作
2021-11-12
物件
Wordpress自動給圖片新增alt和title屬性
2020-10-04
Java：對一個物件序列化和反序列化的簡單實現
2022-01-05
Java物件
4 個概念，1 個動作，讓應用管理變得更簡單
2019-12-03
為 protocol 中屬性新增預設值
2019-04-17
Protocol
在 JavaScript 中，我們能為原始型別新增一個屬性或方法嗎？
2020-11-17
JavaScript型別
簡單聊一聊Flex佈局常用的屬性
2018-04-16
Flex
spring 簡單的使用 Hikari連線池和 jdbc連線mysql 的一個簡單例子
2024-03-10
SpringJDBCMySql單例
Fastjson定製屬性的序列化和反序列化
2018-03-11
ASTJSON
Python 動態新增例項屬性，例項方法，類屬性，類方法
2024-06-29
Python
在一個元素上:hover，改變另一個元素的css屬性
2018-11-06
CSS
python物件屬性管理(2)：property管理屬性
2018-12-28
Python物件
為什麼React元素有一個$$typeof屬性？
2019-02-12
React
Python給exe新增以管理員執行的屬性
2023-12-19
Python
線性dp--最長上升子序列變形
2024-04-25
Android 顏色漸變屬性動畫
2019-04-02
Android動畫
???又一個管理端框架上線了，設計理念簡單而不簡約
2023-09-18
框架
jquery js 設定 div 的內容，給 div 新增一個屬性
2019-02-14
jQueryJS
line-height與vertical-align：簡單的屬性不簡單
2018-05-20
PHP動態屬性和stdclass
2021-09-09
PHP
java實現用一個變數表示多個屬性的狀態
2024-08-09
Java變數
defer 屬性和 async 屬性
2024-06-09
一個left join SQL 簡單優化分析
2018-12-04
SQL優化
分析一個簡單的goroutine資源池
2021-12-27
Go
Python，寫一個簡單的屬於自己的『BaseEnum』類
2019-03-04
Python
EAV（實體-屬性-值）模型簡單介紹
2024-11-07
模型
Go語言編譯時為exe新增圖示和屬性資訊的方法
2024-06-26
Go編譯
EVIEWS 簡單線性迴歸 02
2020-11-11
View
class屬性的新增刪除
2018-08-11
給Product新增自定義屬性
2024-12-08
SVG accumulate和additive動畫屬性
2018-08-22
SVG動畫
使用Netty和動態代理實現一個簡單的RPC
2021-11-08
NettyRPC
vue3如何將 app 全域性變數物件變為響應式並監聽到某個屬性的改變
2024-10-08
VueAPP變數物件
為VNPY的K線序列管理工具ArrayManager增加對數收益率佇列
2019-07-26
佇列
css可繼承屬性和非繼承屬性一覽
2019-11-27
CSS繼承

為K線序列管理新增變動百分比屬性，和一個簡單分析

相關文章