針對vnpy的不同期貨品種行情資料清理
之前2月25日,上海期貨交易所進行測試,在週六進行行情廣播,我的datarecording一直在跑;然後就發現讀了不少髒資料。
vnpy自帶的行情清理功能較為簡單,只是在清除非交易時段,沒有考慮週六日;而且只是籠統給了一個最大時間交易範圍,像股指期貨沒有夜盤,螺紋鋼晚上11點就結束,但是預設只是結束在凌晨兩點半這個最大交易時間。 所以寫了一個方法,按照不同品種,更細緻的清理。
可以直接把這個方法插入\DataRecording\runDataCleaning.py, 然後替代原來方法。也可以自己另外呼叫。
# ---------------------------------------------------------------------- def cleanDataAdv(dbName, collectionName, start): """清洗資料""" #新的靜態資料 # 這裡以商品期貨為例 MORNING_START = time(9, 0) MORNING_REST = time(10, 15) MORNING_RESTART = time(10, 30) MORNING_END = time(11, 30) AFTERNOON_START = time(13, 30) AFTERNOON_END = time(15, 0) NIGHT_START = time(21, 0) NIGHT_END = time(2, 30) #股指期貨 STOCK_FUTURE = ["IC", "IF", "IH"] MORNING_START_STOCK = time(9, 30) AFTERNOON_START_STOCK = time(13,0) AFTERNOON_END_STOCK = time(15, 0) #晚上11點結束交易,不全,請自行維護 PM11CLOSE_FUTURE = ['rb','ru','bu','hc','sp'] NIGHT_END_11 = time(23, 00) #晚上11點半結束交易,不全,請自行維護,大連只有一位標誌,所以帶1 PM1130CLOSE_FUTURE = ['FG','MA','SR','TA','RM','OI','CF','CY','ZC','i1','j1','m1','p1','y1'] NIGHT_END_1130 = time(23, 30) #凌晨1點半結束交易,不全,請自行維護 AM1CLOSE_FUTURE = ['cu','pd','al','zn'] NIGHT_END_AM1 = time(1, 00) print(u'\n清洗資料庫:%s, 集合:%s, 起始日:%s' % (dbName, collectionName, start)) mc = MongoClient('localhost', 27017) # 建立MongoClient cl = mc[dbName][collectionName] # 獲取資料集合 d = {'datetime': {'$gte': start}} # 只過濾從start開始的資料 cx = cl.find(d) # 獲取資料指標 for data in cx: # 獲取時間戳物件 dt = data['datetime'].time() # 預設需要清洗 cleanRequired = True ####如果是股指期貨,這沒有上午休息和夜盤,9點半到11點半,下午1點到下午三點,週六日無行情 if collectionName[:2] in STOCK_FUTURE: if data['datetime'].weekday() is not (5 or 6): if ((MORNING_START_STOCK <= dt < MORNING_END) or (AFTERNOON_START_STOCK <= dt < AFTERNOON_END_STOCK)): cleanRequired = False ####如果是11點結束,則週六日無行情 elif collectionName[:2] in PM11CLOSE_FUTURE: if data['datetime'].weekday() is not (5 or 6): if ((MORNING_START <= dt < MORNING_REST) or (MORNING_RESTART <= dt < MORNING_END) or (AFTERNOON_START <= dt < AFTERNOON_END) or ( NIGHT_START <= dt <NIGHT_END_11)): cleanRequired = False ####如果是11點半結束,則週六日無行情 elif collectionName[:2] in PM1130CLOSE_FUTURE: if data['datetime'].weekday() is not (5 or 6): if ((MORNING_START <= dt < MORNING_REST) or (MORNING_RESTART <= dt < MORNING_END) or (AFTERNOON_START <= dt < AFTERNOON_END) or (NIGHT_START <= dt < NIGHT_END_1130)): cleanRequired = False ####如果是1點結束, elif collectionName[:2] in AM1CLOSE_FUTURE: # 如果在交易事件內,則為有效資料,無需清洗 if data['datetime'].weekday() is not 6: if ((MORNING_START <= dt < MORNING_REST) or (MORNING_RESTART <= dt < MORNING_END) or (AFTERNOON_START <= dt < AFTERNOON_END) or (dt >= NIGHT_START) or (dt < NIGHT_END_AM1)): cleanRequired = False else: # 如果在交易事件內,則為有效資料,無需清洗 if data['datetime'].weekday() is not 6: if ((MORNING_START <= dt < MORNING_REST) or (MORNING_RESTART <= dt < MORNING_END) or (AFTERNOON_START <= dt < AFTERNOON_END) or (dt >= NIGHT_START) or (dt < NIGHT_END)): cleanRequired = False # 如果需要清洗 if cleanRequired: print(u'刪除無效資料,時間戳:%s' % data['datetime']) cl.delete_one(data) print(u'清洗完成,資料庫:%s, 集合:%s' % (dbName, collectionName))
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22259926/viewspace-2637736/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- VNPY 行情資料中非行情資料清理
- 針對vnpy的mongodb資料庫,合併多個主力合約行情為連續行情資料MongoDB資料庫
- 利用聚寬(Joinquant)資料來源為vnpy新增期貨行情資料
- VNPY 單品種期貨的網格交易策略的實現
- 澳大利亞稅務局使用國際資料協議針對加密貨幣交易者協議加密
- mongodb清理collection中大量資料的2種辦法MongoDB
- 寫了一個類GeneticOptimizeStrategy,針對VNPY策略遺傳演算法優化演算法優化
- 高危預警:針對MySQL資料庫的勒索病毒MySql資料庫
- 針對XML資料的關係型檢視XYXML
- 資料分析 | 資料清理的方法
- git針對指定資料夾建立版本庫Git
- 為VNPY增加資料庫記錄交易資料功能資料庫
- 川普政府針對加密貨幣制定“綜合戰略”加密
- windows10資料夾太大清理方法 不影響系統怎麼清理c盤Windows
- 針對雲原生轉型的6個關鍵資料策略
- 10個針對企業的免費大資料分析工具大資料
- 【資料分析】針對家庭用電資料進行時序分析(1)
- 微軟、IBM大資料市場針鋒相對微軟IBM大資料
- 一種針對Microsoft Office的自動化攻擊方式ROS
- Redis 避不開的五種資料結構Redis資料結構
- Atlas VPN:安全黑市中出售51%的漏洞是針對微軟產品的微軟
- Chrome89針對sessionStorage的更新導致資料共享問題ChromeSession
- Golang 針對 MySQL 資料庫表結構的差異 SQL 工具GolangMySql資料庫
- Edelman Berland:大資料強化了程式化廣告的針對性大資料
- 資料預處理-資料清理
- 機器學習之清理資料機器學習
- 針對ShotGun的ServerRewindOTGServer
- 對不起,我不是針對你,我是說在座的各位都不會寫 Java!Java
- 產品經理必會的10種資料分析方法
- 在進行行情 tick 資料儲存時,哪種資料結構查詢起來更快?資料結構
- 俄羅斯政府針對加密貨幣草案提出修改意見加密
- 【NetApp資料恢復案例】針對NetApp誤刪除資料的恢復APP資料恢復
- 數字貨幣比特幣以太坊買賣五檔行情資料API介面比特幣API
- 澳大利亞徵求公眾對加密貨幣指導方針的意見加密
- 針對macOS的新型加密貨幣挖礦木馬OSX.CpuMeanerMac加密
- PHP的工資行情PHP
- 資料分析八大模型:同期群模型大模型
- 技術分享 | 一種針對PHP物件注入漏洞的新型利用方法PHP物件