針對vnpy的不同期貨品種行情資料清理

張國平發表於2019-03-06

之前2月25日,上海期貨交易所進行測試,在週六進行行情廣播,我的datarecording一直在跑;然後就發現讀了不少髒資料。

vnpy自帶的行情清理功能較為簡單,只是在清除非交易時段,沒有考慮週六日;而且只是籠統給了一個最大時間交易範圍,像股指期貨沒有夜盤,螺紋鋼晚上11點就結束,但是預設只是結束在凌晨兩點半這個最大交易時間。 所以寫了一個方法,按照不同品種,更細緻的清理。


可以直接把這個方法插入\DataRecording\runDataCleaning.py, 然後替代原來方法。也可以自己另外呼叫。

# ----------------------------------------------------------------------
def cleanDataAdv(dbName, collectionName, start):
    """清洗資料"""
    #新的靜態資料
    # 這裡以商品期貨為例
    MORNING_START = time(9, 0)
    MORNING_REST = time(10, 15)
    MORNING_RESTART = time(10, 30)
    MORNING_END = time(11, 30)
    AFTERNOON_START = time(13, 30)
    AFTERNOON_END = time(15, 0)
    NIGHT_START = time(21, 0)
    NIGHT_END = time(2, 30)
    #股指期貨
    STOCK_FUTURE = ["IC", "IF", "IH"]
    MORNING_START_STOCK = time(9, 30)
    AFTERNOON_START_STOCK = time(13,0)
    AFTERNOON_END_STOCK = time(15, 0)
    #晚上11點結束交易,不全,請自行維護
    PM11CLOSE_FUTURE = ['rb','ru','bu','hc','sp']
    NIGHT_END_11 = time(23, 00)
    #晚上11點半結束交易,不全,請自行維護,大連只有一位標誌,所以帶1
    PM1130CLOSE_FUTURE = ['FG','MA','SR','TA','RM','OI','CF','CY','ZC','i1','j1','m1','p1','y1']
    NIGHT_END_1130 = time(23, 30)
    #凌晨1點半結束交易,不全,請自行維護
    AM1CLOSE_FUTURE = ['cu','pd','al','zn']
    NIGHT_END_AM1 = time(1, 00)
    print(u'\n清洗資料庫:%s, 集合:%s, 起始日:%s' % (dbName, collectionName, start))
    mc = MongoClient('localhost', 27017)  # 建立MongoClient
    cl = mc[dbName][collectionName]  # 獲取資料集合
    d = {'datetime': {'$gte': start}}  # 只過濾從start開始的資料
    cx = cl.find(d)  # 獲取資料指標
    for data in cx:
    # 獲取時間戳物件
        dt = data['datetime'].time()
        # 預設需要清洗
        cleanRequired = True
        ####如果是股指期貨,這沒有上午休息和夜盤,9點半到11點半,下午1點到下午三點,週六日無行情
        if collectionName[:2] in STOCK_FUTURE:
            if data['datetime'].weekday() is not (5 or 6):
                if ((MORNING_START_STOCK <= dt < MORNING_END) or
                        (AFTERNOON_START_STOCK <= dt < AFTERNOON_END_STOCK)):
                    cleanRequired = False
        ####如果是11點結束,則週六日無行情
        elif collectionName[:2] in PM11CLOSE_FUTURE:
            if data['datetime'].weekday() is not (5 or 6):
                if ((MORNING_START <= dt < MORNING_REST) or
                        (MORNING_RESTART <= dt < MORNING_END) or
                        (AFTERNOON_START <= dt < AFTERNOON_END) or
                        ( NIGHT_START <= dt <NIGHT_END_11)):
                    cleanRequired = False
        ####如果是11點半結束,則週六日無行情
        elif collectionName[:2] in PM1130CLOSE_FUTURE:
            if data['datetime'].weekday() is not (5 or 6):
                if ((MORNING_START <= dt < MORNING_REST) or
                        (MORNING_RESTART <= dt < MORNING_END) or
                        (AFTERNOON_START <= dt < AFTERNOON_END) or
                        (NIGHT_START <= dt < NIGHT_END_1130)):
                    cleanRequired = False
        ####如果是1點結束,
        elif collectionName[:2] in AM1CLOSE_FUTURE:
            # 如果在交易事件內,則為有效資料,無需清洗
            if data['datetime'].weekday() is not 6:
                if ((MORNING_START <= dt < MORNING_REST) or
                        (MORNING_RESTART <= dt < MORNING_END) or
                        (AFTERNOON_START <= dt < AFTERNOON_END) or
                        (dt >= NIGHT_START) or
                        (dt < NIGHT_END_AM1)):
                    cleanRequired = False
        else:
            # 如果在交易事件內,則為有效資料,無需清洗
            if data['datetime'].weekday() is not 6:
                if ((MORNING_START <= dt < MORNING_REST) or
                    (MORNING_RESTART <= dt < MORNING_END) or
                    (AFTERNOON_START <= dt < AFTERNOON_END) or
                    (dt >= NIGHT_START) or
                    (dt < NIGHT_END)):
                    cleanRequired = False
            # 如果需要清洗
        if cleanRequired:
            print(u'刪除無效資料,時間戳:%s' % data['datetime'])
            cl.delete_one(data)
    print(u'清洗完成,資料庫:%s, 集合:%s' % (dbName, collectionName))


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22259926/viewspace-2637736/,如需轉載,請註明出處,否則將追究法律責任。

相關文章