【天池競賽系列】菜鳥-需求預測與分倉規劃初賽冠軍解決方案

Bryan__發表於2016-06-15

初賽第一名,決賽第6名

沒能去答辯,就瞎扯一下

初賽程式碼:https://github.com/wepe/CaiNiao-DemandForecast-StoragePlaning

比賽資料:連結: https://pan.baidu.com/s/1i55YPpF 密碼: jxcp


預處理:刪除雙11,雙12的資料,然後前面的資料往後移動一天填補,將不同趨勢的商品聚類,對規律相同的簇單獨建模分析

特徵:因為資料量少,所以採用滑動視窗提取特徵
前2周的資料提取特徵,後兩週求和作為label,滑動10個視窗
特徵是求的最近k天商品的一些統計量,排名,佔比
做一些多項式交叉特徵
商品的補多補少成本多相似組合
trick:
商品成本相加作為樣本權重
線下訓練模型預測訓練集,成本高的商品視作噪聲從訓練集中去除
單獨分析發現這部分樣本變化較大,考慮使用比較穩定的規則處理這部分樣本


特徵選擇:xgb選擇排名topk的特徵,計算相似度,去除冗餘特徵


模型:使用LR + SVR +RF +GBRT+XGBOOST 40多個模型,按照商品成本做融合
補多成本大,則選擇min(models)。補少成本大選擇max(models)


規則:補多成本大,則選擇min(最近2周)。補少成本大選擇max(最近2周)


相關文章