新聞推薦競賽-task01

幸運的蝸牛崽發表於2020-11-23

賽題理解

賽題連結https://tianchi.aliyun.com/competition/entrance/531842/introduction

賽題理解究竟是在理解什麼

  1. 理解賽題:從直觀上對問題進行梳理, 分析問題的目標,到底要讓做什麼事情, 這個非常重要
  2. 理解資料:對賽題資料有一個初步瞭解,知道和任務相關的資料欄位和資料欄位的型別, 資料之間的內在關聯等,大體梳理一下哪些資料會對我們解決問題非常有用,方便後面我們的資料分析和特徵工程。
  3. 理解評估指標:評估指標是檢驗我們提出的方法,我們給出結果好壞的標準,只有正確的理解了評估指標,我們才能進行更好的訓練模型,更好的進行預測。此外,很多情況下,線上驗證是有一定的時間和次數限制的,所以在比賽中構建一個合理的本地的驗證集和驗證的評價指標是很關鍵的步驟,能有效的節省很多時間。 不同的指標對於同樣的預測結果是具有誤差敏感的差異性的所以不同的評價指標會影響後續一些預測的側重點。

有了賽題理解之後,我們該做什麼?

  1. 在對於賽題有了一定的瞭解後,分析清楚了問題的型別性質和對於資料理解 的這一基礎上,我們可以梳理一個解決賽題的一個大題思路和框
  2. 我們至少要有一些相應的理解分析,比如這題的難點可能在哪裡,關鍵點可能在哪裡,哪些地方可以挖掘更好的特徵.
  3. 什麼樣得線下驗證方式更為穩定,出現了過擬合或者其他問題,估摸可以用什麼方法去解決這些問題

相關文章