Task04:機器學習賽事:快來一起挖掘幸福感--阿里雲天池
賽題背景
在社會科學領域,幸福感的研究佔有重要的位置。這個涉及了哲學、心理學、社會學、經濟學等多方學科的話題複雜而有趣;同時與大家生活息息相關,每個人對幸福感都有自己的衡量標準。如果能發現影響幸福感的共性,生活中是不是將多一些樂趣;如果能找到影響幸福感的政策因素,便能優化資源配置來提升國民的幸福感。目前社會科學研究注重變數的可解釋性和未來政策的落地,主要採用了線性迴歸和邏輯迴歸的方法,在收入、健康、職業、社交關係、休閒方式等經濟人口因素;以及政府公共服務、巨集觀經濟環境、稅負等巨集觀因素上有了一系列的推測和發現。
賽題嘗試了幸福感預測這一經典課題,希望在現有社會科學研究外有其他維度的演算法嘗試,結合多學科各自優勢,挖掘潛在的影響因素,發現更多可解釋、可理解的相關關係。
賽題說明
賽題使用公開資料的問卷調查結果,選取其中多組變數,包括個體變數(性別、年齡、地域、職業、健康、婚姻與政治面貌等等)、家庭變數(父母、配偶、子女、家庭資本等等)、社會態度(公平、信用、公共服務等等),來預測其對幸福感的評價。
幸福感預測的準確性不是賽題的唯一目的,更希望選手對變數間的關係、變數群的意義有所探索與收穫。
資料說明
考慮到變數個數較多,部分變數間關係複雜,資料分為完整版和精簡版兩類。可從精簡版入手熟悉賽題後,使用完整版挖掘更多資訊。complete檔案為變數完整版資料,abbr檔案為變數精簡版資料。
index檔案中包含每個變數對應的問卷題目,以及變數取值的含義。
survey檔案是資料來源的原版問卷,作為補充以方便理解問題背景。
資料來源:賽題使用的資料來自中國人民大學中國調查與資料中心主持之《中國綜合社會調查(CGSS)》專案。賽題感謝此機構及其人員提供資料協助。中國綜合社會調查為多階分層抽樣的截面面訪調查。
外部資料:賽題以資料探勘和分析為出發點,不限制外部資料的使用,比如巨集觀經濟指標、政府再分配政策等公開資料,歡迎選手交流分享。
相關文章
- 【CSDN競賽第27期】贏圖書《阿里雲天池大賽賽題解析—機器學習篇》和定製周邊阿里機器學習
- 基於XGBoost模型的幸福度預測——阿里天池學習賽模型阿里
- CSDN周賽第35期:贏《阿里雲天池大賽賽題解析―深度學習篇》和定製周邊阿里深度學習
- 經典比賽濃縮成書:阿里雲天池釋出深度學習實戰技術寶典阿里深度學習
- 《阿里雲天池大賽賽題解析》——O2O優惠卷預測阿里
- 快來參加學習.NET 挑戰賽
- 機器學習(十四) 機器學習比賽網站機器學習網站
- 阿里雲機器學習 AutoML 引擎介紹與應用阿里機器學習TOML
- 阿里機器學習七面面經阿里機器學習
- 【Task04】Numpy學習打卡
- 阿里天池大賽 stacking 保姆級別手把手教授阿里
- 終於!我找到了開發的得力助手!阿里雲天池雲原生程式設計挑戰賽參賽攻略阿里程式設計
- 一起來學習設計模式:裝飾器模式設計模式
- PHP 實現機器學習挖掘使用者的購物習慣PHP機器學習
- 【乾貨Tips】最全的AI/機器學習競賽平臺網址及賽事地址彙總~AI機器學習
- 阿里雲視覺AI開發者創意應用賽來啦!快來報名參賽,各種豪禮等你來拿阿里視覺AI
- [SQL] Datawhale 學習筆記 Task04SQL筆記
- XCTF攻防世界--(新手賽區)第3題快來圍觀學習!
- XCTF攻防世界--(新手賽區)第4題快來圍觀學習!
- XCTF攻防世界--(新手賽區)第2題快來圍觀學習!
- 一起來學習分散式鎖分散式
- 當貝葉斯,奧卡姆和夏農一起來定義機器學習機器學習
- 從事機器學習兩條學習路線 - AI_Grigor機器學習AIGo
- 記微軟OpenHack機器學習挑戰賽微軟機器學習
- 機器學習去除馬賽克案例(程式碼)機器學習
- 使用機器學習來降低噪音機器學習
- 阿里雲2023屆實習生招聘啟動啦,快來加入IoT安全吧阿里
- 《Spark 3.0大資料分析與挖掘:基於機器學習》簡介Spark大資料機器學習
- 巧用機器學習定位雲伺服器故障機器學習伺服器
- 【機器學習】機器學習簡介機器學習
- 機器學習在金融比賽中的應用機器學習
- 超詳細!如何準備機器學習競賽?機器學習
- 阿里雲機器學習平臺PAI與香港大學合作論文入選INFOCOM 2022阿里機器學習AI
- 一起來學習如何用 Node 來製作 CLI
- 阿里機器學習七面面經 |「掘金技術徵文」阿里機器學習
- 機器學習近年來之怪現象機器學習
- 機器學習的未來——深度特徵融合機器學習特徵
- AI推理服務平臺升級,阿里雲機器學習PAI推出新規格AI阿里機器學習