從情感分析到使用者畫像,CCF大資料與計算智慧大賽 作品原始碼資料整理

大資料探勘DT資料分析發表於2018-03-09

640?wx_fmt=gif

 向AI轉型的程式設計師都關注了這個號???


大概的調研情況如下:

比賽官網 http://www.datafountain.cn/#/home


比賽主要涉及大資料與人工智慧領域,這是比較新的領域,這個比賽的先進性以及後期的發展潛力是毋庸置疑的。其次,比賽的出題企業也是非常優質的。去年的主辦方邀請了國家電網、螞蟻金服、搜狗這種重量級的企業,可以體會到比賽堅強的後盾和企業對於這個比賽的巨大期望。最後,在比賽的規模與影響力方面,這個比賽用了僅僅三四年時間已經可以號召近3萬的使用者,並且基本全部為計算機行業的資料人才,可以看出這個比賽的磅礴的生命力。所以這個比賽還是很值得參加的。(單單從獎金來看,也很具有誘惑力)



0)基於主題的文字情感分析 賽題


 以網上電商購物評論為例,原始的主題模型主要針對篇幅較大的文件或者評論句子的集合,學習到的主題主要針對整個產品品牌;而現實情形是,使用者評論大多針圍繞產品的某些特徵或內容主題展開(如口味、服務、環境、價效比、交通、快遞、記憶體、電池續航能力、原料、保質期等等,這說明相比於對產品的整體評分, 使用者往往更關心產品特徵),而且評論文字往往較短。

       本次大賽提供脫敏後的電商評論資料。參賽隊伍需要通過資料探勘的技術和機器學習的演算法,根據語句中的主題特徵和情感資訊來分析使用者對這些主題的偏好,並以<主題,情感詞>序對作為輸出。


GitHub https://github.com/digfound/CCFCompetition



1)O2O 賽題
wepon、天音和charles提供的CCF O2O比賽第一名的全套程式碼和資料:
https://github.com/wepe/O2O-Coupon-Usage-Forecast

2)農產品價格預測賽題
CCF農產品價格預測線上rank2程式碼
https://github.com/xing89qs/CCF_Product

線上第5,決賽答辯逆襲為第1名的團隊
https://github.com/ziminghuang/futuredata-ccf2016

複賽第35名的團隊:
https://github.com/wqlin/ccf-price-prediction

3) 客戶用電異常行為分析
線上第4名的程式碼。這個隊伍非常強悍,只提交很少的幾次,而且最後3天都沒提交,還一直前5名。同時,他們還是搜狗比賽的二等獎。
https://github.com/AbnerYang/2016CCF-StateGrid


本文來自 微信公眾號 datadw  【大資料探勘DT資料分析】


4)搜狗的使用者畫像比賽
線上第3名的TNT_000,同時也是上面客戶用電異常行為分析比賽的二等獎。
https://github.com/AbnerYang/2016CCF-SouGou 

線上第5名的The Right隊伍的程式碼和決賽答辯PPT,而且他們還給出了資料下載地址,大讚。同一個團隊的幾個人分別開源了,連結如下:
https://github.com/dhdsjy/2016_CCFsougou2
https://github.com/dhdsjy/2016_CCFsougou
https://github.com/prozhuchen/2016CCF-sougou
https://github.com/coderSkyChen/2016CCF_BDCI_Sougou

複賽第14名的團隊:
https://github.com/admu/CCF_sougou

5)聯通的使用者軌跡賽題
利用運營商使用者資料,提供網際網路金融領域內的創意資料產品方案https://github.com/xuguanggen/2016CCF-unicom

6)Human or Robot

決賽第6名
https://github.com/pickou/ccf_human_or_robot


人工智慧大資料與深度學習

搜尋新增微信公眾號:weic2c

640?wx_fmt=png

長按圖片,識別二維碼,點關注



大資料探勘DT資料分析

搜尋新增微信公眾號:datadw


教你機器學習,教你資料探勘

640?wx_fmt=jpeg

長按圖片,識別二維碼,點關注



相關文章