CDA學員參加首屆阿里雲安全演算法挑戰賽獲季軍

weixin_33751566發表於2016-11-02

CDA學員參加首屆阿里雲安全演算法挑戰賽獲季軍!關於這場比賽,聽聽他怎麼說
http://mp.weixin.qq.com/s?src=3&timestamp=1478061782&ver=1&signature=shSaGeZCGbmwLetTeH27R4633gyhBqFnxbkiws1qLPR9SnylROWyLTNw6cKIPebu2Zl-9gw0EnqYqtqNKn-FMcVLaMr6roTTD-2AOflZC-OA6hw8ouWayr2PTvpq2ouZnEakguZ554d*GSNjTWj1FkGqbqRH0qEXRk2grMROEfE=

前不久,首屆阿里雲安全演算法挑戰賽圓滿結束,頒獎盛典在高大上的雲棲大會上舉行。除了數不過來的大咖,這些年輕的面孔可能是今年雲棲大會上最吸引人的風景了。


2569324-8ad3d926484483a1

就是在這張合影中,小編發現了一位老朋友。他就是CDA1級、2級第十期的學員張卓然同學

2569324-1feeee0768d6c4b9

張卓然(左一)與其他選手在參賽現場

經過線上選拔賽和24小時極限挑戰賽環節,張卓然與他的隊友在首屆阿里雲安全演算法挑戰賽中榮獲季軍。撒花撒花~

2569324-87326f86a01d89a4.png

作為國內首個以“安全”為主題的演算法賽事,阿里雲安全演算法挑戰賽吸引了來自全球的940支賽隊,1125位選手參與報名。本屆線上選拔賽賽題包括《釣魚網站檢測》和《WebShell通訊檢測》,24小時極限挑戰賽的賽題為《入侵檢測》,決賽總資料量超過10億條。比賽的資料處理全部基於阿里雲的“天池”大資料眾智平臺。
講真,小編得知張卓然獲獎的訊息可能比他本人還激動。畢竟,總算有一個小編認識的人去參加雲棲大會啦!<( ̄︶ ̄)>
隨後,小編聯絡到了張卓然,分享了一些他的學習心得。收錄在此,也許對你有所幫助。(話說,你們做資料分析師的回答問題都這麼酷嗎╮(╯▽╰)╭)


快問快答
問:你為什麼想要參加這次比賽?

張卓然:其實主要為了讓你去檢驗自己的。畢竟書本上講的再好,不去用一用,又如何知道效果如何?比賽還可以讓你明白你學的到底怎麼樣。
問:你覺得自己通過這次比賽有什麼收穫?

張卓然:趕緊滾回去看書吧。大神太多,我只能仰望。其實,比賽適合用於你自己的學習檢驗,否則光看書,覺得啥都懂,真去比賽了,發現到處都是坑。
問:能否介紹一下您的學習資料分析的經歷?

張卓然:畢業院校沒啥名氣,就不說了。本科是通訊工程,雖然與資料有一些關係,但是關係不大。我是2015年開始學習資料分析的。當時只是想轉行,而且對資料探勘比較有興趣。
問:在學習資料分析的過程中,讓您收益最大的是什麼?遇到過哪些坑嗎?

張卓然:先從基本的基礎開始學,不建議像在學校裡面那樣死磕統計理論,只要懂原理就行了。剛學的時候,不建議非要會自己手動推導甚至自己寫程式碼實現模型包。畢竟大部分的都有模型包。後期熟練了,可以再自己上手。這樣做可以縮短學習時間,降低學習成本。
至於工具,SQL肯定要會用。SAS、R、Python,先挑一個你看的順眼的,反正你以後肯定這幾個常用軟體,你都會自己去學的。我目前在電信行業很多時候也就是SQL取數,有些時候做做預測。電信這個行業內資料探勘還沒有做的太深入,很多都是描述性統計。
很多人以為高階模型能帶來很牛逼的效果。不過對於商業資料的資料分析來說,模型不是決定性因素,主要依靠資料預處理和特徵工程
實際上,新手上路,先從規則玩起,比如均值處理等。等你規則玩熟練了,再玩模型。一個模型做的好的老手,規則一樣玩的溜。規則是考慮一些主要因素的簡單模型的加權,需要人手動去構建,實際上是考驗你的資料理解能力和資料直覺。模型只不過在這個基礎上,增加了一些弱相關性的因素。
通常來說,簡單模型的融合效果要遠遠好於單一的高階模型。同樣,規則玩的好,也可以取得很好的效果。
問:請給小夥伴們推薦幾本好用的書吧

張卓然:李航《統計學習方法》和周志華《機器學習》。

相關文章