大資料入門學習,你要掌握這些技能
將此文獻給對資料有熱情,想長期從事此行業的年輕人,希望對你們有所啟發,並快速調整思路和方向,讓自己的職業生涯有更好的發展。
根據資料應用的不同階段,本文將從資料底層到最後應用,來談談那些資料人的必備技能。
1、大資料平臺
目前很火,資料來源頭,各種炫酷新技術,搭建Hadoop、Hive、Spark、Kylin、Druid、Beam~,前提是你要懂Java,很多平臺都是用Java開發的。
目前很多企業都把資料採集下來了,對於傳統的業務資料,用傳統的資料是完全夠用的,可是對於使用者行為和點選行為這些資料或者很多非結構化的資料,文字、影像和文字類的,由於資料量太大,很多公司都不知道怎麼進行儲存。
網際網路科技發展蓬勃興起,人工智慧時代來臨,抓住下一個風口。為幫助那些往想網際網路方向轉行想學習,卻因為時間不夠,資源不足而放棄的人。我自己整理的一份最新的大資料進階資料和高階開發教程,大資料學習群:199加上【427】最後加上210就可以找到組織學習 歡迎進階中和進想深入大資料的小夥伴加入。
這裡面要解決的是實時、近實時和離線的大資料框架如何搭建,各資料流之間如何耦合和解耦,如何進行容災、平臺穩定、可用是需要重點考慮的。
我的感覺是:最近兩三年中,這塊人才還是很稀缺的,因為大資料概念炒作的這麼厲害,很多企業都被忽悠說,我們也來開始進入大資料行業吧。進入的前提之一就是需要把資料儲存下來,特別是很多使用者行為方面的資料,對於業務的提升比較明顯的,如果你能很好的刻畫使用者,那麼對你的產品設計、市場營銷、開發市場都是有幫助的。現階段,很多公司都要做第一步:儲存更多的資料。這也是這塊人員流動性比較高的原因,都被高薪挖走了。
這塊工作最被吐槽的一點就是:Hive速度好慢,SQL查詢好慢,叢集怎麼又掛掉了,hadoop版本升級後,怎麼資料跑出來不對了等等。
如果想在這塊做的很好,還需要有整個系統架構的設計能力、比較的強的抗壓能力和解決問題的能力、資源收集的能力,可以打入開源社群,這樣就可以隨時follow最新的潮流和技術。
2、資料視覺化
這是個很炫的工作,最好是能懂點前端,比如js。資料視覺化人員需要有很好的分析思維,不能為了炫技而忽視對業務的幫助程度。因為我對這個崗位客串的不多,所以沒有特別深入的感悟,不過我覺得這個崗位需要有分析的能力,才能把視覺化做好。
另外一方面來說,做資料應用的人都應該懂點資料視覺化,要知道觀點表達的素材順序是:圖片>表格>文字,一個能夠用圖片來闡述的機會千萬別用文字來描述,因為這樣更易於讓別人理解。要知道,給大領導講解事情的時候,需要把大領導設想成是個“資料白痴”,這樣才能把一件事情說的比較生動。
3、資料分析師
對於資料分析師的定位:個人認為,成為優秀的資料分析師是非常難的,現在市面上也沒有多少優秀的分析師。資料分析師的技能要求,除了會資料分析、提煉結論、洞察資料背後的原因之外,還需要了解業務,懂演算法。
只有這樣,當面對一個業務問題時,資料分析師們才可以針對問題抽絲剝繭,層層遞進去解決問題,再根據定位的問題進行策略的應對,比如是先做上策略進行測試還是應用演算法進行優化,用演算法用在哪個場景上,能不能用演算法來解決問題。
一個優秀的資料分析師,是個精通業務和演算法的全能資料科學家,不是那個只會聽從業務的需求而進行拉資料、做報表、只做分析的閒雜人等。我們都說分析要給出結論,優秀分析師的結論就是一個能解決問題的一攬子策略和應對措施,同時很多需求是分析師去主動發現並通過資料來挖掘出來的。
從上述描述中,可以看到對資料分析師的要求是:會寫sql拉資料,精通業務、會資料洞察、精通演算法,主動性強,要求還是很高的。
4、資料探勘/演算法
對於這個崗位的技能要求來說,沒有要求你一定要從零開始實現所有的演算法,現在有很多現成的演算法包進行呼叫。最基本的要求是,你要知道每個場景會用到哪個演算法,比如分類場景,常用的分類演算法就有LR/RF/Xgboost/ET等等,此外,你還要知道每個演算法的有效優化引數是什麼、模型效果不好的時候怎麼優化。還需要有演算法的實現能力,語言方面可以用Scala/python/R/Java等。我們常說:工具不重要,重要的是你玩工具,不是工具玩你。
另外針對有監督式學習演算法,演算法工程師最好有很好的業務sense,這樣在feature設計的時候才能更有針對性,設計的feature才有可能有很好的先驗性。
以上說了這麼多,嘮叨了這麼多,其實核心就是:如何用資料創造價值,如果你沒有用資料創造價值的能力,那麼就只能等著被資料淹沒,被資料拍死在職場上,早早到達職業的天花板。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561003/viewspace-2637365/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料入門到精通課程學習,大資料學習,你還得知道這些大資料
- 初學Java,這些框架你要掌握!Java框架
- 大資料入門到精通,想入行大資料需要學習這些知識大資料
- 如何高效學習Linux?這些命令要掌握!Linux
- 這些資訊告訴你為什麼要學大資料?入門教程限時免費領大資料
- 小白學大資料掌握這幾個方法可輕鬆入門大資料
- 學習大資料需要掌握MySQL資料庫的相關技能嗎?大資料MySql資料庫
- 網路安全需要掌握哪些技能?網路安全入門學習
- 大資料學習路線圖 讓你精準掌握大資料技術學習大資料
- 學了Python能做什麼 都需要掌握這些技能Python
- 大資料怎樣入門學習?大資料
- 大資料學習:怎樣進行大資料的入門級學習?大資料
- 大資料學習入門看什麼書?大資料新手怎麼入門?大資料
- 大資料學習方向,知道這些,你就知道你可以做什麼工作了大資料
- 學習大資料,一定要了解大資料的這些用途大資料
- Web前端主要學什麼?這些知識要掌握Web前端
- VX動效如何入門?這裡有一些實用學習資料
- 想進阿里P7,你必須掌握這些技能專題阿里
- 掌握6條技能快速Java入門Java
- 資料分析師要掌握什麼知識和技能?
- 7大分類,40多個關鍵概念,入門機器學習要掌握的概念都在這裡了機器學習
- 大資料學習入門規劃?和學習路線大資料
- 2022年你應該掌握這些機器學習演算法機器學習演算法
- 大資料應用開發如何入門需要知道這些大資料
- PHP從入門到高階你要掌握什麼?PHP
- 大資料測試工程師入門級必備技能,你get了嗎?大資料工程師
- 大資料學習|小白學習大資料需要滿足這六個條件你就能學好大資料大資料
- 大資料學習入門難,給初學者支招大資料
- @程式設計師,請掌握這些核心生存技能程式設計師
- 要成為架構師,你需要掌握這些知識體系!架構
- 想從事資料行業?你必須掌握這個最核心的技能行業
- 學習Linux,這些命令你都掌握了嗎?Linux
- 為什麼要學HTML5大前端?這套教程免費帶你入門HTML前端
- 入門Java要學習的一些基本和高階工具Java
- 入門Python,這些優點你要知道!Python
- Android,你要掌握的一些東西Android
- 大資料學習:零基礎大資料入門該看哪些書?大資料
- 入門UI設計需學習哪些技能?UI