學大資料,你的職業是如何規劃的?
作為IT類職業中的“大熊貓”,大資料人才(資料工程師,資料分析師,資料探勘師,演算法工程師等)、在國內人才市場可謂是一顆閃耀的新星。由於剛剛出於萌芽階段,這個領域出現很大的人才缺口。
1 大資料人才做什麼?
2 需要具備的能力
2.1 精通SQL
2.2 資料模型技能
2.3 ETL設計
2.4 架構專案
3 知識體系
機器學習基礎
機器學習工具
3.1 大資料通用處理平臺
3.2 分散式儲存
3.3 資源排程
3.4 機器學習工具
3.5 資料分析/資料倉儲(SQL類)
3.6 訊息佇列
3.7 流式計算
3.8 日誌收集
3.9 程式語言
3.10 資料分析挖掘
3.11 資料視覺化
3.12 機器學習
4 大資料人才的職業發展
4.1 薪酬待遇
4.2 職業發展路徑
1 大資料人才做什麼?
大資料是眼下非常時髦的技術名詞,與此同時自然也催生出了一些與大資料處理相關的職業,透過對資料的挖掘分析來影響企業的商業決策。大資料工程師就是一群“玩資料”的人,玩出資料的商業價值,讓資料變成生產力。大資料和傳統資料的最大區別在於,它是線上的、實時的,規模海量且形式不規整,無章法可循,因此“會玩”這些資料的人就很重要。
【大資料開發學習資料領取方式】:加入大資料技術學習交流群458345782,點選加入群聊,私信管理員即可免費領取
因此,分析歷史、預測未來、最佳化選擇,這是大資料人才在“玩資料”時最重要的三大任務。透過這三個工作方向,他們幫助企業做出更好的商業決策,找出最最佳化的結果。
2 需要具備的能力
2.1 精通SQL
如果英語是業務的交流工具,那麼SQL就是資料的交流工具。一個不會流利的英語的業務人員能有多大的成就?不管任何技術時代的產生和更替,SQL一直是資料的通用語。資料工程師應該有能用SQL表達任何‘相關子查詢’和視窗函式複雜度的技術能力。對資料工程師來說初始SQL/DML/DDL簡單到根本沒有難度。即使是沒有接觸過SQL的人,他也能讀懂並明白資料庫的執行計劃,瞭解所有步驟,知道程式怎麼被呼叫,連線演算法的不同和執行計劃內的分散式維度。
2.2 資料模型技能
作為一個資料工程師,有對實體-關係模型的認知反射,規範化的清晰認識,權衡反規範化的敏銳直覺。資料工程師應該熟悉維度建模及相關概念與術語。
2.3 ETL設計
能夠寫出有效率、有彈性的、“可發展”的ETL任務是一個關鍵。
2.4 架構專案
就如任何一個領域的專家的專業技能一樣,資料工程師需要一個較高層次的綜括,對大多數的工具,平臺,庫,和其他供他支配的資源的瞭解。認識到不同型別的資料庫、計算引擎、流處理器、訊息佇列、工作流協調器、序列化格式及其他相關技術的屬性、用例、微妙之處。在設計解決方案的時候,他應該有能力選擇即將要使用的技術,並有一個構想去協調怎麼使他們一起更好地工作。
3 知識體系
3.1 大資料通用處理平臺
Spark
Flink
Hadoop
3.2 分散式儲存
HDFS
3.3 資源排程
Yarn
Mesos
3.4 機器學習工具
Mahout
Spark Mlib
TensorFlow (Google 系)
Amazon Machine Learning
DMTK (微軟分散式機器學習工具)
3.5 資料分析/資料倉儲(SQL類)
Pig
Hive
kylin
Spark SQL,
Spark DataFrame
Impala
Phoenix
ELK
ElasticSearch
Logstash
Kibana
3.6 訊息佇列
Kafka(純日誌類,大吞吐量)
RocketMQ
ZeroMQ
ActiveMQ
RabbitMQ
3.7 流式計算
Storm/JStorm
Spark Streaming
Flink
3.8 日誌收集
Scribe
Flume
3.9 程式語言
Java
Python
R
Ruby
Scala
3.10 資料分析挖掘
MATLAB
SPSS
SAS
3.11 資料視覺化
R
D3.js
ECharts
Excle
Python
3.12 機器學習
機器學習基礎
聚類
時間序列
推薦系統
迴歸分析
文字挖掘
決策樹
支援向量機
貝葉斯分類
神經網路
深度學習
機器學習工具
Mahout
Spark Mlib
TensorFlow (Google 系)
Amazon Machine Learning
DMTK (微軟分散式機器學習工具)
4 大資料人才的職業發展
4.1 薪酬待遇
作為IT類職業中的“大熊貓”,大資料人才的收入待遇可以說達到了同類的頂級。國內IT、通訊、行業招聘中,有10%都是和大資料相關的,且比例還在上升。在美國,大資料工程師平均每年薪酬高達17.5萬美元,而據瞭解,在國內頂尖網際網路類公司,同一個級別大資料工程師的薪酬可能要比其他職位高20%至30%,且頗受企業重視。
4.2 職業發展路徑
由於大資料人才數量較少,因此大多數公司的資料部門一般都是扁平化的層級模式,大致分為資料分析師、資深研究員、部門總監3個級別。大公司可能按照應用領域的維度來劃分不同團隊,而在小公司則需要身兼數職。有些特別強調大資料戰略的網際網路公司則會另設最高職位—如阿里巴巴的首席資料官。這個職位的大部分人會往研究方向發展,成為重要資料戰略人才。另一方面,大資料工程師對商業和產品的理解,並不亞於業務部門員工,因此也可轉向產品部或市場部,乃至上升為公司的高階管理層。
【大資料開發學習資料領取方式】:加入大資料技術學習交流群458345782,點選加入群聊,私信管理員即可免費領取
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69903766/viewspace-2644293/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- IT職場,你如何規劃的更好?
- 作為IT從業者,你是如何做好個人職業規劃?
- 解析 :躋身資料科學領域的五條職業規劃道路資料科學
- 給自己的職業規劃
- 運維工程師的職業規劃是什麼?Linux運維工程師Linux
- 你是如何規劃響應式佈局的?
- IT人的職業素養與規劃
- 程式設計師的職業規劃!程式設計師
- 大資料工程師的職業發展前景如何?大資料工程師
- 職業規劃PPT模板
- 如何應用MBTI職業性格測試來做職業規劃
- Python的市場需求及職業規劃Python
- 如何根據自己的職業規劃提升和打破自己的瓶頸?
- 程式設計師如何規劃職業路線?程式設計師
- Web前端工程師職業規劃如何做?Web前端工程師
- 資料科學職業需要的三種職業技能資料科學
- 程式生涯職業規劃求助!
- 軟體測試工程師的職業規劃工程師
- 指路大資料 學大資料可以從事什麼職業大資料
- 速覽!關於網路安全專業學生的未來職業規劃!
- 大資料就業方向中,主要劃分為哪些職位?大資料就業
- 【職業規劃】該如何選擇職業方向?效能?自動化?測開?學習選擇python、java?PythonJava
- 大資料學習入門規劃?和學習路線大資料
- 學Java的,想嘗試轉行大資料和資料探勘,該怎麼規劃學習?Java大資料
- 萬字長文——資訊保安職業生涯規劃
- 資料科學工作需要的十大職業技能列表資料科學
- 程式設計師職業規劃:30歲後如何實現質的突破!程式設計師
- 職場規劃
- 小白如何學習大資料開發,大資料學習路線是怎樣的?大資料
- 震驚,零開始規劃大資料學習之路!大資料
- 寫給前端應屆生的職業規劃建議前端
- 一個資料分析師的職業規劃:人生本來就應該提前做好準備
- 阿里Java程式設計師分享自己的職業規劃,希望對你有所啟發阿里Java程式設計師
- 10年+軟體測試工程師帶你規劃職業道路工程師
- 軟體架構師如何規劃自己的職業?四個方面來踐行!架構
- 初級Java程式設計師職業規劃如何選擇Java程式設計師
- 資料科學50年,資料科學家是否依然是21世紀最性感的職業?資料科學
- 如何使用SAP HANA Vora規劃HANA大資料戰略?LH大資料