你想快速成為大資料工程師?

金羅老師發表於2019-03-25

學習  大資料沒有零基礎入門,首先你要成為一名工程師


在這裡還是要推薦下我自己建的大資料學習交流群:199427210,群裡都是學大資料開發的,如果你正在學習  大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料軟體開發相關的),包括我自己整理的一份最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴加入。


JavaEE,主要運用於企業級運用開發;安卓開發方向;嵌入式運用開發方向。 在此建議大家選擇JavaEE方向,由於運用非常普遍,崗位設定也比較多。


Java的職業展開規劃之路我們也曾在(一文闡述Java從初級到初級的學習之路——


)詳細羅列,這裡就不逐一羅列了。





但我們歷來沒有討論過學習Java,難道這輩子就只能做Java後端開發嗎?只能在這條路上妥協終究嗎?難道中途沒有其他的選擇嗎?


偶然看法的一個冤家,最末尾是從事Java後端開發的,後來他在專業時間自學成功轉入大資料行業,如今是一名大資料工程師,待遇也比之前好更多。前提是他是一名Java後端開發。


大資料是我們如今比較火的一個展開方向,但是很多培訓機構有提到速成的,小編覺得不是特別靠譜。


緣由有以下:


大資料是一個重生行業,還不太成熟。


Java展開了將近20年,也沒有說幾個月速成的,最多也就是帶你入門,讓你對Java的知識結構體系有一個明晰的認知,在後期的義務實際時期生長的速度更快。


大資料的起點要高,並不是所謂的零基礎就可以入門的。



我們接上去講述的有關大資料的學習是有條件限制的,首先你需求是一名普通的工程師,假設你是Java工程師的話更好,但假設你是小白的話,那就只能成為一名工程師的後再來學習大資料吧。


一、看法大資料


大資料本質其實也是資料,不過也包括了些新的特徵,


資料來源廣;


資料格式多樣化(結構化資料、非結構化資料、Excel檔案等);


資料量大(最少也是TB級別的、甚至可以是PB級別);


資料增長速度快。


而針對以上新的特徵需求思索很多成果:


例如,資料來源廣,該如何採集彙總?採集彙總之後,又該儲存呢?資料儲存之後,該如何經過運算轉化本錢人想要的結果呢?


關於這些成果,我們需求有相對應的知識處置。


二、大資料所需技藝要求


Python言語:編寫一些指令碼時會用到。


Scala言語:編寫Spark順序的最佳言語,當然也可以選擇用Python。


Ozzie,azkaban:定時義務排程的工具。


Hue,Zepplin:圖形化義務執行管理,結果反省工具。


Allluxio,Kylin等:經過對儲存的資料中止預處置,加快運算速度的工具。



必需掌握的技藝:


Java初級(虛擬機器、併發)、Linux 基本操作、Hadoop(HDFS+MapReduce+Yarn )、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理理解)、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ) 、輔佐小工具(Sqoop/Flume/Oozie/Hue等)


高階技藝6條:


機器學習演算法以及mahout庫加MLlib、 R言語、Lambda 架構、Kappa架構、Kylin、Alluxio


三、學習規劃


每天需求有3個小時的學習時間,週末的時分需求10小時,假設做不到的話,只能是


第一階段(基礎階段)


Linux學習


Linux作業系統引見與安裝、Linux常用命令、Linux常用軟體安裝、Linux網路、 防火牆、Shell程式設計等。


Java 初級學習(《深化理解Java虛擬機器》、《Java高併發實戰》)


掌握多執行緒、掌握併發包下的佇列、掌握JVM技術、掌握反射和靜態代理、瞭解JMS。


Zookeeper學習


Zookeeper分散式協調效力引見、Zookeeper叢集的安裝部署、Zookeeper資料結構、命令。


第二階段(攻堅階段)


Hadoop、Hive、HBase、Scala、Spark、Python


第三階段(輔佐工具工學習階段)


Sqoop、Flume、Oozie、Hue






總結


在技術行業裡面,每天都會有新的東西出現,需求關注最新技術靜態,不時學習。任何普通技術都是先學習實踐,然後在實際中不時完善實踐的程式。


假設你覺得自己看書效率太慢,你可以網上搜集一些課程。


快速學習的才幹、處置成果的才幹、溝通才幹在這個行業是真的非常重要的目的。


要擅長運用StackOverFlow和Google來幫助你學習程式遇到的成果。


以上是我們對大資料學習的總結,當然我們也提到了,並不是說零基礎的就可以直接學習,需求有程式設計的基礎,要先掌握紮實的程式設計基礎,在此建議學習Java,成為一名工程師的時分,有一定程式設計閱歷,自學起來也相對比末尾要複雜一點,然後對大資料有興味或許想要進入這個行業的就可以去學習了



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561003/viewspace-2639283/,如需轉載,請註明出處,否則將追究法律責任。

相關文章