大資料技術學習路線,有信心能堅持學習的朋友,從現在開始吧
如果你看完有信心能堅持學習的話,那就當下開始行動吧!
一、大資料技術基礎
在這裡還是要推薦下我自己建的大資料學習交流群:199427210,群裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料軟體開發相關的),包括我自己整理的一份最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴加入。
1、linux操作基礎
- linux系統簡介與安裝
- linux常用命令–檔案操作
- linux常用命令–使用者管理與許可權
- linux常用命令–系統管理
- linux常用命令–免密登陸配置與網路管理
- linux上常用軟體安裝
- linux本地yum源配置及yum軟體安裝
- linux防火牆配置
- linux高階文字處理命令cut、sed、awk
- linux定時任務crontab
2、shell程式設計
- shell程式設計–基本語法
- shell程式設計–流程控制
- shell程式設計–函式
- shell程式設計–綜合案例–自動化部署指令碼
3、記憶體資料庫redis
- redis和nosql簡介
- redis客戶端連線
- redis的string型別資料結構操作及應用-物件快取
- redis的list型別資料結構操作及應用案例-任務排程佇列
- redis的hash及set資料結構操作及應用案例-購物車
- redis的sortedset資料結構操作及應用案例-排行榜
4、布式協調服務zookeeper
- zookeeper簡介及應用場景
- zookeeper叢集安裝部署
- zookeeper的資料節點與命令列操作
- zookeeper的java客戶端基本操作及事件監聽
- zookeeper核心機制及資料節點
- zookeeper應用案例–分散式共享資源鎖
- zookeeper應用案例–伺服器上下線動態感知
- zookeeper的資料一致性原理及leader選舉機制
5、java高階特性增強
- Java多執行緒基本知識
- Java同步關鍵詞詳解
- java併發包執行緒池及在開源軟體中的應用
- Java併發包訊息隊裡及在開源軟體中的應用
- Java JMS技術
- Java動態代理反射
6、輕量級RPC框架開發
- RPC原理學習
- Nio原理學習
- Netty常用API學習
- 輕量級RPC框架需求分析及原理分析
- 輕量級RPC框架開發
二、離線計算系統
1、hadoop快速入門
- hadoop背景介紹
- 分散式系統概述
- 離線資料分析流程介紹
- 叢集搭建
- 叢集使用初步
2、HDFS增強
- HDFS的概念和特性
- HDFS的shell(命令列客戶端)操作
- HDFS的工作機制
- NAMENODE的工作機制
- java的api操作
- 案例1:開發shell採集指令碼
3、MAPREDUCE詳解
- 自定義hadoop的RPC框架
- Mapreduce程式設計規範及示例編寫
- Mapreduce程式執行模式及debug方法
- mapreduce程式執行模式的內在機理
- mapreduce運算框架的主體工作流程
- 自定義物件的序列化方法
- MapReduce程式設計案例
4、MAPREDUCE增強
- Mapreduce排序
- 自定義partitioner
- Mapreduce的combiner
- mapreduce工作機制詳解
5、MAPREDUCE實戰
- maptask並行度機制-檔案切片
- maptask並行度設定
- 倒排索引
- 共同好友
6、federation介紹和hive使用
- Hadoop的HA機制
- HA叢集的安裝部署
- 叢集運維測試之Datanode動態上下線
- 叢集運維測試之Namenode狀態切換管理
- 叢集運維測試之資料塊的balance
- HA下HDFS-API變化
- hive簡介
- hive架構
- hive安裝部署
- hvie初使用
7、hive增強和flume介紹
- HQL-DDL基本語法
- HQL-DML基本語法
- HIVE的join
- HIVE 引數配置
- HIVE 自定義函式和Transform
- HIVE 執行HQL的例項分析
- HIVE最佳實踐注意點
- HIVE優化策略
- HIVE實戰案例
- Flume介紹
- Flume的安裝部署
- 案例:採集目錄到HDFS
- 案例:採集檔案到HDFS
三、流式計算
1、Storm從入門到精通
- Storm是什麼
- Storm架構分析
- Storm架構分析
- Storm程式設計模型、Tuple原始碼、併發度分析
- Storm WordCount案例及常用Api分析
- Storm叢集部署實戰
- Storm+Kafka+Redis業務指標計算
- Storm原始碼下載編譯
- Strom叢集啟動及原始碼分析
- Storm任務提交及原始碼分析
- Storm資料傳送流程分析
- Storm通訊機制分析
- Storm訊息容錯機制及原始碼分析
- Storm多stream專案分析
- 編寫自己的流式任務執行框架
2、Storm上下游及架構整合
- 訊息佇列是什麼
- Kakfa核心元件
- Kafka叢集部署實戰及常用命令
- Kafka配置檔案梳理
- Kakfa JavaApi學習
- Kafka檔案儲存機制分析
- Redis基礎及單機環境部署
- Redis資料結構及典型案例
- Flume快速入門
- Flume+Kafka+Storm+Redis整合
四、記憶體計算體系Spark
1、scala程式設計
- scala程式設計介紹
- scala相關軟體安裝
- scala基礎語法
- scala方法和函式
- scala函數語言程式設計特點
- scala陣列和集合
- scala程式設計練習(單機版WordCount)
- scala物件導向
- scala模式匹配
- actor程式設計介紹
- option和偏函式
- 實戰:actor的併發WordCount
- 柯里化
- 隱式轉換
2、AKKA與RPC
- Akka併發程式設計框架
- 實戰:RPC程式設計實戰
3、Spark快速入門
- spark介紹
- spark環境搭建
- RDD簡介
- RDD的轉換和動作
- 實戰:RDD綜合練習
- RDD高階運算元
- 自定義Partitioner
- 實戰:網站訪問次數
- 廣播變數
- 實戰:根據IP計算歸屬地
- 自定義排序
- 利用JDBC RDD實現資料匯入匯出
- WorldCount執行流程詳解
4、RDD詳解
- RDD依賴關係
- RDD快取機制
- RDD的Checkpoint檢查點機制
- Spark任務執行過程分析
- RDD的Stage劃分
5、Spark-Sql應用
- Spark-SQL
- Spark結合Hive
- DataFrame
- 實戰:Spark-SQL和DataFrame案例
6、SparkStreaming應用實戰
- Spark-Streaming簡介
- Spark-Streaming程式設計
- 實戰:StageFulWordCount
- Flume結合Spark Streaming
- Kafka結合Spark Streaming
- 視窗函式
- ELK技術棧介紹
- ElasticSearch安裝和使用
- Storm架構分析
- Storm程式設計模型、Tuple原始碼、併發度分析
- Storm WordCount案例及常用Api分析
7、Spark核心原始碼解析
- Spark原始碼編譯
- Spark遠端debug
- Spark任務提交行流程原始碼分析
- Spark通訊流程原始碼分析
- SparkContext建立過程原始碼分析
- DriverActor和ClientActor通訊過程原始碼分析
- Worker啟動Executor過程原始碼分析
- Executor向DriverActor註冊過程原始碼分析
- Executor向Driver註冊過程原始碼分析
- DAGScheduler和TaskScheduler原始碼分析
- Shuffle過程原始碼分析
- Task執行過程原始碼分析
五、機器學習演算法
1、python及numpy庫
- 機器學習簡介
- 機器學習與python
- python語言–快速入門
- python語言–資料型別詳解
- python語言–流程控制語句
- python語言–函式使用
- python語言–模組和包
- phthon語言–物件導向
- python機器學習演算法庫–numpy
- 機器學習必備數學知識–概率論
2、常用演算法實現
- knn分類演算法–演算法原理
- knn分類演算法–程式碼實現
- knn分類演算法–手寫字識別案例
- lineage迴歸分類演算法–演算法原理
- lineage迴歸分類演算法–演算法實現及demo
- 樸素貝葉斯分類演算法–演算法原理
- 樸素貝葉斯分類演算法–演算法實現
- 樸素貝葉斯分類演算法–垃圾郵件識別應用案例
- kmeans聚類演算法–演算法原理
- kmeans聚類演算法–演算法實現
- kmeans聚類演算法–地理位置聚類應用
- 決策樹分類演算法–演算法原理
- 決策樹分類演算法–演算法實現
在不久的將來,大資料一定會徹底走入我們的生活,有興趣入行未來前沿產業的朋友,大資料、雲端計算和物聯網的入門知識和資訊資訊,讓我們一起攜手,引領人工智慧的未來
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561003/viewspace-2644231/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 從零開始學習的朋友應該如何學習Linux技術?Linux
- 大資料學習路線(自己制定,從零開始)大資料
- 大資料學習路線圖 讓你精準掌握大資料技術學習大資料
- AI 學習路線:從Python開始機器學習AIPython機器學習
- 寫給大資料初學者,從零開始學習大資料開發的完整路線大資料
- 女生能學網路安全技術嗎?網路安全技術學習路線
- 大資料學習路線大資料
- 10個最熱門的大資料技術,附上大資料學習路線大資料
- 小白如何學習大資料開發,大資料學習路線是怎樣的?大資料
- 大資料開發技術學習方向大資料
- 從現在開始,試著學會用官方文件去學習一個技術框架框架
- VUE2.0從零開始 學習路線Vue
- 大資料學習路線圖大資料
- 大資料最佳學習路線大資料
- 從Python開始——圖靈圖書學習路線Python圖靈
- 學習大資料需要掌握的知識,需要學習的資料技術大資料
- java轉大資料的學習路線Java大資料
- 2018大資料學習路線從入門到精通大資料
- 大資料經典學習路線大資料
- 大資料學習入門規劃?和學習路線大資料
- Java技術相關學習路線,學習Java後薪資如何?Java
- 大資料學習方法,學大資料需要的基礎和路線大資料
- 從0開始學習大資料探勘分析,新手應該這樣學習大資料分析才靠譜大資料
- 大資料學習路線分享Master的jps大資料AST
- 全新版最新大資料學習路線+資料教你從零做起大資料
- 2018最新大資料學習路線從入門到精通大資料
- 從零開始學習機器學習機器學習
- 技術大牛分享:JAVA學習路線Java
- 大資料經典學習路線,必看!!大資料
- 大資料工程師-學習路線-轉大資料工程師
- 2019最新大資料學習路線圖大資料
- 大資料學習開發技術:MapReduce執行原理大資料
- 學大資料需要掌握的知識,需要學習的資料技術大資料
- 學技術,從性趣開始
- 學習大資料要從哪些知識點開始著手?大資料
- Java程式設計中,有哪些好的習慣從一開始就值得堅持?Java程式設計
- 想自學大資料開發 鄭州大資料學習路線是什麼大資料
- 資料科學、資料工程學習路線資料科學