大資料學習—Azkaban的解析
大資料的核心模組有很多,像 Hadoop 、 spark 、 kafka 等都是比較重要的,但也不僅僅只是這三塊。今天我們就來了解一下 Azkaban ,瞭解他的使用和簡介,才能更好的幫助我們去學習大資料。
Azkaban 是什麼 ?
是由 Linkedin 開源的一個批量工作流任務排程器。用於在一個工作流內以一個特定的順序執行一組工作和流程。
Azkaban 定義了一種 KV 檔案 (properties) 格式來建立任務之間的依賴關係,並提供一個易於使用的 web 使用者介面維護和跟蹤你的工作流。
它有如下功能特點:
Web 使用者介面
方便上傳工作流
認證 / 授權 ( 許可權的工作 )
能夠殺死並重新啟動工作流
模組化和可插拔的外掛機制
工作流和任務的日誌記錄和審計
方便設定任務之間的關係
排程工作流
專案工作區
為什麼需要 Azkaban ?
一個完整的資料分析系統通常都是由大量任務單元組成
shell 指令碼程式
java 程式
mapreduce 程式
hive 指令碼等
各任務單元之間存在時間先後及前後依賴關係 , 為了很好地組織起這樣的複雜執行計劃, 需要一個工作流排程系統來排程執行;
例如,我們可能有這樣一個需求,某個業務系統每天產生 20G 原始資料,我們每天都要對 其進行處理,處理步驟如下所示:
通過 Hadoop 先將原始資料同步到 HDFS 上;
藉助 MapReduce 計算框架對原始資料進行轉換,生成的資料以分割槽表的形式儲存到 多張 Hive 表中;
需要對 Hive 中多個表的資料進行 JOIN 處理,得到一個明細資料 Hive 大表;
將明細資料進行各種統計分析,得到結果報表資訊;
需要將統計分析得到的結果資料同步到業務系統中,供業務呼叫使用。
以上就是關於 Azkaban 的解析了, 如果想了解更多詳情,請點選成都加米穀大資料官網咖!成都大資料培訓學校、大資料開發培訓、資料分析與挖掘,零基礎班本月正在招生中,課程大綱及試學視訊可免費獲取!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70005624/viewspace-2808945/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料技術 - Azkaban大資料
- 大資料學習資料大資料
- 想學習大資料?這才是完整的大資料學習體系大資料
- 大資料學習大資料
- 大資料的系統學習:大資料學習的三個階段概述大資料
- 大資料學習:怎樣進行大資料的入門級學習?大資料
- 大資料如何學習,大資料工程師學習經驗分享大資料工程師
- 分享學習大資料的方法大資料
- 大資料學習大綱,大資料應該怎麼學大資料
- 大資料學習:物件大資料物件
- 大資料學習02大資料
- 小白如何學習大資料開發,大資料學習路線是怎樣的?大資料
- 為什麼學習大資料,大資料專家寫給大資料分析學習者的10個理由大資料
- 學習大資料需要掌握的知識,需要學習的資料技術大資料
- 大資料學習方法,學大資料需要的基礎和路線大資料
- 大資料學習目錄大資料
- 大資料學習:閉包大資料
- 大資料學習:抽象類大資料抽象
- 機器學習 大資料機器學習大資料
- 大資料學習路線大資料
- 解析機器學習中的資料漂移問題機器學習
- 大資料學習|小白學習大資料需要滿足這六個條件你就能學好大資料大資料
- 學大資料需要掌握的知識,需要學習的資料技術大資料
- java轉大資料的學習路線Java大資料
- 大資料學習,涉及的知識點大資料
- 大資料學習資源之DataCamp大資料
- 大資料學習路線圖 讓你精準掌握大資料技術學習大資料
- 學習資料科學的五大免費資源資料科學
- 大資料概念:史上最全大資料解析大資料
- 學習大資料,一定要了解大資料的這些用途大資料
- 大資料學習之Hadoop如何高效處理大資料大資料Hadoop
- 究竟多大才算是大資料,大資料怎麼學習?大資料
- 淺析大資料 學習大資料後能做什麼大資料
- 一起來學大資料——走進Linux之門,學習大資料的重中之重大資料Linux
- 解析大資料json大資料JSON
- 大資料學習注意事項大資料
- 大資料學習路線圖大資料
- 大資料最佳學習路線大資料