從0開始學大資料-李智慧-極客時間

wuwu發表於2019-04-26

極客時間出品的《從0開始學大資料》由李智慧所作,李智慧是同程藝龍交通首席架構師,前Intel大資料架構師,《大型網站技術架構》作者。本專欄課程講智慧時代你的大資料第一課。

從0開始學大資料 封面圖

《從0開始學大資料》課程背景

隨著近些年大資料技術的發展,以Hadoop、Spark為代表的大資料開源專案早已迭代成熟,構建起生態化系統。與此對應,不論是開發者還是企業,關注點也已經從技術的演進轉向如何更好地應用大資料,去支撐業務和雲端計算、人工智慧的深度融合。在這個智慧的時代,不論是否從事大資料開發,掌握大資料的原理和架構也早已成為每個工程師的必備技能。

但是,不論是大資料的技術還是應用,都始終處於動態變化的過程中。對於很多剛開始接觸大資料、考慮使用大資料的人來說,這無疑帶來了很多困惑。天天聽別人講大資料,自己也看了不少資料,卻不得要領,看不到完整的大資料知識輪廓。

即使工作和大資料相關,但仍不清楚大資料平臺究竟是如何運作的。

領導讓我搭建一套大資料平臺,而我卻是一頭霧水,不知從何處入手。

如果你也有這樣的困惑,不要著急。其實在很大程度上這是大資料知識體系的繁雜造成的,沒有專家的明晰指導,多數人都很難真正做到入門,並且通過構建知識體系達到融會貫通。

《從0開始學大資料》講師介紹

李智慧,同程藝龍交通首席架構師、Apache Spark程式碼貢獻者,長期從事大資料、大型網站架構的研發工作,曾擔任阿里巴巴技術專家、Intel亞太研發中心架構師、宅米和WiFi萬能鑰匙CTO,有超過6年的線下諮詢、培訓經驗,著有暢銷書《大型網站技術架構:核心原理與案例分析》。

在這個專欄裡,李智慧將結合自己多年大資料開發、應用的經驗,幫助你構建一套立體化的知識體系,並從不同視角、不同領域帶你找到你在大資料領域的突破口,真正從普通開發者晉升為擁有大資料思維並能解決複雜問題的技術專家。

《從0開始學大資料》專欄模組

一套完整的大資料知識體系,將包含6個模組。

模組一 Hadoop大資料原理與架構

為什麼講大資料都要從Hadoop開始?大資料的問題和挑戰不同以往,它的處理方法與技巧也頗有不同。理解大資料面對的問題以及處理技巧,是構建大資料知識體系的源頭。理解大資料,從理解Hadoop開始。

模組二 大資料生態體系主要產品原理與架構

大資料領域不只有Hadoop,還有資料倉儲Hive、NoSQL系統HBase、計算引擎Spark、流計算引擎Storm、Flink,以及分散式一致性解決方案ZooKeeper等,它們構成了一個完整的大資料生態體系,解決各種場景下的不同問題。

模組三 大資料開發實踐

本模組以大資料開發者的視角重新審視大資料的各個方面,結合作者在阿里巴巴、Intel從事大資料開發的實踐經歷,從“局內人”的視角為你揭祕大資料開發的內裡乾坤。

模組四 大資料平臺與系統整合

大資料從哪裡來?算出來的結果又到哪裡去?如何將大資料技術整合到當前系統中去?需不需要自己開發?有沒有商業的解決方案?這可能是使用大資料時最迫切需要解決的問題。

模組五 大資料分析與運營

資料分析是大資料應用的一個重要場景,網際網路企業運營常用的資料分析指標有哪些?如何呈現?資料分析結果異常了,企業關鍵績效指標下滑了,該如何去追蹤定位其原因?這些應用場景和問題答案都可以在本模組中找到。

模組六 大資料演算法

大資料最激動人心的應用還是大資料機器學習,但大資料機器學習演算法是不是真的有那麼難?數學不好還能不能學好、用好大資料演算法呢?這個模組告訴你,其實大資料演算法並不難,原理一樣很簡單。

《從0開始學大資料》課程目錄

開篇詞 | 為什麼說每個軟體工程師都應該懂大資料技術?

預習 01 | 大資料技術發展史:大資料的前世今生

預習 02 | 大資料應用發展史:從搜尋引擎到人工智慧

預習 03 | 大資料應用領域:資料驅動一切

04 | 移動計算比移動資料更划算

05 | 從RAID看垂直伸縮到水平伸縮的演化

06 | 新技術層出不窮,HDFS依然是儲存的王者

07 | 為什麼說MapReduce既是程式設計模型又是計算框架?

08 | MapReduce如何讓資料完成一次旅行?

09 | 為什麼我們管Yarn叫作資源排程框架?

10 | 模組答疑:我們能從Hadoop學到什麼?

11 | Hive是如何讓MapReduce實現SQL操作的?

12 | 我們並沒有覺得MapReduce速度慢,直到Spark出現

13 | 同樣的本質,為何Spark可以更高效?

14 | BigTable的開源實現:HBase

15 | 流式計算的代表:Storm、Flink、Spark Streaming

16 | ZooKeeper是如何保證資料一致性的?

17 | 模組答疑:這麼多技術,到底都能用在什麼場景裡?

18 | 如何自己開發一個大資料SQL引擎?

19 | Spark的效能優化案例分析(上)

20 | Spark的效能優化案例分析(下)

21 | 從阿里內部產品看海量資料處理系統的設計(上):Doris的立項

22 | 從阿里內部產品看海量資料處理系統的設計(下):架構與創新

23 | 大資料基準測試可以帶來什麼好處?

24 | 從大資料效能測試工具Dew看如何快速開發大資料系統

25 | 模組答疑:我能從大廠的大資料開發實踐中學到什麼?

26 | 網際網路產品 + 大資料產品 = 大資料平臺

27 | 大資料從哪裡來?

28 | 知名大廠如何搭建大資料平臺?

29 | 盤點可供中小企業參考的商業大資料平臺

30 | 當大資料遇上物聯網

31 | 模組答疑:為什麼大資料平臺至關重要?

32 | 網際網路運營資料指標與視覺化監控

33 | 一個電商網站訂單下降的資料分析案例

34 | A/B測試與灰度釋出必知必會

35 | 如何利用大資料成為“增長黑客”?

36 | 模組答疑:為什麼說資料驅動運營?

37 | 如何對資料進行分類和預測?

38 | 如何發掘資料之間的關係?

39 | 如何預測使用者的喜好?

40 | 機器學習的數學原理是什麼?

41 | 從感知機到神經網路演算法

42 | 模組答疑:軟體工程師如何進入人工智慧領域?

結束語 | 未來的你,有無限可能

訂閱價格:

為回報猿人學的粉絲,所有通過我分享的二維碼購買的使用者,請加我微訊號:dismissmewp,備註:返現。

享受完其它優惠後,我再給大家立即返¥12元現金。

從0開始學大資料 課程返現

猿人學banner宣傳圖

我的公眾號:猿人學 Python 上會分享更多心得體會,敬請關注。

***版權申明:若沒有特殊說明,文章皆是猿人學 yuanrenxue.com 原創,沒有猿人學授權,請勿以任何形式轉載。***

相關文章