《Flink入門與實戰》簡介

brucexia發表於2023-01-19


《Flink入門與實戰》,Apache Flink是一個框架和分散式處理引擎,用於對無界和有界資料流進行有狀態的計算,廣泛應用於大資料相關的實際業務場景中。本書是一本從零開始講解Flink的入門教材,定價89元,配套示例原始碼、PPT課件。

 

本書背景

 

隨著物聯網、5G以及大資料技術的發展,人類已經進入大資料時代,毫不誇張地說,未來IT相關的職位,一項必備技能就是大資料處理能力。當前,人類基於大資料和人工智慧等技術,在特定領域中可以大大提升業務系統的智慧化水平。

 

人類對於計算速度的追求從未停止,即使面對海量的資料,我們也希望大資料框架可以在非常低的延遲下進行響應,從而提升使用者的體驗。


主流的分散式大資料計算框架有Storm、Spark和Flink,由於阿里對Flink的收購以及改進,Flink社群非常活躍,社群一直致力於統一流處理和批處理API,並逐步增強Flink SQL相關功能,即期望透過SQL來滿足大部分的大資料ETL處理場景。另外,隨著Flink SQL功能的增強和發展,也大大降低了Flink學習的難度。

 

目前,Flink在百度、阿里、位元組跳動、小米和騰訊等商業巨頭中有成熟的應用,每日可以處理萬億的事件,且可以維護TB級別的狀態資訊。Flink支援多種程式語言,可以用Java、Scala以及Python進行大資料業務處理。與此同時,Flink支援靈活的視窗計算以及亂序資料處理,這相對於其他大資料計算框架來說,有比較強的優勢。

 

關於本書

 

如果你對實時大資料處理感興趣,致力於構建分散式大資料處理應用程式,並且有一點Java程式設計基礎,那麼本書適合你。本書作為Flink的入門教材,由淺入深地對Flink大資料處理方法進行介紹,特別對常用的DataStream API和DataSet API、Table API 和SQL進行了詳細的說明,最後結合實戰專案,將各個知識點有機整合,做到理論聯絡實際。

 

本書共分10章,內容包括Flink開發環境搭建、Flink架構和原理、時間和視窗、狀態管理和容錯機制、資料型別與序列化、DataStream API和DataSet API、Table API和SQL、Flink並行、Flink部署與應用。最後以一個Flink實戰專案為例,對Flink相關知識進行綜合實踐,其中涉及Web頁面展示、WebSocket協議和Node.js服務等技術。

 

本書讀者

 

本書內容詳盡、示例豐富,適合作為Flink初學者必備的參考書,也非常適合作為高等院校和培訓機構大資料及相關專業的師生教學參考。

 

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/18841117/viewspace-2932728/,如需轉載,請註明出處,否則將追究法律責任。

相關文章