大資料解決方案-(基礎篇)

大資料學習發表於2019-07-20

學大資料分析與應用課程的首要任務,是先了解統計與建模方法和資料探勘方法所呈現出來的效果,然後依次學習Excel資料處理及程式設計、MySQL資料庫的簡單操作及Hadoop的基礎知識。從而為進階、提高打好基礎。

大資料解決方案-(基礎篇)

基礎

統計與建模方法演示

探索性資料分析演示

常用概率分佈和漸進性演示

置信區間和假設檢驗演示

線性迴歸模型演示

廣義線性迴歸模型演示

資料探勘方法演示

分類預測基本流程演示

資料預處理演示

分類方法演示

聚類分析演示

關聯分析演示

在這裡小編建了一個大資料學習交流扣扣群:251956502,我自己整理的最新的大資料進階資料和高階開發教程,如果有想需要的,可以加群一起學習交流

Excel

Excel資料處理

練習1 Excel基本操作

練習2 Excel資料視覺化

練習3 Excel函式與公式

練習4 Excel透表

練習5 Excel資料分析

Excel高階程式設計

練習1 VBA程式基礎

練習2 VBA資料型別

練習3 VBA流程控制

練習4 VBA綜合應用

MySQL

Mysql資料庫操作

練習1 Mysql資料操作語句

練習2 Mysql資料查詢語句

練習3 Mysql資料查詢高階語句

練習4 Mysql檢視和索引

Hadoop架構與基礎知識

Hadoop安裝

練習1 Hadoop安裝環境配置

練習2 Hadoop單機模式安裝

練習3 Hadoop偽分散式模式安裝

練習4 Hadoop完全分散式模式安裝

HDFS原理及操作

練習1 讀取HDFS檔案內容-例1

練習2 讀取HDFS檔案內容-例2

練習3 讀取HDFS檔案內容-例3

MapReduce原理與實現

練習1 求每年的最低溫度

練習2 求溫度的平均值

Hadoop開發例項-利用MapReduce進行排序

練習1 求各個部門的總工資

練習2 求各個部門的人數和平均工資

MapReduce詞頻統計

練習1 MapReduce詞頻統計

迭代式MapReduce程式開發

練習1 MapReduce程式開發

Hadoop-HA部署與使用

安裝準備

練習1 配置主機

練習2 安裝JDK與搭建zookeeper叢集

安裝Hadoop叢集

練習1 安裝Hadoop叢集

Eclipse連線Hadoop執行mapreduce程式

練習1 Eclipse連線Hadoop執行mapreduce程式

(1)資料的統計與建模方法和進行資料探勘的方法

以演示的教學模式,完成對資料進行彙總、統計、建模、分析、挖掘等一套完整的過程,使學生能夠直觀地掌握大資料分析與應用的常用方法和流程。

(2)Excel進行資料進行處理的方法

資料分析工作普及度排行第五位(諮詢公司Kdnuggets釋出),對學生無任何基礎要求,Excel 是微軟公司office系列辦公軟體的元件之一,它是一個功能強大的電子表格程式。Excel不僅可以將整齊而美觀的表格呈現給使用者,還可以用來進行資料的分析和預測,完成許多複雜的資料運算,幫助使用者做出更加有根據的決策。同時它還具有強大的視覺化功能,可以將表格中的資料通過各種各樣的圖形、圖表的形式表現出來,增強表格的表達力和感染力。在Excel中,有些資料分析的高階功能需要掌握VBA才能充分實現。因此Excel是用於資料探勘與資料分析的最基本軟體工具。

(3)MySQL資料庫的基本使用方法和基本程式設計方法

資料分析工作普及度排行第三位(諮詢公司Kdnuggets釋出),因體積小、速度快、總體擁有成本低,尤其是開源的優勢,使其在中小型網站的開發工作得到極普通的應用。實驗對學生無基礎要求,可掌握MySQL資料庫的基本使用方法和SQL程式設計的基本方法。

(4)Hadoop架構和環境搭建的知識學習

Hadoop作為是整個大資料生態系統的基石,在資料分析工作普及度排行第七位,其架構和環境搭建的知識是必須要學習掌握的。通過其實現分散式檔案系統HDFS,並以此為基,講述了Hadoop安裝、HDFS原理及操作、MapReduce原理與實現、迭代式MapReduce程式開發等。通過本類實驗,學生可以掌握用Hadoop進行大資料分析的常用方法和流程。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69917001/viewspace-2651219/,如需轉載,請註明出處,否則將追究法律責任。

相關文章