到底什麼是大資料?新手學大資料的路徑是什麼?
大資料具體是什麼意思?雖然都知道高薪,但 如何學大資料呢?有哪些學習路徑和方法?今天我們就來具體看一下
大資料是什麼?
來看看維基百科的定義
大資料(英語:Big data或Megadata),或稱 巨量資料、海量資料、大資料,指的是所涉及的資料量規模巨大到無法透過人工,在合理時間內達到擷取、管理、處理、並整理成為人類所能解讀的資訊。
在總資料量相同的情況下,與個別分析獨立的小型資料集相比,將各個小型資料集合並後進行分析可得出許多額外的資訊和資料關係性,可用來察覺商業趨勢、判定研究質量、避免疾病擴散、打擊犯罪或測定實時交通路況等;這樣的用途正是大型資料集盛行的原因。
上面那段看起來比較繞,可以一起看看通俗解釋:
如果你是負責做淘寶網的產品推薦工作的,想知道購買首飾的使用者是否也會購買電子產品,然後再決定是否給三星做推薦。
在這種條件下就需要呼叫前一段時間(例如一年)的使用者資料, 只有透過大量資料的證明才能確認兩者是否有關聯性,如果使用傳統資料處理方法,就會耗費大量時間,等確認正相關的時候,三星的促銷期都已經過去了,而像淘寶、京東等每天資料量動輒以TB計數,要迅速處理、分析並給出精準恰當的投放推薦,這就是大資料的作用。
.在入門學大資料的過程當中有遇見學習,行業,缺乏系統學習路線,系統學習規劃,歡迎你加入我的大資料學習交流裙:251956502 ,裙檔案有我這幾年整理的大資料學習手冊,開發工具,PDF文件書籍,你可以自行下載。
與大資料相關的工作?
在美國,與大資料相關的職位統稱為“資料科學家”;而在國內,與大資料相關的崗位則細分得多,主要分為 資料分析、資料探勘、資料工程師、資料架構師四類。
•資料分析:運用工具,提取、分析、呈現資料,實現資料的商業意義
•資料探勘:機器學習,演算法實現
•資料工程師:開發運用簡單資料工具,實現資料建模等功能,需要業務理解
•資料架構師:高階演算法設計與最佳化;資料相關係統設計與最佳化,有垂直行業經驗最佳
關於大資料學習
很多人在問 大資料處理技術怎麼學習?
在這裡,對於大資料工程師,我們給出一個 具體的學習路徑
java基礎----linux----hadoop-----hive、hbase----scala—spark
首先我們要學習Java語言和Linux作業系統,這兩個是學大資料的基礎,學習的順序不分前後。
Java:大家都知道Java的方向有JavaSE、JavaEE、JavaME,學大資料要學習那個方向呢?
只需要學習Java的標準版JavaSE就可以了,像Servlet、JSP、Tomcat、Struts、Spring、Hibernate,Mybatis都是JavaEE方向的技術在大資料技術裡用到的並不多,只需要瞭解就可以了;
當然Java怎麼連線資料庫還是要知道的,像JDBC一定要掌握一下,有同學說Hibernate或Mybites也能連線資料庫啊,為什麼不學習一下,我這裡不是說學這些不好,而是說學這些可能會用你很多時間,到最後工作中也不常用,我還沒看到誰做大資料處理用到這兩個東西的,當然你的精力很充足的話,可以學學Hibernate或Mybites的原理,不要只學API,這樣可以增加你對Java運算元據庫的理解,因為這兩個技術的核心就是Java的反射加上JDBC的各種使用。
Linux:因為大資料相關軟體都是在Linux上執行的,所以Linux要學習的紮實一些,學好Linux對你快速掌握大資料相關技術會有很大的幫助,能讓你更好的理解hadoop、hive、hbase、spark等大資料軟體的執行環境和網路環境配置,能少踩很多坑,學會shell就能看懂指令碼這樣能更容易理解和配置大資料叢集。還能讓你對以後新出的大資料技術學習起來更快。
其他的技術順次學習就可以了。
另外2個基礎的學科,也是必須要修煉的:
•統計學
•計算機(或許還能加上點機器學習的知識)
這兩門學科是大資料基礎中的基礎,跨過這兩道坎就有了從事大資料工作的資格。所以也有人說,大資料工程師是一個精通統計學的程式設計師,而不會程式設計的統計狗也不是好的大資料專家。
統計學:多元統計分析、應用迴歸
計算機:R、python、SQL、資料分析、機器學習
matlab和mathematica兩個軟體也是需要掌握的,前者在實際的工程應用和模擬分析上有很大優勢,後者則在計算功能和數學模型分析上十分優秀,相互補助可以取長補短。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69917001/viewspace-2661391/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 什麼是大資料?大資料能做什麼?大資料
- 什麼是大資料?大資料開發是做什麼的?大資料
- 什麼是大資料?大資料
- 大資料開發需要學習什麼?大資料平臺是什麼?大資料
- 大資料是什麼?大資料的趨勢?大資料
- 什麼是大資料安全?大資料
- 大資料分析是什麼大資料
- 什麼是大資料?大資料學習路線和就業方向大資料就業
- 什麼是大資料?Python和大資料有什麼聯絡?大資料Python
- 什麼是大資料開發?大資料
- 什麼是大資料血緣?大資料
- 漫畫:什麼是大資料?大資料
- 大資料能做什麼,為什麼學大資料大資料
- 大資料的主要特徵是什麼?大資料特徵
- 大資料到底是什麼鬼大資料
- 大資料產品到底應該是什麼形態?大資料
- 想自學大資料開發 鄭州大資料學習路線是什麼大資料
- 到底什麼是資料持久化持久化
- 什麼是大資料視覺化大資料視覺化
- 大資料是個什麼鬼啦?大資料
- 什麼是大資料?大資料的產生、特點、用途大資料
- 大資料開發是幹什麼的?大資料
- 大資料具體是幹什麼的大資料
- 大資料技術的原理是什麼大資料
- 到底什麼才是大資料技術?大資料的概念?大資料
- 什麼是大資料?零基礎如何學習大資料?(附學習路線)大資料
- 大資料到底是幹什麼用的?大資料
- 大資料是什麼?華為雲學院帶你探索大資料之旅大資料
- 誕生至今,大資料的真正含義到底是什麼?大資料
- 什麼是資料庫?什麼是雲資料庫?資料庫
- 大資料學習入門看什麼書?大資料新手怎麼入門?大資料
- 大資料是什麼?IPIDEA解析大資料的基本概念大資料Idea
- 矽谷大資料【上】:什麼是 “改變世界” 的大資料公司大資料
- 50PB的大資料到底是什麼概念?–資料資訊圖大資料
- 如何進入大資料領域,學習路線是什麼?大資料
- 大資料技術 - 為什麼是SQL大資料SQL
- 什麼是大資料系統架構大資料架構
- 大資料分析平臺的目的是什麼大資料