DKHadoop大資料開發框架的構成模組
大資料也不是近幾年才出現的新東西,只是最近幾年才真正意義上變得熱門、火爆!而這要得益於網際網路資訊科技的快速發展,網路改變世界、改變生活,大資料技術的應用讓這樣的改變更為深刻。
關注大資料或者是網際網路方面新聞的人應該知道,大資料已經上升到了國家戰略的高度。可以說這是時代發展的必然趨勢,從國家戰略層面推進大資料技術的普及與應用,一個至關重要且非常核心的問題 ——資料安全問題就非常突出。解決資料安全問題,必然要回歸到大資料開發所使用的框架!
國內的大資料開發起步較晚於國外,所有關於大資料大開發的各種標準和規則都是採用國外的那一套。國內做大資料開發的企業或者機構組織所推出的大部分商業發行版本都是對開源程式的二次包裝,從事大資料底層開發的少之又少。做大資料原生態開發且又推出商業發行版的,行業也就只有大快搜尋,可能在未來的三五年內也許還會有做大資料原生態開發的出現。
為何大資料的普及度不高,主要是由於大資料的應用開發太過偏向於底層,學習的難度不是一般的大,所涉及到的技術面廣太大,不是一般人所能夠駕馭得了的。市場上大部分打著 hadoop 國產發行版,也只是把國外的拿過來重新修改了一下而已。大快 DKhadoop 把大資料開發中的一些通用的,重複使用的基礎程式碼、演算法封裝為類庫,在很大程度上降低了開發的難度。相信這個對於從事開發的人員看了就更容易懂了。
下面,就給大家介紹看一下大快的大資料開發框架的模組構成都有哪些:
大快大資料一體化開發框架主要由六部分組成:資料來源與 SQL 引擎、資料採集(自定義爬蟲)模組、資料處理模組、機器學習演算法、自然語言處理模組、搜尋引擎模組。
如果在開源大資料框架上部署大快的開發框架,需要平臺的元件支援如下:
資料來源與 SQL引擎:DK.Hadoop、spark、hive、sqoop、flume、kafka
資料採集: DK.hadoop
資料處理模組: DK.Hadoop、spark、storm、hive
機器學習和 AI:DK.Hadoop、spark
NLP模組:上傳伺服器端JAR包,直接支援
搜尋引擎模組:不獨立釋出
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2216905/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- DKhadoop大資料平臺基礎框架方案概述Hadoop大資料框架
- DKHadoop大資料平臺架構詳解Hadoop大資料架構
- DKhadoop框架結構說明Hadoop框架
- Hadoop大資料開發框架學習Hadoop大資料框架
- 敏捷開發框架的開發運用之大資料平臺的構建敏捷框架大資料
- 大資料系統架構的通用模組有哪些大資料架構
- 大快搜尋的大資料一體化開發框架下的大資料爬蟲安裝教程大資料框架爬蟲
- DKHadoop大資料視覺化平臺監控功能深度解析Hadoop大資料視覺化
- 大資料開源框架特點大總結大資料框架
- 如何成為一名大資料開發工程師大資料工程師
- 22個大資料開發處理框架平臺和工具大資料框架
- 大資料平臺的整體架構由哪些組成大資料架構
- 大資料框架圖大資料框架
- 大資料開發筆記大資料筆記
- 開發一個不需要重寫成Hive QL的大資料SQL引擎Hive大資料SQL
- 開發一個不需要重寫成 Hive QL 的大資料 SQL 引擎Hive大資料SQL
- 什麼是大資料?大資料開發是做什麼的?大資料
- 大資料開發過程中Kafka日誌結構解析大資料Kafka
- 重磅!Netflix開源大資料發現服務框架Metacat大資料框架
- 零基礎的人可以去大資料培訓機構學習大資料開發嗎?大資料
- MyBatis開發框架的四大核心MyBatis框架
- 大資料開發是幹什麼的?大資料
- 大資料處理的開發經驗大資料
- 教育大資料之資料開發系統大資料
- 學習大資料必須瞭解的大資料開發課程大綱大資料
- 大資料成神之路大資料
- 大資料開發常見的9種資料分析手段大資料
- 什麼是大資料開發?大資料
- 大資料開發之路:hive篇大資料Hive
- 如何大資料開發入門大資料
- JNPF快速開發平臺的四大開發框架介紹之工作流開發框架框架
- Dubbo 如何成為連線異構微服務體系的最佳服務開發框架微服務框架
- 資料分析的三大組成部分
- 大資料開發-資料表監控-實現大資料
- 醫療大資料APP開發的發展潛力大資料APP
- 遊戲開發架構中的資料與後設資料遊戲開發架構
- 《離線和實時大資料開發實戰》(二)大資料平臺架構 & 技術概覽大資料架構
- ASP.NET Core模組化前後端分離快速開發框架介紹之3、資料訪問模組介紹ASP.NET後端框架