DKHadoop大資料開發框架的構成模組

adnb34g發表於2018-10-19

原文網址 : http://blog.itpub.net/31524777/viewspace-2216905/

大資料也不是近幾年才出現的新東西，只是最近幾年才真正意義上變得熱門、火爆！而這要得益於網際網路資訊科技的快速發展，網路改變世界、改變生活，大資料技術的應用讓這樣的改變更為深刻。

關注大資料或者是網際網路方面新聞的人應該知道，大資料已經上升到了國家戰略的高度。可以說這是時代發展的必然趨勢，從國家戰略層面推進大資料技術的普及與應用，一個至關重要且非常核心的問題 ——資料安全問題就非常突出。解決資料安全問題，必然要回歸到大資料開發所使用的框架！

國內的大資料開發起步較晚於國外，所有關於大資料大開發的各種標準和規則都是採用國外的那一套。國內做大資料開發的企業或者機構組織所推出的大部分商業發行版本都是對開源程式的二次包裝，從事大資料底層開發的少之又少。做大資料原生態開發且又推出商業發行版的，行業也就只有大快搜尋，可能在未來的三五年內也許還會有做大資料原生態開發的出現。

為何大資料的普及度不高，主要是由於大資料的應用開發太過偏向於底層，學習的難度不是一般的大，所涉及到的技術面廣太大，不是一般人所能夠駕馭得了的。市場上大部分打著 hadoop 國產發行版，也只是把國外的拿過來重新修改了一下而已。大快 DKhadoop 把大資料開發中的一些通用的，重複使用的基礎程式碼、演算法封裝為類庫，在很大程度上降低了開發的難度。相信這個對於從事開發的人員看了就更容易懂了。

下面，就給大家介紹看一下大快的大資料開發框架的模組構成都有哪些：

大快大資料一體化開發框架主要由六部分組成：資料來源與 SQL 引擎、資料採集（自定義爬蟲）模組、資料處理模組、機器學習演算法、自然語言處理模組、搜尋引擎模組。

如果在開源大資料框架上部署大快的開發框架，需要平臺的元件支援如下：

資料來源與 SQL引擎：DK.Hadoop、spark、hive、sqoop、flume、kafka

資料採集： DK.hadoop

資料處理模組： DK.Hadoop、spark、storm、hive

機器學習和 AI：DK.Hadoop、spark

NLP模組：上傳伺服器端JAR包，直接支援

搜尋引擎模組：不獨立釋出

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31524777/viewspace-2216905/，如需轉載，請註明出處，否則將追究法律責任。

DKhadoop大資料平臺基礎框架方案概述
2018-10-31
Hadoop大資料框架
DKHadoop大資料平臺架構詳解
2018-10-17
Hadoop大資料架構
DKhadoop框架結構說明
2018-10-15
Hadoop框架
大資料系統架構的通用模組有哪些
2022-04-12
大資料架構
大資料平臺的整體架構由哪些組成
2022-04-12
大資料架構
資料分析的三大組成部分
2021-09-11
Android模組開發框架 LiveData+ViewModel
2019-05-11
Android框架LiveDataView
Hadoop大資料開發框架學習
2018-08-31
Hadoop大資料框架
EDP .Net開發框架--組織架構
2024-05-23
框架架構
敏捷開發框架的開發運用之大資料平臺的構建
2020-10-09
敏捷框架大資料
ASP.NET Core模組化前後端分離快速開發框架介紹之3、資料訪問模組介紹
2019-05-23
ASP.NET後端框架
為爬蟲框架構建Selenium模組、DSL模組(Kotlin實現)
2018-06-12
爬蟲框架架構Kotlin
大資料分析平臺的組成部分有哪些
2021-12-07
大資料
大快搜尋的大資料一體化開發框架下的大資料爬蟲安裝教程
2018-08-24
大資料框架爬蟲
基於maven構建多模組化的SSM框架
2019-03-04
MavenSSM框架
LollipopGo框架-鬥獸棋遊戲開發基本核心模組
2018-12-20
Go框架遊戲開發
DKHadoop大資料視覺化平臺監控功能深度解析
2019-01-14
Hadoop大資料視覺化
Python原生資料結構增強模組collections
2022-01-06
Python資料結構
開源交流丨批流一體資料整合框架ChunJun資料傳輸模組詳解分享
2022-08-24
框架
重磅！Netflix開源大資料發現服務框架Metacat
2018-06-15
大資料框架
Tensorflow的資料輸入模組tf.data模組
2020-11-21
如何成為一名大資料開發工程師
2018-12-21
大資料工程師
解析SSH和SSM兩大框架的組成及其區別
2019-11-07
SSM框架
使用typescript開發angular模組(編寫模組)
2018-04-23
TypeScriptAngular
Js模組化開發的理解
2020-11-04
JS
Python資料分析 Pandas模組基礎資料結構與簡介
2018-12-14
Python資料結構
22個大資料開發處理框架平臺和工具
2019-04-21
大資料框架
模組化開發(二)
2019-05-19
前端模組化開發
2021-03-15
前端
spring-boot 整合mybatis-plus 組成後臺開發基本框架
2019-04-25
SpringbootMyBatis框架
【raid5資料恢復案例】兩組分別由4塊SAS硬碟組成的raid5組成lvm結構的資料恢復方案
2021-11-30
AI資料恢復硬碟LVM
程式模組化設計結構化開發優勢
2024-04-21
資料分析---matplotlib模組
2024-06-21
資料分析---pandas模組
2024-05-29
Spring框架 - Spring和Spring框架組成
2022-06-20
Spring框架
模組化開發靜態資源對映
2019-09-11
Vue遞迴元件+Vuex開發樹形元件Tree--資料模組
2019-03-29
Vue遞迴元件
Oracle - 資料庫的組成簡介
2018-09-17
Oracle資料庫

DKHadoop大資料開發框架的構成模組

相關文章