Apache Spark有何用途?有何特點?
Apache Spark是專為大規模資料處理而設計的快速通用的計算引擎。它支援多語言,提供了 Java、Scala、Python 和 R 中的高階 API,以及支援通用執行圖的最佳化引擎。
用途:
資料分析:資料分析師主要負責分析資料並建模的人,具備 SQL 統計 預測建模等方面的技能,有一定使用Python和Matlab或者R程式設計的能力。
Spark透過一系列元件支援資料分析任務。Spark Shell提供Python和Scala介面來進行互動式資料分析。Spark SQL提供獨立的SQL shell來使用SQL探索資料,也可以透過標準的Spark程式或者Spark shell進行SQL查詢。MLlib程式庫進行機器學習和資料分析。Spark還支援呼叫R或者Matlab外部程式。
資料處理:工程師是使用 Spark開發資料處理應用的軟體開發者。他們具備軟體工程概念,能使用工程技術設計軟體系統。
Spark為開發用於叢集並執行的程式提供了捷徑。不需要開發者關注分散式問題,網路通訊及程式容錯性。為工程師提供足夠的介面實現常見的任務及對應用監效能調優。
特點:
快速性: spark透過使用先進的DAG排程器、查詢最佳化器和物理執行引擎,可以高效能地進行批次及流式處理。使用邏輯迴歸演算法進行迭代計算,spark比hadoop速度快100多倍。
通用性: Spark 提供了大量的庫,包括Sark Core、Spark SQL、Spark Steaming、MLlib、GraphX。開發者可以在同一個應用程式中無縫組合使用這些庫。spark構建了一個完善的生態棧,將批次計算、互動式計算、流式計算、機器學習及圖計算整合到一個統一的框架體系中。
易用性: Spark提供了80多個高階運算子。gendan5.com/zs/diniw.html
多種資源管理器支援: Spark支援Hadoop YARN、Apache Mesos以及自帶的獨立叢集管理器。
多資料來源支援: Spark支援訪問HDFS、Alluxio、Cassandra、HBase、Hive以及數百個其他資料來源中的資料。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70014563/viewspace-2920700/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料有何特點?_光點科技大資料
- Linux有什麼特點?為何受關注?Linux
- 工業資料採集方案有何功能特點
- Linux有什麼特點?為何深受企業的重視?Linux
- R語言的特點是什麼?和Python有何區別?R語言Python
- Tomcat、Nginx和Apache有何區別?Linux如何學?TomcatNginxApacheLinux
- 審理費高達100萬,遊戲侵權案件有何特點?遊戲
- Apache Spark有哪些侷限性ApacheSpark
- Python到底有何特點,成為了人工智慧首選語言?Python人工智慧
- 裸眼3D技術展示出的內容有何特點3D
- CDN節點指什麼?有何作用?-ElinkcloudCloud
- Android 的 ART 有何作用Android
- 沒有影子,何來真身?
- ERP系統與CRM系統有何區別?進行整合有何作用?
- 帶有Apache Spark的Lambda架構ApacheSpark架構
- 美式卡通風格的角色模型有何特點?從《全明星街球派對》談起模型
- @AutoConfigurationPackage 和 @ComponentScan 有何區別?Package
- HTTP對爬蟲有何作用?HTTP爬蟲
- 論 DevOps 實踐有幾何?dev
- 從工業物聯網閘道器講起:工業資料採集有何特點
- Linux grep命令有何作用?如何使用?Linux
- TDengine 3.0 的 Update 有何區別?
- 老人去養老院有何利弊?
- 極小Linux系統有何妙用Linux
- Golang有什麼優勢?與Erlang有何差異?Golang
- Blink 有何特別之處?菜鳥供應鏈場景最佳實踐
- Linux系統常用的版本有哪些?有何區別呢?Linux
- Linux中cd命令有何作用?如何使用?Linux
- Python有何優勢?技術前景如何?Python
- SQL JOIN 中 on 與 where 有何區別SQL
- 如何經營茶葉有何竅門?
- http和https有何區別?恆訊科技總結這11點HTTP
- WebSocket有什麼優勢?有哪些特點?Web
- 容器雲有哪些特點?有哪些優勢?
- 螞蟻金服開源的機器學習工具 SQLFlow,有何特別之處?機器學習SQL
- 在K8S中,ingress 有何作用?K8S
- Hadoop大資料平臺有何優勢?Hadoop大資料
- Linux系統中的list命令有何作用?Linux