阿里雲E-MapReduce產品優勢及使用場景
E-MapReduce 是構建於阿里雲 ECS 彈性虛擬機器之上,利用開源大資料生態系統,包括 Hadoop、Spark、HBase,為使用者提供叢集、作業、資料等管理的一站式大資料處理分析服務。
產品優勢:
與自建叢集相比,E-MapReduce 能給您提供相對方便可控的手段,從各方面管理自己的叢集。此外,它還具有以下優勢:
- 易用性
您可簡單選擇所需 ECS 機型(CPU、記憶體)與磁碟,並選擇所需的軟體,進行自動化部署。
您可以根據自己或資料來源所處的地理位置申請對應位置的叢集資源。目前阿里雲 ECS 支援的區域包括華東 1、華東 2、華北 1、華北 2、華南 1、新加坡、香港、美東 1、美西 1 等區域。E-MapReduce 支援的區域包括華北 2、華東 1、華東 2 和華南 1,後續會陸續開放到阿里雲 ECS 支援的所有區域。
- 低價
您可以按需建立叢集,即離線作業執行結束就可以釋放叢集,還可以在需要時動態地增加節點。
- 深度整合
與阿里雲其它產品如 OSS、MNS、RDS、MaxCompute 等深度整合,使其可作為 E-MapReduce 產品中 Hadoop/Spark 計算引擎的輸入源或者輸出目的地。
- 安全
E-MapReduce 整合了阿里雲 RAM 資源許可權管理系統,通過主子賬號對服務許可權進行隔離。
使用場景:
E-MapReduce 叢集適用場景很多。簡單說來,Hadoop ecosystem 以及 Spark 能夠支援的場景,E-MapReduce 都可以支援。因為 E-MapReduce 本質就是 Hadoop 和 Spark 的叢集服務,您完全可以將其使用的阿里雲 ECS 主機視為自己專屬的物理主機。以下示例列出了 E-MapReduce 使用的經典場景。
- 批量資料處理
- Ad hoc 資料分析查詢
- 海量資料線上服務
- 流式資料處理
E-MapReduce 的用途:
當使用者想要使用 Hadoop、Spark 等分散式處理系統的時候,通常需要經歷如下的步驟:
- 評估業務特點
- 選擇機器型別
- 採購機器
- 準備硬體環境
- 安裝作業系統
- 部署 Hadoop 和 Spark 等 app
- 啟動叢集
- 編寫應用程式
- 執行作業
- 獲取資料等一系列的步驟
在這些流程中,真正跟使用者的應用邏輯相關的是從第8步才開始,第1-7步的各項工作都是前期的準備工作,通常這個前期工作都非常冗長繁瑣。而 E-MapReduce 提供了叢集管理工具的整合解決方案,如主機選型、環境部署、叢集搭建、叢集配置、叢集執行、作業配置、作業執行、叢集管理、效能監控等。
通過使用 E-MapReduce,使用者可以從叢集構建各種繁瑣的採購、準備、運維等工作中解放出來,只關心自己應用程式的處理邏輯即可。此外,E-MapReduce 還給使用者提供了靈活的搭配組合方式,使用者可以根據自己的業務特點選擇不同的叢集服務。例如,如果使用者的需求是對資料進行日常統計和簡單的批量運算,則可以只選擇在 E-MapReduce 中執行 Hadoop 服務;而如果使用者還需要流式計算和實時計算的需求,則可以在 Hadoop 服務基礎上再加入 Spark 服務。
E-MapReduce 的組成:
E-MapReduce 最核心也是使用者直接面對的元件是叢集。一個 E-MapReduce 叢集是由一個或多個阿里雲 ECS instance 組成的 Hadoop 和 Spark 叢集。以 Hadoop 為例,在每一個 ECS instance 上,通常都執行了一些 daemon 程式(如 namenode、datanode、resoucemanager 和 nodemanager),這些 daemon 程式就組成了 Hadoop 叢集。執行 namenode 和 resourcemanager 的節點被稱為 master 節點,而執行 datanode 和 nodemanager 的節點被稱為 slave 節點。
例如,下圖表示了一個包含1個 master 節點和3個 slave 節點的 E-MapReduce 叢集:
產品架構:
從上圖可以看出,E-MapReduce 叢集基於 Hadoop 的生態環境來搭建,同時可以跟阿里雲的物件儲存服務(OSS),雲資料庫(RDS)等雲服務進行無縫資料交換,方便您將資料在多個系統之間進行共享和傳輸,以滿足不同業務型別的訪問需要。
版權宣告:本文由 數控等離子切割機http://www.hycsk.com 整理編輯!本文章來源於網路,如有侵權,請聯絡雲棲社群,歡迎分享本文,轉載請保留出處!
相關文章
- 雲原生資料庫 TDSQL-C 產品概述、產品優勢、應用場景資料庫SQL
- OSS產品Bucket分級的使用場景及注意事項
- 走進智慧邊緣小站IES,從其應用場景瞭解產品優勢
- 產品手記|從使用場景到使用者價值
- MongoDB的優勢和適用場景MongoDB
- 產品願景
- memcached 和 redis 使用場景及優缺點對比Redis
- 阿里雲常用產品彙總及解釋阿里
- 阿里雲推出AIoT邊緣計算產品家族 共28個場景一體機產品覆蓋6大領域阿里AI
- 場景化封裝,一站式使用,普惠AI整合 ——阿里雲釋出智慧媒體管理產品封裝AI阿里
- JVM面試問題系列:7種JVM垃圾收集器特點,優劣勢、及使用場景!JVM面試
- 產品經理,你為什麼要考慮使用者場景?
- 淺析阿里雲API閘道器的產品架構和常見應用場景阿里API架構
- 分析需求場景對產品設計的意義
- Python中lambda表示式的優缺點及使用場景Python
- NewSQL資料庫產品和它的優勢介紹SQL資料庫
- Redis的應用場景及優缺點Redis
- JVM之調優及常見場景分析JVM
- 未來的智慧家居產品,主要的銷售場景
- MongoDB、Hbase、Redis等NoSQL優劣勢、應用場景MongoDBRedisSQL
- 阿里雲資料中臺再推Quick系列新品Quick Stock 持續打造場景化產品矩陣阿里UI矩陣
- 七個生產案例告訴你BATJ為何選擇ElasticSearch!應用場景和優勢!BATElasticsearch
- 美顏SDK有哪些優勢?可以應用到哪些場景?
- 告訴你移動OA六大優勢場景
- Kubernetes的優勢、適應場景及其特點
- Java 自定義註解及使用場景Java
- HarmonyOS線性容器特性及使用場景
- 調研------典型使用者及場景
- mongodb 使用場景和不使用場景MongoDB
- 保險行業超融合產品選型和應用場景解析行業
- iframe 在 SAP 三款產品中的三個應用場景
- 集中採購系統解決方案:產品場景功能介紹
- NodeJS優缺點及適用場景討論NodeJS
- heartbeat心跳線方案及生產場景選擇建議
- 防火牆產品的技術現狀及發展趨勢防火牆
- 需求流程之產品願景和使用者畫像
- Java 空集合使用場景及填坑Java
- sql中in和exists的原理及使用場景。SQL