快速構建Hadoop的入門練手環境
本文提供了一種快速上手Hadoop的方法:
第一步是找到一個沙盒或開發環境,在那裡你可以在沒有太多開銷和風險的情況下玩轉技術。
對我來說,最好的方法是使用我自己的膝上型電腦作為測試,但我也知道一些開發者喜歡使用亞馬遜EC2例項(例如在AWS上)。本文假設我們使用的是自己的膝上型電腦,而且我們想跟著學,透過例項來學習(也就是說,我們不打算透過所有的細節來了解引擎蓋下的一切運作)。
本地沙盒還意味著我們不一定需要訪問Hadoop基礎設施,如Zookeeper、名稱節點、輔助名稱節點、作業歷史伺服器、任務跟蹤器、資料節點等。
但是,我們確實需要能夠建立一個Hadoop叢集! 有幾種方法可以實現這一目標。
幾年前,我遇到了Cloudera的Vagrant專案,並從那時起一直愉快地使用它。現在Cloudera同時支援Vagrant和基於Docker的CDH5部署,它變得更加厲害。我們可以在短短几分鐘內建立一個與Horton作品沙盒相容的沙盒。
我們先在膝上型電腦上安裝Virtual Box(虛擬機器軟體)和Vagrant。
如果你不想使用Vagrant,你可以考慮這些其他選擇。一個預裝了Hadoop的亞馬遜EC2雲例項。雖然有很多好的AMI,但我沒有找到一個與Vagrant相容的,能讓我快速建立一個Hadoop叢集的AMI。抱歉!EC2也不允許你使用Hadoop叢集。EC2也不允許你改變一個例項的記憶體量。
在你的膝上型電腦上進行裸機安裝(注意32位與64位的要求)!
在我的例子中,這是一臺惠普Envy M6膝上型電腦,有16GB記憶體,執行Windows 8 x64,但要確保它有足夠的磁碟空間以及CPU能力。
雖然在Vagrant上部署Hadoop叢集沒有固定的標準,但大多數情況下,你至少需要3臺機器。我使用的這個Vagrant檔案是基於Karthik Srinivas最初的一個檔案,因此,讓我們獲取原始碼並建立我們的沙盒。
請注意,這將從Oracle的公共資源庫中下載一個預設安裝了Virtual Box Guest Additions的Ubuntu Precise映象。當一切部署成功後,我們應該在我們的Virtual Box使用者介面上看到一堆執行中的虛擬機器。
就這樣了! 我們現在已經準備好開始使用Hadoop和本地沙箱了。我們唯一還需要的是一本關於Hadoop的好書或教程。雖然我知道有很多優秀的資源,但在過去的幾年裡,下面這本是我最喜歡的。Sam R. Alapati的《學習Apache Hadoop》。
如果你想更冒險一些(並安裝一些額外的好東西),看看這些Horton works Sandbox和Cloudera Quick Start VM(基於CDH4)的Vagrantfiles。你可以按原樣使用它們,或者作為建立你自己的沙盒的起點。
相關文章
- docker 入門講解 - 構建本地環境Docker
- 構建Hadoop偽分散式環境Hadoop分散式
- Meilisearch 快速入門(Windows 環境)Windows
- 從零入門 Serverless | 教你 7 步快速構建 GitLab 持續整合環境ServerGitlab
- Elasticsearch快速入門和環境搭建Elasticsearch
- 開發環境配置pyenv快速入門開發環境
- Hadoop快速入門Hadoop
- webpack4.0 入門篇 - 構建前端開發的基本環境Web前端
- Hadoop入門(一)之Hadoop偽分散式環境搭建Hadoop分散式
- webpack 快速構建 React 學習環境(1)WebReact
- 一、Flutter初始入門構建window環境,並且執行helloWorldFlutter
- 菜鳥的Hadoop快速入門Hadoop
- webpack 快速構建 React 學習環境(2)-- 熱更新WebReact
- 淺談之SpringBoot的環境搭建及快速入門Spring Boot
- dockerfile構建flask環境DockerFlask
- docker構建php環境DockerPHP
- Hadoop的HDFS架構入門Hadoop架構
- 使用Cloud DB構建APP 快速入門 - iOS篇CloudAPPiOS
- Hadoop安裝手冊2-Hadoop環境配置Hadoop
- 使用Ambari快速部署Hadoop大資料環境Hadoop大資料
- Docker 構建PHP 映象環境DockerPHP
- 構建ORACLE高可用環境Oracle
- docker 靈活的構建 PHP 環境DockerPHP
- 構建利器Lisp的創作環境Lisp
- java編譯環境的構建(轉)Java編譯
- 大資料技術之Hadoop(入門)第3章 Hadoop執行環境搭建大資料Hadoop
- golang 快速入門 [2.1]-go 語言開發環境配置-windowsGolang開發環境Windows
- QT開發快速入門-教程1:搭建QT開發環境QT開發環境
- Flink從入門到放棄(入門篇2)-本地環境搭建&構建第一個Flink應用
- Python爬蟲建站入門手記(1):環境搭建Python爬蟲
- hadoop3.1.0 HDFS快速搭建偽分散式環境Hadoop分散式
- golang 入門之環境搭建Golang
- ARM開發環境入門開發環境
- Mule 入門之:環境搭建
- 入門(一)搭建GAE環境
- 快速入門:構建您的第一個 .NET Aspire 應用程式
- 構建Java Web開發環境JavaWeb開發環境
- Docker構建redis叢集環境DockerRedis