什麼是Hadoop?
按照正式的定義,Hadoop是一個開源的框架,可編寫和執行分散式應用處理大規模資料。分散式計算是一個寬泛並且不斷變化的領域,但Hadoop與眾不同之處在於以下幾點。
方便——Hadoop執行在由一般商用機器構成的大型叢集上,或者如亞馬遜彈性計算雲(EC2)等雲端計算服務之上。
健壯——Hadoop致力於在一般商用硬體上執行,其架構假設硬體會頻繁地出現失效。它可以從容地處理大多數此類故障。
可擴充套件——Hadoop通過增加叢集節點,可以線性地擴充套件以處理更大的資料集。
簡單——Hadoop允許使用者快速編寫出高效的並行程式碼。
Hadoop的方便和簡單讓其在編寫和執行大型分散式程式方面佔盡優勢。即使是在校的大學生也可以快速、廉價地建立自己的Hadoop叢集。另一方面,它的健壯性和可擴充套件性又使它勝任雅虎和Facebook最嚴苛的工作。這些特性使Hadoop在學術界和工業界都大受歡迎。
圖1-1解釋瞭如何與Hadoop叢集互動。Hadoop叢集是用網路連線在同一地點的一組通用機器。資料儲存和處理都發生在這個機器“雲”中 。不同的使用者可以從獨立的客戶端提交計算“作業”到Hadoop,這些客戶端可以是遠離Hadoop叢集的個人桌上型電腦。
並非所有分散式系統的構建都如圖1-1所示的一樣。下面,我們簡要介紹一下其他分散式系統,以便更好地展現Hadoop所依據的設計理念。
摘自:《Hadoop實戰 》
下一篇:瞭解分散式系統和Hadoop
相關文章
- 什麼是 Apache Hadoop?ApacheHadoop
- 《openstack 和hadoop的區別是什麼?》Hadoop
- 邊緣計算|Hadoop——邊緣計算和Hadoop是什麼關係?Hadoop
- 大資料與Hadoop之間是什麼關係?大資料Hadoop
- Hadoop 擅長什麼?Hadoop
- 什麼是cookie,什麼是sessionCookieSession
- 什麼是DNS,什麼是HostsDNS
- 什麼是模式? 什麼是框架?模式框架
- 這是什麼這是什麼
- 大資料之hadoop / hive / hbase 的區別是什麼?有什麼應用場景?大資料HadoopHive
- 什麼是WebAuthn、FIDO 是什麼?Web
- ITIL是什麼意思?ITIL是什麼?
- 什麼是跨域,什麼是同源跨域
- 什麼是.NET平臺、什麼是c#、什麼是ASP.NET。C#ASP.NET
- ftp是什麼,ftp是什麼東西?FTP
- Java是什麼_Java是做什麼的?Java
- 什麼是正向代理?什麼是反向代理?
- NLA是什麼?NLA的原理是什麼?
- ###什麼是Linux核心###什麼是MMULinux
- 為什麼要有 Servlet ,什麼是 Servlet 容器,什麼是 Web 容器?ServletWeb
- 替代品不少,大家堅持用Hadoop的原因是什麼?Hadoop
- 什麼是塊元素?什麼是行內元素?
- 什麼是API介面,具體是什麼意思?API
- 什麼是框架?為什麼說 Angular 是框架?框架Angular
- 什麼是Unicode,什麼是UTF-8Unicode
- 大資料和Hadoop什麼關係?為什麼大資料要學習Hadoop?大資料Hadoop
- 什麼是藍海?什麼是紅海?什麼是網際網路思維?
- nginx 是什麼,能幹什麼?Nginx
- 什麼是Django?有什麼用途?Django
- AI三重問:什麼是AI?什麼是AI模型?什麼是AI大模型?AI大模型
- 什麼是重繪repaint?什麼是迴流reflow?AI
- DHCP是什麼?DHCP伺服器是什麼意思?伺服器
- 什麼是CDN?CDN的技術原理是什麼?
- 交換機是什麼,它的工作原理是什麼
- GNU是什麼?和Linux是什麼關係?Linux
- 域名是什麼?申請域名的流程是什麼?
- 什麼是雲端計算?什麼是公司網盤?
- 什麼是eval()?eval是用來幹什麼的?