Hadoop 簡介 雲端計算
Hadoop 簡介 雲端計算
Posted in 10gen, Amazon, EC2, Eucalyptus, Hadoop, LAMP, cloud computing, 未分類 on
Sep 6th, 2008 No Comments Google和Amazon已經走在了雲端計算商業化的前面,在他們後面則是一群開源的雲端計算專案。這讓我們多了一些選擇,可以考慮...
Hadoop 簡介
Hadoop 是一個開源的可執行於大規模叢集上的分散式並行程式設計框架,由於分散式儲存對於分散式程式設計來說是必不可少的,這個框架中還包含了一個分散式檔案系統 HDFS( Hadoop Distributed File System )。也許到目前為止,Hadoop 還不是那麼廣為人知,其最新的版本號也僅僅是 0.16,距離 1.0 似乎都還有很長的一段距離,但提及 Hadoop 一脈相承的另外兩個開源專案 Nutch 和 Lucene ( 三者的創始人都是 Doug Cutting ),那絕對是大名鼎鼎。Lucene 是一個用 Java 開發的開源高效能全文檢索工具包,它不是一個完整的應用程式,而是一套簡單易用的 API 。在全世界範圍內,已有無數的軟體系統,Web 網站基於 Lucene 實現了全文檢索功能,後來 Doug Cutting 又開創了第一個開源的 Web 搜索引擎(http://www.nutch.org/) Nutch, 它在 Lucene 的基礎上增加了網路爬蟲和一些和 Web 相關的功能,一些解析各類文件格式的外掛等,此外,Nutch 中還包含了一個分散式檔案系統用於儲存資料。從 Nutch 0.8.0 版本之後,Doug Cutting 把 Nutch 中的分散式檔案系統以及實現 MapReduce 演算法的程式碼獨立出來形成了一個新的開源項 Hadoop。Nutch 也演化為基於 Lucene 全文檢索以及 Hadoop 分散式計算平臺的一個開源搜尋引擎。
基於 Hadoop,你可以輕鬆地編寫可處理海量資料的分散式並行程式,並將其執行於由成百上千個結點組成的大規模計算機叢集上。從目前的情況來看,Hadoop 註定會有一個輝煌的未來:"雲端計算"是目前灸手可熱的技術名詞,全球各大 IT 公司都在投資和推廣這種新一代的計算模式,而 Hadoop 又被其中幾家主要的公司用作其"雲端計算"環境中的重要基礎軟體,如:雅虎正在藉助 Hadoop 開源平臺的力量對抗 Google, 除了資助 Hadoop 開發團隊外,還在開發基於 Hadoop 的開源專案 Pig, 這是一個專注於海量資料集分析的分散式計算程式。Amazon 公司基於 Hadoop 推出了 Amazon S3 ( Amazon Simple Storage Service ),提供可靠,快速,可擴充套件的網路儲存服務,以及一個商用的雲端計算平臺 Amazon EC2 ( Amazon Elastic Compute Cloud )。在 IBM 公司的雲端計算專案--"藍雲計劃"中,Hadoop 也是其中重要的基礎軟體。Google 正在跟IBM合作,共同推廣基於 Hadoop 的雲端計算。
Hadoop 簡介
Hadoop 是一個開源的可執行於大規模叢集上的分散式並行程式設計框架,由於分散式儲存對於分散式程式設計來說是必不可少的,這個框架中還包含了一個分散式檔案系統 HDFS( Hadoop Distributed File System )。也許到目前為止,Hadoop 還不是那麼廣為人知,其最新的版本號也僅僅是 0.16,距離 1.0 似乎都還有很長的一段距離,但提及 Hadoop 一脈相承的另外兩個開源專案 Nutch 和 Lucene ( 三者的創始人都是 Doug Cutting ),那絕對是大名鼎鼎。Lucene 是一個用 Java 開發的開源高效能全文檢索工具包,它不是一個完整的應用程式,而是一套簡單易用的 API 。在全世界範圍內,已有無數的軟體系統,Web 網站基於 Lucene 實現了全文檢索功能,後來 Doug Cutting 又開創了第一個開源的 Web 搜索引擎(http://www.nutch.org/) Nutch, 它在 Lucene 的基礎上增加了網路爬蟲和一些和 Web 相關的功能,一些解析各類文件格式的外掛等,此外,Nutch 中還包含了一個分散式檔案系統用於儲存資料。從 Nutch 0.8.0 版本之後,Doug Cutting 把 Nutch 中的分散式檔案系統以及實現 MapReduce 演算法的程式碼獨立出來形成了一個新的開源項 Hadoop。Nutch 也演化為基於 Lucene 全文檢索以及 Hadoop 分散式計算平臺的一個開源搜尋引擎。
基於 Hadoop,你可以輕鬆地編寫可處理海量資料的分散式並行程式,並將其執行於由成百上千個結點組成的大規模計算機叢集上。從目前的情況來看,Hadoop 註定會有一個輝煌的未來:"雲端計算"是目前灸手可熱的技術名詞,全球各大 IT 公司都在投資和推廣這種新一代的計算模式,而 Hadoop 又被其中幾家主要的公司用作其"雲端計算"環境中的重要基礎軟體,如:雅虎正在藉助 Hadoop 開源平臺的力量對抗 Google, 除了資助 Hadoop 開發團隊外,還在開發基於 Hadoop 的開源專案 Pig, 這是一個專注於海量資料集分析的分散式計算程式。Amazon 公司基於 Hadoop 推出了 Amazon S3 ( Amazon Simple Storage Service ),提供可靠,快速,可擴充套件的網路儲存服務,以及一個商用的雲端計算平臺 Amazon EC2 ( Amazon Elastic Compute Cloud )。在 IBM 公司的雲端計算專案--"藍雲計劃"中,Hadoop 也是其中重要的基礎軟體。Google 正在跟IBM合作,共同推廣基於 Hadoop 的雲端計算。
相關文章
- 雲端計算簡介+雲端計算建站平臺
- 邊緣雲端計算簡介
- 雲端計算開發學習教程,簡單介紹雲端計算
- 簡單介紹雲端計算的容器技術
- 【雲端計算】雲端計算六大優點簡單說明
- 雲端計算教程之容器介紹
- 雲端計算簡史(完整版)
- Hadoop簡介!Hadoop
- Hadoop 簡介Hadoop
- 能否利用Hadoop搭建完整的雲端計算平臺Hadoop
- 雲端計算管理平臺之OpenStack簡介及基礎環境搭建
- 雲端計算日常運用場景介紹!
- 靜態路由介紹(雲端計算隨筆)路由
- 《雲端計算》)——超越桌面:雲端計算導論
- 平行計算與Neon簡介
- 雲端計算
- 學習雲端計算簡單嗎?專科生學習雲端計算就業前景如何?就業
- 雲端計算網路,沒那麼簡單
- Hadoop實戰-初級部分 之 開啟雲端計算之旅Hadoop
- 【雲端計算小知識】什麼是雲端計算?雲端計算特點是什麼?
- 什麼叫雲端計算?雲端計算通俗解釋
- PaaS雲端計算平臺,雲端計算程式開發
- 雲端計算安全
- 雲端計算薦
- 邊緣計算與雲端計算
- 混合雲端計算vs霧計算
- 主流雲端計算廠商產品服務介紹
- 什麼叫做雲端計算?學習雲端計算先要理解
- 雲端計算面試題及答案,AWS雲端計算面試題面試題
- 雲端計算開發教程,雲端計算能幹什麼?
- 什麼是雲端計算雲端計算能幹什麼?雲端計算學習筆記工具素材筆記
- 計算機的潛意識-簡介計算機
- 雲端計算課程實驗之安裝Hadoop及配置偽分散式模式的HadoopHadoop分散式模式
- 什麼是雲端計算?雲端計算學習方向有哪些?
- 雲端計算素材、課件:雲端計算可以做什麼用?
- 簡單介紹雲端計算可觀察性的五個關鍵和新興趨勢
- 網格計算與雲端計算(PPT)
- 瞭解“雲端計算”