WebHDFS :通過Web訪問Hadoop分散式檔案系統 (HDFS)的開源工具
Hadoop是一個框架,可為您提供任何型別的資料儲存,並允許您在商品硬體叢集上執行計算。許多機構使用 Hadoop 分散式檔案系統 (HDFS)作為大資料專案的戰略儲存平臺,因為它具有容錯性、高並行化和海量儲存能力。
WebHDFS 是一種定義公共 HTTP REST API 的協議,因此您可以通過瀏覽器訪問它。WebHDFS 保持原生 Hadoop 協議提供的安全性,並使用並行性來提高吞吐量。
MATLAB的WebHDFS 介面允許您通過 REST API 處理儲存在 Hadoop 中的檔案和資料夾。您可以執行常見的操作,例如讀取、寫入、上傳和下載檔案。
WebHDFS 是對在 MATLAB 中訪問和處理 Hadoop 資料的其他方式(例如 Hive 或 Spark)的補充,這可能更適合在大型資料集中進行操作。
WebHDFS 是一種定義公共 HTTP REST API 的協議,該 API 允許客戶端通過 Web 訪問 Hadoop 分散式檔案系統 (HDFS)。它保留了本機 Hadoop 協議提供的安全性並使用並行性,以獲得更好的吞吐量。要使用此工具箱,需要在 Hadoop伺服器中啟用 webhdfs 功能。
該工具箱提供了一組功能,使使用者能夠通過REST API直接處理儲存在 Hadoop 中的檔案和資料夾,並執行常見操作,例如讀取、寫入、上傳和下載檔案。
什麼時候應該使用 WebHDFS?
使用 Hadoop 檔案時,WebHDFS 不是唯一的替代方案,您可能需要根據手頭的任務考慮其他替代方案。
- 對於大資料應用程式,您可以使用tall 陣列或我們的Spark API在 MATLAB 中對演算法進行原型設計,並將它們直接部署在支援 Spark 的 Hadoop 叢集上
- 您可以使用 Hive 和 Impala 訪問您的檔案,並執行任何 SQL 或 HQL 命令。此工具可能更適合對大量資料執行查詢。
這些工具可能更適合對大型資料集進行分析,而 webhdfs 介面可能是執行小型操作的更好工具,因為資料需要通過 Internet 來回傳輸。
點選標題Github
相關文章
- Hadoop 系列(一)—— 分散式檔案系統 HDFSHadoop分散式
- Hadoop學習(一)——HDFS分散式檔案系統Hadoop分散式
- Hadoop基礎(一):分散式檔案系統HDFSHadoop分散式
- HDFS架構指南(分散式系統Hadoop的檔案系統架構)架構分散式Hadoop
- 分散式檔案系統-HDFS分散式
- HDFS分散式檔案系統分散式
- Hadoop分散式檔案系統(HDFS)會不會被淘汰?Hadoop分散式
- Hadoop HDFS分散式檔案系統 常用命令彙總Hadoop分散式
- Hadoop 三劍客之 —— 分散式檔案儲存系統 HDFSHadoop分散式
- 掃盲:Hadoop分散式檔案系統(HDFS)基礎概念講解!Hadoop分散式
- 大資料 | 分散式檔案系統 HDFS大資料分散式
- 分散式檔案系統(HDFS)與 linux系統檔案系統 對比分散式Linux
- 必須掌握的分散式檔案儲存系統—HDFS分散式
- FASTDFS開源分散式檔案系統介紹AST分散式
- 【史上最全】Hadoop 核心 - HDFS 分散式檔案系統詳解(上萬字建議收藏)Hadoop分散式
- Hadoop hdfs完全分散式搭建教程Hadoop分散式
- 分散式檔案系統分散式
- 常見開源分散式檔案系統架構對比分散式架構
- 分散式檔案系統HDFS,大資料儲存實戰(一)分散式大資料
- Hadoop 基石HDFS 一文了解檔案儲存系統Hadoop
- 架構師入門必看系列,分散式檔案系統HDFS解讀架構分散式
- Hadoop大資料實戰系列文章之HDFS檔案系統Hadoop大資料
- Hadoop--HDFS完全分散式(簡單版)Hadoop分散式
- cephFS分散式檔案系統操作分散式
- FastDFS-分散式檔案系統AST分散式
- 部署GPS分散式檔案系統分散式
- 分散式檔案系統之 FastDFS分散式AST
- 透過API訪問HDFSAPI
- Hadoop3.2.1 【 HDFS 】原始碼分析 : 檔案系統資料集 [一]Hadoop原始碼
- Hadoop HDFS 3.3.1分散式儲存搭建Hadoop分散式
- 通過Consul Raft庫打造自己的分散式系統Raft分散式
- AspNetCore分散式檔案上傳系統NetCore分散式
- GFS分散式檔案系統部署解析分散式
- Linux系統中常見的分散式檔案系統推薦!Linux分散式
- 大資料分析系統Hadoop的13個開源工具!大資料Hadoop開源工具
- 大資料分析系統Hadoop的13個開源工具大資料Hadoop開源工具
- hadoop3.1.0 HDFS快速搭建偽分散式環境Hadoop分散式
- 好程式設計師大資料學習路線分享分散式檔案系統HDFS程式設計師大資料分散式