為資料計算提供強力引擎，阿里雲檔案儲存HDFS v1.0公測釋出

芊寶寶發表於2019-04-02

原文網址 : https://juejin.im/post/5ca311896fb9a05e605e3294

在2019年3月的北京雲棲峰會上，阿里雲正式推出全球首個雲原生HDFS儲存服務—檔案儲存HDFS，為資料分析業務在雲上提供可線性擴充套件的吞吐能力和免運維的快速彈性伸縮能力，降低使用者TCO。阿里雲檔案儲存HDFS的釋出真正解決了HDFS檔案系統不適應雲上場景的缺陷問題，使用者無須花費精力維護和優化底層儲存。
雲時代，通過藉助虛擬化技術，大資料分析的計算框架在雲上逐漸實現了快速部署和彈性伸縮。但是作為資料底座的HDFS檔案系統，它在設計之初並沒有考慮到上雲場景。其資料的擴縮容、故障硬體排除都依賴大量手工運維，因此其服務質量難以保證。在隨著其他計算引擎一起彈性部署時，HDFS會成為整個計算框架的短板，限制了業務的整體彈性伸縮能力，增加了規劃和運維難度。

為響應使用者在雲上使用HDFS的訴求，檔案儲存HDFS應運而生。產品設計方面，得益於檔案儲存HDFS相容標準Hadoop檔案介面，基於HDFS進行開發的分析服務無須進行改造即可直接連線檔案儲存HDFS進行資料分析，可作為serverless計算架構的後端資料引擎。使用者無須花費精力維護和優化底層儲存，聚焦在計算和業務本身。
使用者場景方面，檔案儲存HDFS的多租戶和許可權控制能力可以有效支撐企業內部多業務資料管理的場景。使用者可以將生產叢集的資料直接寫入檔案儲存HDFS，也可以將儲存在自建HDFS、阿里雲OSS、檔案儲存NAS中的資料匯入到檔案儲存HDFS，再利用Spark/Mapreduce/Flink/Hive/Tensoflow等不同的分析框架對檔案儲存HDFS上的資料進行處理，處理結果可以按需輸出到不同的系統中。廣泛用於實時統計與分析、離線使用者畫像、實時分析、機器學習等業務場景中。

技術能力方面，作為聚焦大資料分析場景的雲端儲存產品，檔案儲存HDFS針對計算中最關注的吞吐效能進行了軟硬一體的優化，提供遠超自建HDFS的吞吐能力。在模擬離線分析場景的Terasort測試中，在使用同等數量的CPU和記憶體的情況下，用檔案儲存HDFS替代HDFS可以使整體的分析效能提升一倍。

原文連結

本文為雲棲社群原創內容，未經允許不得轉載。

大資料檔案儲存系統HDFS
2019-01-15
大資料
PHP匯出大量資料,儲存為CSV檔案
2021-04-29
PHP
資料儲存--檔案儲存
2024-05-26
阿里雲檔案儲存CPFS正式商業化，提供雲上高效能並行檔案系統
2019-04-02
阿里並行
分散式檔案系統HDFS，大資料儲存實戰（一）
2019-02-18
分散式大資料
北鯤雲超算平臺如何為生命科學研究提供資料歸檔與儲存服務？
2021-11-06
表格儲存TableStore2.0重磅釋出，提供更強大資料管理能力
2019-03-14
大資料
自建MySQL於阿里雲資料庫檔案儲存DBFS之上的優勢
2022-02-22
MySql阿里資料庫
阿里雲釋出Apsara SA系列混合雲端儲存陣列
2019-04-02
阿里陣列
領存技術—為工業提供計算、儲存、加密以及資料安全等系統服務
2021-04-23
加密
Spring Boot 整合阿里雲 OSS 進行檔案儲存
2020-09-11
Spring Boot阿里
SpringBoot使用阿里OSS實現檔案雲端儲存
2020-10-27
Spring Boot阿里
Android中的資料儲存之檔案儲存
2020-03-11
Android
如何獲取HDFS上檔案的儲存位置
2019-02-27
阿里雲應用高可用服務公測釋出
2018-11-28
阿里
阿里雲專有宿主機日本站（公測）釋出
2018-11-19
阿里
資料庫表設計之儲存引擎
2021-06-28
資料庫儲存引擎
檔案儲存NAS備份服務開放公測
2018-06-13
雲上大資料儲存：探究 JuiceFS 與 HDFS 的異同
2023-04-04
大資料UI
騰訊雲釋出全新非關係型資料庫KeeWiDB，搭載全自研儲存引擎
2022-05-16
資料庫儲存引擎
阿里雲專有宿主機國際站（公測）釋出
2018-07-21
阿里
資料庫檔案儲存（DBFS），是一款針對資料庫場景的雲原生共享檔案儲存服務
2022-05-04
資料庫
阿里雲釋出邊緣計算影片上雲解決方案為海量檢視處理提供城市級雲基礎設施
2020-09-18
阿里
使用axios上傳檔案到阿里雲物件檔案儲存伺服器oss
2019-02-16
iOS阿里物件伺服器
資料儲存(歸檔解檔，沙河儲存)
2018-03-27
Serverless 使用阿里雲OOS將http檔案轉存到物件儲存
2024-06-07
Server阿里HTTP物件
SpringBoot整合阿里雲OSS物件儲存實現檔案上傳
2021-04-13
Spring Boot阿里物件
大量小檔案不適合儲存於HDFS的原因
2018-04-10
必須掌握的分散式檔案儲存系統—HDFS
2020-10-27
分散式
Hadoop 基石HDFS 一文了解檔案儲存系統
2021-06-04
Hadoop
雲端計算儲存技術
2024-04-02
MySQL資料庫操作、儲存引擎
2020-10-05
MySql資料庫儲存引擎
Go Web：資料儲存(2)——CSV檔案
2018-12-03
GoWeb
雲端計算成為資料倉儲的新重心
2021-02-06
分散式檔案儲存系統 fastdfs 的 Composer 包釋出！
2018-12-08
分散式AST
天翼雲攜手華為，強強聯合，共創資料儲存新生態
2022-07-12
Hdfs儲存策略
2022-06-29
塊儲存檔案儲存物件儲存
2020-05-28
物件

為資料計算提供強力引擎，阿里雲檔案儲存HDFS v1.0公測釋出

相關文章