物件儲存服務的壓縮特性

jackieathome發表於2024-08-07

原文網址 : https://www.cnblogs.com/jackieathome/p/18348046

在物件儲存服務中整合壓縮演算法，可以有效節省最終佔用的空間，提升介質的利用效率，提高儲存的收益。
選擇壓縮演算法時，通常綜合考慮物件的格式、訪問頻率、訪問時延、儲存服務的負載、儲存伺服器的硬體規格、儲存介質的規格等。
對於高壓縮比的文字類資料，通常建議在客戶端應用側完成壓縮，這樣除節省儲存空間，還節省了傳輸頻寬和網路傳輸引入的時延。
對於二進位制類的檔案，考慮到壓縮的收益比較低，通常不建議進行壓縮。
對於訪問頻率較低的歸檔類的冷資料，通常選擇高壓縮比的壓縮演算法，有助於節省空間。
對於訪問頻率中等的溫資料，初期可採用解壓吞吐量高的壓縮演算法，待訪問量逐漸下降到一定程度之後變為冷資料，此時在後臺任務中逐步轉換為採用高壓縮比的演算法，同時兼顧訪問效率和儲存空間的利用率。
對於已壓縮的物件，假如一定時間內訪問頻率超出閾值，可以還原一份非壓縮的副本，透過空間換時間的方式，改善訪問效率。
對於大量的小檔案，比如小於1MB，可以考慮採用先聚合再壓縮的策略，改善壓縮演算法的工作收益。
對於大的檔案，比如超出10GB，可以依據壓縮演算法的特點，拆解為多個塊，同時壓縮，充分利用硬體，縮短壓縮演算法的工作時間，同時也可以改善訪問時解壓檔案的效率。

實現時的關注點，如下：

資料的格式
- 文字，比如TXT、XML、INI、PROPERTIES、CSV、JSON、YAML等
- 二進位制，比如圖片、影片、音訊、可執行檔案等
壓縮的演算法
- 無失真壓縮
- 有失真壓縮
壓縮演算法的評估指標
- 吞吐量
  - 壓縮時吞吐量
  - 解壓時吞吐量
- CPU使用量
- 記憶體使用量
- 硬碟使用量
- 壓縮比率
常見的壓縮演算法
- gzip
- bzip2
- zip
- lzw
- snappy
- zstd
專用的壓縮演算法
- H264
- MPEG2
- MPEG4
- JPEG
執行壓縮操作的位置
- 客戶應用
- 物件SDK
- 物件儲存服務
執行壓縮的時機
- 寫入時壓縮
- 後臺壓縮
  - 對於未壓縮的物件，在建立後、訪問頻率較低，可在後臺任務中轉換為壓縮檔案，節省儲存空間
  - 對於已壓縮的物件，訪問頻率超過一定閾值，可在後臺任務中建立一個非壓縮的副本，透過空間換時間的方式來提升訪問效率
壓縮的粒度
- 以檔案為粒度，執行壓縮
- 以資料塊為粒度，執行壓縮
壓縮演算法的選擇
- 針對所有的檔案，使用統一的壓縮演算法
- 依據檔案型別的特點，使用特定的壓縮演算法
- 由客戶指定壓縮演算法

參考資料

壓縮演算法

物件儲存服務的Lambda特性
2024-04-28
物件
物件儲存服務的加密特性
2024-06-09
物件加密
物件儲存服務的事件通知特性
2024-04-27
物件事件
物件儲存服務的影像處理特性
2024-04-27
物件
Redis儲存優化--小物件壓縮
2020-11-14
Redis優化物件
物件儲存服務中物件業務的非標介面
2024-04-27
物件
8-字串的壓縮儲存
2018-08-17
字串
Impala之儲存和壓縮
2020-11-23
物件儲存服務OBS obsfs掛載
2024-04-01
物件
物件儲存服務（Object Storage Service，OBS）
2019-06-21
物件Object
使用MinIO搭建物件儲存服務
2022-05-20
物件
物件儲存服務的完整性檢查
2024-07-06
物件
從物件儲存服務同步資料到Elasticsearch
2021-09-09
物件Elasticsearch
華為雲OBS物件儲存服務：值得擁有的貼心的儲存管家
2022-10-20
物件
Hive的壓縮儲存和簡單優化
2020-06-07
Hive優化
監控影片儲存壓縮解決方案
2023-02-23
華為雲學院乾貨：物件儲存服務：便捷管理儲存資源
2018-10-11
物件
阿里雲物件儲存OSS支援版本管理特性
2019-04-03
阿里物件
從“軟體”到“服務“——【物件儲存】的發展歷程（上）
2019-03-06
物件
NFS共享儲存服務
2020-12-12
NFS
濃縮的才是精華：淺析GIF格式圖片的儲存和壓縮
2019-03-03
儲存—物件儲存_Minio
2024-07-15
物件
華為雲物件儲存服務OBS教你一招輕鬆解決儲存難題
2022-10-23
物件
塊儲存檔案儲存物件儲存
2020-05-28
物件
NFS儲存服務及部署
2019-07-20
NFS
物件儲存
2022-07-12
物件
浪潮線上壓縮，為資料儲存降本增效
2022-04-07
談談MySQL InnoDB儲存引擎事務的ACID特性
2018-05-04
MySql儲存引擎
儲存空間緊張？來看 TDengine TSZ 壓縮演算法如何顯著提升壓縮率
2023-11-28
演算法
Github標星28K+！這款視覺化的物件儲存服務真香！
2021-08-11
Github視覺化物件
儲存服務質量優化
2018-11-20
優化
五十鈴壓縮垃圾車特性，五十鈴壓縮垃圾車價格
2022-03-04
Kafka-之資料日誌儲存（格式變化與壓縮）
2020-12-28
Kafka
物件儲存的優勢有哪些？為什麼要選擇物件儲存？
2021-07-17
物件
物件儲存，未來儲存新潮流
2019-12-16
物件
minio-物件儲存
2021-08-23
物件
【Azure 儲存服務】使用 AppendBlobClient 物件實現對Blob進行追加內容操作
2023-05-09
APPclient物件
淺談雲上攻防——物件儲存服務訪問策略評估機制研究
2021-08-13
物件

物件儲存服務的壓縮特性

參考資料

相關文章