ClickHouse映象在阿里雲映象站首發上線

哈哈哈hh發表於2022-03-14

映象下載、域名解析、時間同步請點選  阿里雲開源映象站

簡介

ClickHouse是開源、高效能的列式OLAP的資料庫管理系統(DBMS)。使用SQL進行實時分析。

ClickHouse可以做使用者行為分析,流批一體

線性擴充套件和可靠性保障能夠原生支援 shard + replication

ClickHouse沒有走hadoop生態,採用 Local attached storage 作為儲存

超過了市場上同類的面向列的資料庫管理系統,每秒每臺伺服器每秒處理數數億至十億多行和數十千兆位元組的資料

file

特點

Clickhouse採用列式儲存

列式儲存的好處:

1 、對於列的聚合,計數,求和等統計操作原因優於行式儲存。

2、 由於某一列的資料型別都是相同的,針對於資料儲存更容易進行資料壓縮,每一列選擇更優的資料壓縮演算法,大大提高了資料的壓縮比重。

3 、由於資料壓縮比更好,一方面節省了磁碟空間,另一方面對於cache也有了更大的發揮空間。

多樣化引擎

clickhouse和mysql類似,把表級的儲存引擎外掛化,根據表的不同需求可以設定不同的儲存引擎。

寫資料

ClickHouse採用類LSM Tree的結構,資料寫入後定期在後臺合併。通過類LSM tree的結構,但是沒有記憶體表,沒有預寫日誌,ClickHouse在資料匯入時全部是順序append寫入磁碟,在後臺週期性合併資料到主資料段。

不支援常規意義的修改行和刪除行資料。

不支援事務。

讀資料

語句級多執行緒:在這種設計下,單條Query就能利用整機所有CPU。

稀疏索引:索引之間的顆粒度(預設8192行)。

關鍵功能與應用場景

file

總結

在大資料分析領域中,傳統的大資料分析需要不同框架和技術組合才能達到最終的效果,在人力成本,技術能力和硬體成本上以及維護成本讓大資料分析變得成為昂貴的事情。讓很多中小型企業非常苦惱,不得不被迫租賃第三方大型公司的資料分析服務。

ClickHouse開源的出現讓許多想做大資料並且想做大資料分析的很多公司和企業耳目一新。ClickHouse 正是以不依賴Hadoop 生態、安裝和維護簡單、查詢速度快、可以支援SQL等特點在大資料分析領域越走越遠。

ClickHouse映象詳情地址: https://developer.aliyun.com/mirror/clickhouse


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70003733/viewspace-2870843/,如需轉載,請註明出處,否則將追究法律責任。

相關文章