12月9日,阿里雲宣佈資料庫產品 HybridDB 正式商業化。

HybridDB(ApsaraDB HybridDB)是一款線上MPP大規模並行處理資料倉儲的服務。它基於 Pivotal 公司的開源資料庫專案 Greenplum Database 開發,並由阿里雲資料庫團隊在雲端計算架構下深度擴充套件。

20161209-%e9%98%bf%e9%87%8c%e4%ba%91%e6%8e%a8%e5%87%ba%e4%ba%91%e6%95%b0%e6%8d%ae%e5%ba%93hybriddb

該服務支援了OSS儲存、JSON資料型別、HyperLogLog預估分析等功能特性。通過符合SQL2008標準查詢語法及OLAP分析聚合函式,提供靈活的混合分析能力。提供線上擴容、備份、效能監測等服務。

阿里雲資料庫產品研究員褚霸介紹,隨著各行各業資訊科技的發展催生了以資料分析場景為主要業務的企業。特別是物聯網和廣告分析領域的企業,對雲上覆雜場景資料分析有強需求。“這個產品可以簡化大量工作,如資料庫管理員、開發者以及資料分析師可以專注於如何通過 SQL 挖掘資料價值,無需再自行維護複雜的大規模並行資料叢集。”

HybridDB 是此款產品的名字,也體現了“混合”的特點。HybridDB 相容資料型別多達23種,比市面上雲端計算廠商的同類產品多一倍。同時,它支援橫向擴充套件,當使用者資料量變大,記憶體及CPU計算能力需求增大時,隨時可以新增節點,以線性擴充套件分析效能,提高計算能力。

7月公測以來的資料顯示,JSON 和 GIS 型別的資料量高達TB級別時,查詢也可以在1秒內完成。此外,廣告分析領域的公司在做網際網路海量資料的 PV、UV 預估分析時,統計效能提升20-100倍。

在MySQL和ProstgreSQL之外,資料庫使用者為什麼還需要全新的產品?褚霸表示,HybridDB的混合資料型別及混合儲存(行存、列存、OSS外部表)能力,可以與阿里雲現有的RDS、NoSQL資料庫方案實現資料融合分析。同時補全了EMR(Hadoop)分析場景中實時性不足的問題,為使用者提供基於開源OLTP、OLAP、BigData生態的一站式解決方案。

Greenplum 誕生於2006年,是一個分散式大規模並行處理資料庫,常用於大資料的儲存引擎、計算引擎和分析引擎。它和HybridDB將形成雲上雲下業務場景的互補,軟體開發過程中,雲上HybridDB環境與雲下Greenplum商業版本、Greenplum Database開源版本環境可以採用同一套程式碼,節省開發及維護成本。

阿里雲資料庫團隊的願景是打造一站式線上分析引擎。從資料的傳輸、儲存、計算到管理,讓客戶的資料需求能夠在同一個產品環境體系內實現,進一步降低資料處理的整體成本。未來,阿里雲將圍繞 HybridDB 做資料庫生態的努力。一方面,加速與阿里雲資料類產品實現互通,讓使用者可以通過SQL快速分析從不同渠道儲存下來的資料。另一方面,引入合作伙伴認證機制,邀請更多ISV開發商及BI/ETL廠商支援,共同為使用者創造價值。

  • 實時分析

支援SQL語法進行分散式GIS地理資訊資料型別實時分析,協助物聯網、網際網路實現LBS位置服務統計

支援SQL語法進行分散式JSON、XML、模糊字串等資料實時分析,助金融、政企行業實現報文資料處理及模糊文字統計

 

  • 穩定可靠

支援分散式ACID資料一致性,實現跨節點事務一致,所有資料雙節點同步冗餘

分散式部署,計算單元、伺服器、機櫃三重防護,提高重要資料基礎設施保障

 

  • 簡單易用

豐富的OLAP SQL語法及函式支援,眾多Oracle函式支援,業界流行的BI軟體可直接聯機使用

可與雲資料庫RDS(PostgreSQL/PPAS)實現資料通訊,實現OLTP+OLAP(HTAP)混合事務分析解決方案

 

  • 效能卓越

支援行列混合儲存,列存效能在OLAP分析時相比行儲存可達100倍效能提升

支援高效能OSS並行資料匯入,避免單通道匯入的效能瓶頸

 

  • 靈活擴充套件

按需進行計算單元,CPU、記憶體、儲存空間的等比擴充套件,OLAP效能平滑上升致數百TB

支援透明的OSS資料操作,非線上分析的冷資料可靈活轉存到OSS物件儲存,資料儲存容量無限擴充套件