重磅|阿里雲HBase Ganos全新升級,推空間、時空、遙感一體化基礎雲服務

大濤學長發表於2019-09-11

1、HBase Ganos是什麼

Ganos是阿里雲時空PaaS服務的自研核心引擎。Ganos已作為雲資料庫時空引擎與資料庫平臺融合,建立了以自研雲原生資料庫POALRDB為基礎,聯合NoSQL大資料平臺(Ali-HBASE和X-Pack Spark)的完整時空地理資訊雲化管理解決方案。

HBase Ganos是為PB級分散式、大規模時空資料管理而生,主打NoSQL時空大資料處理能力,相容HBase、Spark、GeoMesa、GeoServer等廣泛開源生態,內建了高效的時空索引演算法、空間拓撲幾何演算法、遙感影像處理演算法等,可廣泛應用於空間/時空/遙感大資料儲存、查詢、分析與資料探勘場景。

IMG_1014.PNG

2、新版本重要特性

全球首發時空柵格引擎雲服務,支撐航天航空遙感雲端計算與智慧化發展

對地觀測技術的快速發展正促使遙感應用走向線上化和服務化。全新的雲上時空柵格資料引擎面向未來遙感大資料雲端智慧分析計算需求而設計,採用了極為靈活的時空資料組織方式,在保留多時相、多解析度且每一寸畫素光譜資訊的同時,兼顧傳統遙感應用的快速瀏覽需求。引擎內建的ETL工具可以打通OSS、HBase、POLARDB/PG等資料儲存產品,支援柵格資料的全自動化快速入庫,包含投影轉換、資料分塊和索引建立等。柵格資料儲存組織支援多種模式,常用的包括全球標準格網剖分和本地座標系格網剖分(見下圖)。

IMG_1062.PNG

此外,2.5版本釋出全新的時空Cover資料模型。Cover模型物理上維護每一幅遙感影像的獨立性,同時支援海量遙感影像基於時相和空間條件的動態拼接,邏輯上實時生成時空動態一張圖,為遙感智慧化分析計算應用提供強大資料模型支撐。

IMG_1063.PNG

與X-Pack Spark、 GeoTools整合,提供相容OGC標準的空間資料訪問介面

2.5版本提供了更全面的訪問方式,包括基於GeoTools API的訪問、支援GeoJson作為時空資料結構的REST API、以及空間GeoSQL支援,可最大程度相容不同使用者需求。其中,Ganos Spark模組提供了一系列UDF空間運算元實現了基於OGC標準的GeoSQL的空間資料查詢,例如:

7d8f3636f5a843dfe43c55915e260c9707cdd4df.png

這些空間運算元主要包括Geometry Constructors函式、Geometry Accessors函式、Geometry Cast函式、Geometry Editors函式、Geometry Outputs函式、Spatial Relationships函式以及Geometry Processing函式等,運算元功能將按需擴充套件。

IMG_1064.PNG

支援時空幾何、時空軌跡資料建模,成本、效能獲得綜合最佳化

2.5版本支援豐富的時空幾何資料、時空軌跡資料建模,資料型別包括點、線、面等時空物件。在此基礎上,還提供了完備的時空模型操作能力,既可以支援空間範圍查詢,也支援“時間+空間”的多維查詢。 
在效能最佳化方面,採用了空間謂詞下推技術,查詢時可將空間過濾條件下推到儲存層執行,從而減少I/O開銷,降低查詢時延。另外,結合阿里雲X-Pack可構建強大的時空分析平臺,藉助空間分割槽、分割槽索引、基於記憶體索引以及Fast Spatial Jion等效能最佳化手段,可大幅提高查詢分析效能。

在成本控制方面,針對時空資料寫入膨脹的問題,新版本在索引生成、時空模型編碼、冷熱分離儲存等方面進行了全面最佳化。在索引生成階段,對索引的控制力度更細,可按需建立索引;在時空編碼方面,使用了TWKB編碼,同時使用者可指定寫入資料的精度,減少資料的儲存長度;在冷熱分離儲存方面,藉助阿里雲OSS儲存,可使得儲存成本下降70%以上。

3、典型應用場景

航天航空遙感應用

對地觀測、商業航天、無人機測繪等快速發展,積累了大量的遙感影像資料。資料規模的不斷擴大給資料時空化組織以及大資料和智慧化應用帶來了極大挑戰。未來需要探索資料線上、應用能力線上、使用者購買服務模式。Ganos可以為雲平臺商、衛星資料廠商、平臺服務商等構建遙感智慧化大資料雲平臺提供時空雲基礎設施支撐,解決最底層關鍵技術,並在傳統編目化管理和切片化應用基礎上獲得全新架構的快速演進,從而在遙感智慧化浪潮中聚焦業務並獲得先機。

網際網路出行

網際網路出行涉及到運力的排程、拼車、供需預測、熱力圖等業務。以供需預測為例,基於對歷史軌跡資料的分析,並結合實時訂單資料,預測當前訂單密集區域的分佈,提高接單機率並減少司機空駛時間。這背後涉及到大量時空型資料和業務資訊的快速讀取,並結合業務演算法進行預測,利用HBase Ganos可有力支援該業務場景。

感測網與實時GIS

在環保、氣象、水利、航海航空監測等領域,需要透過各種感測器獲取天、空、地、海不同地理現象、事件、要素的全生命週期多尺度監測指標,比如汙染監測、水位監測、降雨量監測、航標監測等。HBase Ganos可以為構建實時GIS大資料應用提供穩定、可靠、彈性、免運維的PaaS服務,為地理國情常態化監測和智慧城市建設提供基礎平臺。

車聯網

海量的車輛終端在不斷地產生軌跡資料,軌跡資料包含了時間和空間位置。利用HBase Ganos,實時監測車輛的行駛軌跡、是否偏航、是否進入某個限制區域等。除了實時監控外,還可以進行時空查詢,如查詢某段時間的軌跡,某段時間進入該區域的車輛等。結合大資料分析框架(如Spark)還可以進行穿越分析、區域分佈熱力圖等。

智慧物流與外賣遞送

在物流與外賣等領域,需要實時監控車輛、騎手的位置,以便進行可靠的時間預測等服務。車輛和騎手的位置需要實時上報,雲端需要處理高併發寫入並進行實時路徑規劃、偏航監測等計算,背後都需要大量的時空計算。

4、典型案例&架構

航海船舶大資料平臺

場景:全球AIS船舶實時位置資料,每天上億條軌跡寫入,要求軌跡時空/時序查詢秒級響應,具體包括:
• 監管區域實時地理圍欄判斷;
• 軌跡區域回放(指定區域+指定時間段);
• 軌跡回放(指定時間段查詢)。
架構說明:
• AIS等資料經過Spark平臺清洗、融合完成後,構建數倉;
• 對外提供查詢的資料儲存到HBase Ganos中,可供前端各類應用進行時空查詢(如地理圍欄、軌跡回放等);
• 整體系統的查詢時間在毫秒級,資料清洗在分鐘級。

IMG_1065.PNG

位置服務平臺

場景:實時採集車輛裝置軌跡,40萬+終端裝置,3萬+軌跡點/秒峰值;對外提供實時位置查詢、地理圍欄、軌跡相似度判斷等服務;
架構說明:
• 利用POLARDB Ganos的MOD移動物件資料庫儲存業務、GIS和行程軌跡現勢資料,而HBase Ganos保留所有歷史軌跡庫;
• 當歷史資料量較大時,可透過冷資料自動轉儲功能,將資料存放到OSS中,減少70%以上的成本;
• 百億量級的軌跡查詢(比如查詢某段時間、某空間範圍內經過的軌跡)只需亞秒級;
與X-Pack Spark平臺無縫銜接,可以提供類似軌跡相似度、OD分析等強大功能。
IMG_1066.PNG

遙感大資料管理與智慧服務平臺

場景:完全線上化大規模遙感影像資料入庫、查詢、分析和AI智慧服務。
痛點:
• 遙感影像資料體量大且增量快,儲存、計算擴充套件不靈活;
• 以原始檔案為單位管理模式粗放,資料結構不統一,上層呼叫複雜;
• 傳統靜態切片方式管理顯示速度快,但光譜資訊丟失,無法有效支撐實時分析場景和AI場景;
• 多源空間資料融合查詢分析困難。
架構說明:
• 原始資料採用OSS高價效比儲存,冷熱分離;
• 影像資料庫採用SQL+NoSQL構建時空序列影像,容量無上限,儲存與計算分離,極致彈性;
• 資料完全結構化儲存和組織,保留原始像元資訊,有效支撐各類分析計算場景;
• 與X-Pack Spark整合,ETL與多源空間資料分析處理更便捷,可進一步整合阿里天巡平臺,實現遙感AI能力整合。

IMG_1067.PNG

️本文作者:Roin

原文連結

本文為雲棲社群原創內容,未經允許不得轉載。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69947441/viewspace-2656729/,如需轉載,請註明出處,否則將追究法律責任。

相關文章