JUST京東城市時空資料引擎2.0架構實踐
眾所周知,時空資料更新頻率高、資料體量大、結構複雜,蘊含著豐富的資訊,能夠應用於各種城市應用,解決傳統方案接不住、查不快、用不好、看不清的問題。
首先,城市中80%的資料都與空間相關,而且源源不斷地產生,傳統資料平臺應對高頻海量時空資料捉襟見肘,無能為力;其次,傳統平臺面向的是ID聚合場景,而城市應用往往需要基於時空維度對資料進行聚合;
然後,時空資料具有空間維度上的層次性、鄰近性,時間維度上的週期性、趨勢性等特點,通用挖掘演算法難以直接用於時空資料中;
最後,傳統的GIS引擎面向的是靜態資料為主、疊加少量動態資料的場景,當應對動態為主的海量時空資料,傳統GIS引擎無法與底層計算平臺進行分析聯動,也無法清楚地展示出資料的隱含資訊。
在剛剛結束的DTCC2021大會上,京東城市(北京)數字科技有限公司架構師劉鈞文發表了《JUST京東城市時空資料引擎2.0架構實踐》的主題演講,並分享了他對時空資料的理解和實踐經驗。
▲京東城市(北京)數字科技有限公司架構師劉鈞文
嘉賓介紹: 劉鈞文, 哈工大本科和碩士,京東城市時空資料組(即JUST團隊)2.0引擎架構師,京東城市研究院研究員,負責時空資料平臺架構設計及時空索引與分散式相結合研究等工作。
2018年12月加入京東城市,經歷了JUST京東城市時空資料平臺從零到一再到廣泛對外部署的全過程,並在各個階段的架構選型以及實現當中都起到了關鍵作用。現為中國計算機學會(CCF)會員,在資料庫頂會中(例如ICDE)發表論文數篇,提交專利多項。其主要參與的JUST京東城市時空資料引擎在多個國家級專案(例如:雄安塊資料平臺、南通市域治理現代化平臺等)中成功落地。
IT168:傳統資料庫對於管理海量的時空資料有哪些不足之處?
劉鈞文:傳統資料庫在一些傳統金融領域取得了巨大的成功,同時也證明了自身的能力。但是在時空資料領域,很多時候是無法滿足新需求的,主要可以歸結為四個方面:
其一,傳統資料庫的擴充套件性不足,無法支援海量時空資料管理的需求;其二,傳統資料庫對時空資料的查詢和分析操作支援不足;其三,傳統資料庫中沒有時空資料模型;其四,傳統資料庫對異構資料的支援和綜合處理能力無法滿足需求。
IT168:能否分享一下,我們們時空資料庫的技術優勢和典型業務場景。在實踐中,如何為業務賦能?帶來了哪些價值?
劉鈞文:京東城市時空資料引擎JUST採用先進的資料建模方法、資料儲存技術、分散式索引技術和分析技術,預置了多種有效的時空挖掘演算法,研發自有分散式GIS引擎,提供了集資料儲存、查詢、分析、視覺化一體的解決方案,具有接得穩、查得快、用得巧、看得深的特點,能夠幫助人們便捷高效地管理海量時空資料。
值得一提的是,JUST團隊連續兩次獲得了ACM SIGSPATIAL十年影響力大獎,發表了國際頂級論文20餘篇,申請了專利30餘項。目前,JUST已在多個智慧城市專案成功落地,也在新冠防疫中也發揮了重要作用。
京東城市時空資料引擎的技術優勢在於快捷而高效地管理海量的時空資料,而且在其中也內建了很多時空分析的運算元,使用者可以非常方便地使用它們來提供城市裡面的時空服務。
我們典型的業務場景就是與軌跡和路網相關的一系列城市級別的應用。在實踐中,我們主要是基於我們的時空分析能力,為一些政府和企業降本增效。
例如,在疫情防控中,基於我們的資料管理和資料探勘能力,在海量的人群資料探勘出了與確診病人有過密切接觸的那些人群。降低了人工排查的成本,幫助了政府機構在疫情最嚴重的那段時間更好地控制好疫情。
IT168:如何設計儲存引擎、查詢引擎、資料載入等系統來更好的滿足大規模時空資料所提出的新需求?
劉鈞文:首先,時空資料的結構與以往的資料有很大的差別,比如說時空的多維度,還有不同的業務場景,都需要不同模組進行定製化的適配。
第二,時空資料的查詢和分析都是比較特殊的,很多分析過程在傳統元件中都不支援,需要進行大量的補充。
第三,時空資料在智慧城市這個領域裡面用到的會多一些,在這裡,解決的很多問題都是要與具體行業深度結合的,因此如何與行業知識進行融合同樣也是一個非常重要的需求。
IT168:您如何看待時空資料庫的未來發展和競爭格局?
劉鈞文:目前時空資料庫的未來發展會呈現橫向和縱向兩條線索來進行。
從橫向上來看,智慧城市的建設需要越來越多的資料模型進行參與,因此不同行業內的特徵資料也會融入到大的時空資料盤子裡面來,比如說建築行業的BIM資料,因此時空資料庫後面會相容越來越多的資料型別,服務更多的場景。
從縱向上來看,前期的時空資料庫建設依然是依託於經典的技術架構而來的,但是隨著技術的發展,它的結構也在變化。
其中包含了內因和外因,內因主要是時空資料本身需要更加整合,更加高效,也要更加隱私,因此也會與如今的新硬體等技術進行融合;外因主要是隨著雲端計算的發展,越來越多的應用被架設在雲上,因此雲原生的風潮也會影響到時空資料庫的發展。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545813/viewspace-2839024/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 京東城市時空資料引擎JUST亮相中國資料庫技術大會資料庫
- 京東實時資料產品應用實踐
- 大資料:美團酒旅實時資料規則引擎應用實踐大資料
- 京東物流實時風控實踐
- 基於 Apache Flink 的實時計算資料流業務引擎在京東零售的實踐和落地Apache
- 守護城市安全:時空資料與深度學習深度學習
- 資料服務化在京東的實踐
- 《Greenplum構建實時資料倉儲實踐》簡介
- B 站構建實時資料湖的探索和實踐
- Mysql資料實時同步實踐MySql
- Apache Hudi 在 B 站構建實時資料湖的實踐Apache
- 時空資料庫實踐(含紐約TAXI資料透視分析)-PostGIS+TimescaleDB=>PostgreSQL資料庫SQL
- 京東零售資料資產能力升級與實踐
- PostgreSQL技術週刊第12期:PostgreSQL時空資料排程實踐SQL
- 京東零售大資料雲原生平臺化實踐大資料
- PB級資料實時查詢,滴滴Elasticsearch多叢集架構實踐Elasticsearch架構
- 火山引擎DataLeap資料血緣技術建設實踐
- TiKV 在京東雲物件儲存後設資料管理的實踐物件
- 城市大腦頂層設計:構建智慧城市的新引擎
- 京東APP百億級商品與車關係資料檢索實踐 | 京東雲技術團隊APP
- Apache Doris在京東搜尋實時OLAP中的應用實踐Apache
- 火山引擎雲原生大資料在金融行業的實踐大資料行業
- 資料結構-基本概念和時空複雜度資料結構複雜度
- 鬥魚資料庫混合雲架構實踐資料庫架構
- 視訊:豆瓣資料架構實踐DX架構
- CoreData實踐(二)——設計資料結構資料結構
- 線上資料遷移,數字化時代的必修課 —— 京東雲資料遷移實踐
- PostgreSQL業務資料質量實時監控實踐SQL
- 滴普科技馮森 FastData DLink 實時湖倉引擎架構設計與落地實踐AST架構
- 滴普科技馮森:FastData DLink實時湖倉引擎架構設計與落地實踐AST架構
- 實時營銷引擎在vivo營銷自動化中的實踐 | 引擎篇04
- 360助力蘇州打造“城市網路空間安全評價指標體系”實踐標杆城市指標
- 實時工業大資料產品實踐——上汽集團資料湖大資料
- 高精地圖資料應用分發引擎建設實踐地圖
- 貨拉拉大資料離線混合引擎服務建設實踐大資料
- 美圖大資料平臺架構實踐大資料架構
- 資料結構&演算法實踐—堆排序資料結構演算法排序
- 資料結構&演算法實踐—Bogo排序資料結構演算法Go排序