JUST京東城市時空資料引擎2.0架構實踐
眾所周知,時空資料更新頻率高、資料體量大、結構複雜,蘊含著豐富的資訊,能夠應用於各種城市應用,解決傳統方案接不住、查不快、用不好、看不清的問題。
首先,城市中80%的資料都與空間相關,而且源源不斷地產生,傳統資料平臺應對高頻海量時空資料捉襟見肘,無能為力;其次,傳統平臺面向的是ID聚合場景,而城市應用往往需要基於時空維度對資料進行聚合;
然後,時空資料具有空間維度上的層次性、鄰近性,時間維度上的週期性、趨勢性等特點,通用挖掘演算法難以直接用於時空資料中;
最後,傳統的GIS引擎面向的是靜態資料為主、疊加少量動態資料的場景,當應對動態為主的海量時空資料,傳統GIS引擎無法與底層計算平臺進行分析聯動,也無法清楚地展示出資料的隱含資訊。
在剛剛結束的DTCC2021大會上,京東城市(北京)數字科技有限公司架構師劉鈞文發表了《JUST京東城市時空資料引擎2.0架構實踐》的主題演講,並分享了他對時空資料的理解和實踐經驗。
▲京東城市(北京)數字科技有限公司架構師劉鈞文
嘉賓介紹: 劉鈞文, 哈工大本科和碩士,京東城市時空資料組(即JUST團隊)2.0引擎架構師,京東城市研究院研究員,負責時空資料平臺架構設計及時空索引與分散式相結合研究等工作。
2018年12月加入京東城市,經歷了JUST京東城市時空資料平臺從零到一再到廣泛對外部署的全過程,並在各個階段的架構選型以及實現當中都起到了關鍵作用。現為中國計算機學會(CCF)會員,在資料庫頂會中(例如ICDE)發表論文數篇,提交專利多項。其主要參與的JUST京東城市時空資料引擎在多個國家級專案(例如:雄安塊資料平臺、南通市域治理現代化平臺等)中成功落地。
IT168:傳統資料庫對於管理海量的時空資料有哪些不足之處?
劉鈞文:傳統資料庫在一些傳統金融領域取得了巨大的成功,同時也證明了自身的能力。但是在時空資料領域,很多時候是無法滿足新需求的,主要可以歸結為四個方面:
其一,傳統資料庫的擴充套件性不足,無法支援海量時空資料管理的需求;其二,傳統資料庫對時空資料的查詢和分析操作支援不足;其三,傳統資料庫中沒有時空資料模型;其四,傳統資料庫對異構資料的支援和綜合處理能力無法滿足需求。
IT168:能否分享一下,我們們時空資料庫的技術優勢和典型業務場景。在實踐中,如何為業務賦能?帶來了哪些價值?
劉鈞文:京東城市時空資料引擎JUST採用先進的資料建模方法、資料儲存技術、分散式索引技術和分析技術,預置了多種有效的時空挖掘演算法,研發自有分散式GIS引擎,提供了集資料儲存、查詢、分析、視覺化一體的解決方案,具有接得穩、查得快、用得巧、看得深的特點,能夠幫助人們便捷高效地管理海量時空資料。
值得一提的是,JUST團隊連續兩次獲得了ACM SIGSPATIAL十年影響力大獎,發表了國際頂級論文20餘篇,申請了專利30餘項。目前,JUST已在多個智慧城市專案成功落地,也在新冠防疫中也發揮了重要作用。
京東城市時空資料引擎的技術優勢在於快捷而高效地管理海量的時空資料,而且在其中也內建了很多時空分析的運算元,使用者可以非常方便地使用它們來提供城市裡面的時空服務。
我們典型的業務場景就是與軌跡和路網相關的一系列城市級別的應用。在實踐中,我們主要是基於我們的時空分析能力,為一些政府和企業降本增效。
例如,在疫情防控中,基於我們的資料管理和資料探勘能力,在海量的人群資料探勘出了與確診病人有過密切接觸的那些人群。降低了人工排查的成本,幫助了政府機構在疫情最嚴重的那段時間更好地控制好疫情。
IT168:如何設計儲存引擎、查詢引擎、資料載入等系統來更好的滿足大規模時空資料所提出的新需求?
劉鈞文:首先,時空資料的結構與以往的資料有很大的差別,比如說時空的多維度,還有不同的業務場景,都需要不同模組進行定製化的適配。
第二,時空資料的查詢和分析都是比較特殊的,很多分析過程在傳統元件中都不支援,需要進行大量的補充。
第三,時空資料在智慧城市這個領域裡面用到的會多一些,在這裡,解決的很多問題都是要與具體行業深度結合的,因此如何與行業知識進行融合同樣也是一個非常重要的需求。
IT168:您如何看待時空資料庫的未來發展和競爭格局?
劉鈞文:目前時空資料庫的未來發展會呈現橫向和縱向兩條線索來進行。
從橫向上來看,智慧城市的建設需要越來越多的資料模型進行參與,因此不同行業內的特徵資料也會融入到大的時空資料盤子裡面來,比如說建築行業的BIM資料,因此時空資料庫後面會相容越來越多的資料型別,服務更多的場景。
從縱向上來看,前期的時空資料庫建設依然是依託於經典的技術架構而來的,但是隨著技術的發展,它的結構也在變化。
其中包含了內因和外因,內因主要是時空資料本身需要更加整合,更加高效,也要更加隱私,因此也會與如今的新硬體等技術進行融合;外因主要是隨著雲端計算的發展,越來越多的應用被架設在雲上,因此雲原生的風潮也會影響到時空資料庫的發展。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545813/viewspace-2839024/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 京東城市時空資料引擎JUST亮相中國資料庫技術大會資料庫
- 京東實時資料產品應用實踐
- 京東物流實時風控實踐
- 京東零售資料資產能力升級與實踐
- 線上資料遷移,數字化時代的必修課 —— 京東雲資料遷移實踐
- 京東APP百億級商品與車關係資料檢索實踐 | 京東雲技術團隊APP
- 京東零售大資料雲原生平臺化實踐大資料
- 大資料:美團酒旅實時資料規則引擎應用實踐大資料
- 京東雲Kubernetes叢集最佳實踐
- 京東大資料:2019年京東618首日四線及以下城市下單金額同比增108%大資料
- 墨天輪訪談 | 京東雲曲藝偉:京東零售核心業務背後的資料庫實踐資料庫
- 乾貨 | 京東雲部署Wordpress最佳實踐
- 京東到家的持續整合實踐之路
- 京東物流常態化壓測實踐
- 京東購物小程式cookie方案實踐Cookie
- 京東LBS推薦演算法實踐演算法
- 京東短網址高可用提升最佳實踐 | 京東雲技術團隊
- 基於 Apache Flink 的實時計算資料流業務引擎在京東零售的實踐和落地Apache
- 京東物流資料同步平臺“資料蜂巢”架構演進之路架構
- 《Greenplum構建實時資料倉儲實踐》簡介
- 京東技術中臺的Flutter實踐之路Flutter
- 京東技術中臺Flutter實踐之路(二)Flutter
- 京東短網址高可用提升最佳實踐
- 京東商品詳情介面,京東商品優惠券介面,京東商品分析資料介面,京東API介面封裝程式碼API封裝
- 京東雲開發者|提高IT運維效率,深度解讀京東雲AIOps落地實踐運維AI
- 京東數科:2020年京東區塊鏈技術實踐白皮書(附下載)區塊鏈
- B 站構建實時資料湖的探索和實踐
- 京東:2020青年消費資料
- 京東零售在電商搜尋場景下的資料科學實踐資料科學
- 京東推薦系統架構揭祕:大資料時代下的智慧化改造架構大資料
- Mysql資料實時同步實踐MySql
- 達達埋點遷移京東子午線實踐
- 京東 App適配 iOS 暗黑模式業務實踐APPiOS模式
- 乾貨 | 京東雲賬號安全管理最佳實踐
- 京東雲TiDB SQL最佳化的最佳實踐TiDBSQL
- 資料服務化在京東的實踐
- Apache Hudi 在 B 站構建實時資料湖的實踐Apache
- 應用實踐——新東方實時數倉實踐