Apache HugeGraph1.0.0 版本正式釋出!

百度安全發表於2023-03-26

摘要:百度安全助力國產資料庫走向國際,與使用者開發者共成長

日前, Apache HugeGraph (incubating) 第一個 Apache Release 版本 1.0.0 目前已正式釋出,基於過去的一年時間裡社群的同學開發了許多實用的新功能,重構多個專案模組並對 ASF 規範進行了全方面的適配和改造,在基金會導師指導下處理了 ASF 開源專案合規性等問題後,此次新版本由 30+ 位 Contributors 貢獻了超過 270 個 Pull Request,於 2023 年初開始進行首輪 Apache 孵化發版投票,最後經過兩輪調整於 2023 年 3 月正式釋出。

根據DB-Engines資料顯示,自2021年初起開源資料庫的全球部署首次超過商業資料庫,在於單純依靠個別技術或軟體很難構建成熟、完善的產品,而依賴社群生態推進往往能打磨出出色的資料庫產品。並且開源資料庫存在成本優勢、產品豐富度、社群活躍性等方面的優越性,成為驅動資料庫技術和市場變革的重要力量,也是構建國產自研資料庫生態、加速技術迭代、讓國產資料庫走向國際化的重要途徑,得以聚焦安全可控,透過構建數字技術創新體系和數字安全屏障,來為數字中國的發展提供安全可控的底座,實現科技自立自強。

HugeGraph是百度安全於2017年自主研發的國內首個開源圖資料庫,提供了一站式的千億級大規模圖資料的儲存、線上查詢、離線分析能力,廣泛應用於社交網路、廣告推薦、網路安全、金融風控、智慧機器人等場景。HugeGraph 於2018年開源,2022年1月正式透過世界頂級開源組織 Apache 軟體基金會的投票決議,以全票透過的優秀表現正式成為全球首個加入Apache 孵化的圖資料庫專案,同年5月正式入駐Apache開啟孵化,促使國產圖資料庫走向世界,在提升圖資料庫產品開發效率、降低產業應用成本的同時,在人才、生態建設產生深遠的影響,讓更多開發者因此受益。Apache HugeGraph 在百度眾多業務中發揮了重要的作用,尤其是在反黑產、團伙發現等安全風控領域效果顯著,也成為眾多百度合作伙伴的優質之選。截止發版時, HugeGraph 在 GitHub 上具有 2200+ Stars,專案總 Contributors 數量超過 80 名,社群版本下載量超過 2 萬,並有超過 100 個社群使用者、組織在使用,包括網商銀行、網易遊戲、360安全、滴滴、科大訊飛、虎牙直播、CVTE、貨拉拉等,並且以上公司也在與HugeGraph 一道共建開源社群。

Apache HugeGraph 1.0.0 版本在效能和實用性、易用性上做了大量改進和修復,包含 25000+ 行 Pull Request 程式碼變更提交:在系統語言上,圖資料庫與圖計算等元件均升級適配 Java 11,已覆蓋所有子專案 , 並新增支援 Cypher 圖查詢語言,目前已同時支援 Gremlin 與 Cypher 兩大主流圖查詢語言;在伺服器上支援更多內建圖演算法,包括16 個 OLAP 演算法包括:LPA、 Louvain、 PageRank、 Betweenness / Closeness / Eigencentrality Centrality、 RingsDetect 等,2 個 OLTP 演算法,包括:adamic-adar 和 resource-allocation; 在大規模並行圖計算框架 (Computer)上,支援海量圖資料的MPP計算,尤其是擴散性/中心性等空間消耗大的演算法,支援 K8s Standalone (單機)模式,預留 Yarn 介面可實現直接對接;在大資料元件支援上, 新增支援 Flink CDC 資料流式與同步匯入、 Spark 批次匯入資料、支援 Bypass Server 模式,大幅提高了圖資料庫的線上/離線場景下的匯入/匯出/圖遷移效能和方便性;並在易用性上,提供一鍵 Server/Hubble 容器化 Docker 支援,重構整合圖周邊工具鏈為 HugeGraph Toolchain等120 多項細節版本更新。此外,在 2022 年HugeGraph 相繼完成了信創廠商飛騰、麒麟、海光等的相容性認證,併入選了年度 “科創中國” 十大開源創新專案榜單。

HugeGraph 不僅是國內第一個開源的圖資料庫產品,也是唯一捐贈給 ASF的圖系統。它實現了 Apache TinkerPop3 框架相容 Gremlin + Cypher 查詢語言, 具備完善的工具鏈元件,助力使用者輕鬆構建基於圖資料庫之上的應用和產品。HugeGraph 支援百億以上的頂點和邊快速匯入,並提供毫秒級的關聯關係查詢能力(OLTP), 還可與 Hadoop、Spark 等大資料平臺整合以進行資料整合,提供自研的圖計算系統,形成整合的一站式圖服務。圖資料庫能夠支撐新型應用場景的關聯分析業務,根據 Gartner 預測,到 2025 年圖技術將應用於 80% 的資料和分析創新,而圖技術是圖資料庫的核心技術。

百度不僅參與開源生態,也秉承開源開放姿態積極建設開源生態,貢獻了大量的開源專案,如中國首個自主研發開源開放的產業級深度學習平臺飛槳、自動駕駛平臺 Apollo、視覺化渲染庫 Apache ECharts、資料倉儲 Apache Doris 等。一方面是因為百度的技術基因,另一方面也是表達一種開放的態度。百度深深理解在技術領域一枝獨秀不是春,只有擁抱開源,很多技術和產品才能加速發展、拓寬邊界,實現與廣大使用者及開發者共同成長,打造繁榮的開源生態。

相關文章