某B2B營銷公司圖資料庫國產化實踐

qing_yun發表於2024-02-06

本篇案例來自我們對某B2B營銷公司的嘉賓採訪,本文為《圖資料庫選型指南》選題的系列文章之一,在此特別感謝受訪嘉賓劉老師對我們的支援。

本文將重點討論該營銷公司在圖資料庫方面的需求,選型時考慮的因素以及建議等,希望能為大家帶來啟發。

圖資料庫是關係型資料庫的補充

一個公司可能會用到多種資料庫,該嘉賓表示,基本上每個公司都會用到關係型資料庫,但是在一些複雜關聯關係查詢時,關係型資料庫的效能可能會比較差,圖資料庫是關係型資料庫的很好的補充。此外,圖資料庫可以整合到大資料平臺和分散式系統中,來處理大規模的圖資料和一些高併發負載。整體來看,圖資料庫和其他型別的資料庫還是一個相互補充和協作的關係。

圖資料庫在B2B營銷的一個典型應用場景是潛在客戶推薦,幫助企業分析已有客戶資訊,構建客戶畫像,利用圖資料庫的相似性演算法推薦與現有客戶類似的潛在客戶。這可以幫助企業提高獲客能力,尤其是在擴充新行業、新領域時,會有很大的幫助。

圖資料庫主要用來表達實體和實體之間的關係,該B2B營銷公司的實體主要圍繞企業的一些相關資訊。包括企業的人、企業本身,企業下面的門店,以及企業招投標資訊等與企業相關的資訊。由於需求明確,以及公司對圖資料庫有較深的理解,該公司成立不久就應用了圖資料庫構建企業圖譜。

起初,該公司選擇了開源圖資料庫ArrangoDB,ArrangoDB是一個多模圖資料庫。隨著業務增長,ArrangoDB已經無法滿足其需求,該公司選擇了某國產開源圖資料庫進行升級。

選型:圖資料庫選型關注哪些因素?

該B2B營銷公司在進行圖資料庫選型時,最關注以下三個方面。

一是,成熟度。看社群的支援和維護程度,文件的完善程度等,比如ArrangoDB社群已經不是一個特別活躍的社群。它的一些文件、維護支援都不是特別好。

二是,周邊生態包括一些工具的支援。圖資料庫周邊生態工具和整合支援也特別重要,比如是否可以提供視覺化工具,是否有一些開發者工具,以及與其他工具和技術的整合能力,這樣能提高開發和使用的效率。

三是,效能、功能等方面,比如擴充套件性等。

選型建議:如何選擇一個合適的圖資料庫?

要選擇一個合適的圖資料並不容易,該嘉賓給出了以下建議:

首先,要進行需求調研,包括對資料結構、查詢需求、效能等需求的調研。明確需求才能識別出來要選什麼樣的圖資料庫,因為不同圖資料庫存在差異。有時候調研可能會發現,圖資料庫未必是一個最好的選擇,關係型資料庫就能解決很多的問題,此時,為了降低複雜度,可能都沒有必要用圖資料庫。

二是,考慮資料模型和查詢語言。現在圖資料庫的查詢語言並不像關係型資料庫那樣統一,圖資料庫查詢語言並不標準,雖然標準圖查詢語言就要釋出,但是目前還是各自為戰,查詢語言在具體應用的時候是比較關鍵的,需要重點關注。

三是,定好需求、資料模型和查詢語言後,做一個小範圍資料的測試,綜合評估一下圖資料庫的效能、功能還有易用性。大家往往會比較關注效能,但是有的功能如果不能滿足,還需要進行二次開發,二次開發帶來的成本很高,可能比效能問題帶來的成本還要高。

未來展望:如何與大模型結合?

目前,該B2B營銷公司並沒有將所有的資料錄入到圖資料庫中,只錄入了部分實體、關係。未來,可能隨著業務發展的需要,會把越來越多的資料錄入到圖裡。另一方面,會探索與大資料平臺相結合,利用不同的演算法進行資料探勘,挖掘更多的資料價值。

此外,隨著AIGC的火熱,大家也在探索圖資料庫與大模型的結合點。該嘉賓指出,透過圖資料庫構建的知識圖譜,是能夠做一些精準查詢的知識庫,在查詢特定知識的時候,知識圖譜的精度普遍要比通用大模型更優。知識圖譜是企業高質量的私有資料,透過知識圖譜可以對大模型進行微調和訓練,最終出來的垂直領域的行業大模型效果會更好。知識圖譜能給大模型提供價值,也不會被大模型替代,圖與大模型的結合值得探索。

來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/69925873/viewspace-3006406/,如需轉載,請註明出處,否則將追究法律責任。

相關文章