圖資料和知識圖譜,數字化轉型的新引擎

星環科技發表於2021-12-06

圖技術使一切產生關聯(Graph relates everything)。Gartner在 “2021年十大資料和分析趨勢”中預言, 到 2025 年,圖技術(graph technologies)將用於80%資料與分析的創新,高於2021年的10%,圖技術將會促進整個組織的快速決策。

圖資料和知識圖譜,數字化轉型的新引擎

在圖技術市場,圖資料庫和知識圖譜平臺逐漸走向一體化,為使用者的圖資料和知識圖譜應用提供一體化的解決方案。 星環科技自主研發的圖資料庫和知識圖譜平臺,已大量應用於金融、公共安全、營銷等領域,為金融風控、產業鏈/擔保鏈/供應鏈上下游分析、智慧投研、可疑團夥發現、產品或服務的精準推薦、社交網路分析、輿情監控、疫情溯源與防控等場景提供堅實的技術支撐。



01

圖技術將是企業必不可少的資料基礎設施

Gartner預測,圖技術已成為現代資料和分析的基礎, 能夠增強並改進使用者協作、機器學習模型和可解釋的人工智慧。


未來,圖資料和知識圖譜將成為企業必不可少的新型資料基礎設施,在企業的數字化中發揮不可替代的作用。

目前,資料之間的網狀關係讓圖資料庫與傳統的關係型資料庫的計算方式產生了比較大的差異,傳統的關係型資料庫儲存的資料均為結構化資料, 而圖資料庫儲存的是半結構化資料,可以儲存異構的節點和邊,更貼近於現實世界中的模型。

傳統的關係型資料庫是以表格資訊計算每個資料之後得出結論, 而圖資料庫深度關聯資料之間的關係,讓分析者能更多維度地觀察和分析資料,讓資料分析效率更高,洞察更深層的資料價值。

關係型資料庫通過JOIN來處理多層關聯關係分析,在資料量較大時存在嚴重效能問題,無法適應圖模型的相關應用,這也是為什麼一些圖資料的處理用傳統資料庫計算需要耗費很長時間,而圖資料庫則可以將處理時間大幅度縮短。

分隔 “圖資料庫+知識圖譜” 組合,圖應用整個通路是無法跑通的,是殘缺的。圖資料庫+知識圖譜融合的越緊密,才能在 “ 實體”、“屬性” 的資料分析,“關聯關係” 的存算分析,“語義” 的表示和存算分析,“知識” 的存算分析和推理等四個層次發揮更大的功效。

與其他的技術相比,圖資料庫和知識圖譜可以解決其他技術難以解決的問題,如知識和資料的孤島問題, 圖資料庫和知識圖譜善於解決跨領域或跨部門的問題的分析、建模、處置、研究。如人口普查會涉及社會學、經濟學等不同的領域,需要把多種多樣的知識進行彙總,形成知識庫。知識庫就是資訊推理和抽取,還要進行資訊融合,甚至要做一些推測,比如人口的組成,人口對今後產業的影響,甚至是分析知識庫來輔助決策。而利用圖資料庫和知識圖譜可以很好地打破領域和部門的界限。

金融事件有多種型別的資訊,包括交易側的資訊、客戶資訊等。這種資訊雖然不是知識孤島,但資訊量大,過於冗雜。那麼,如何剔除繁冗資訊來提取出主幹訊號?如何進行資訊的篩選、融合?圖資料庫和知識圖譜作為一個新興的工具和技術,就能很好地解決這樣的問題。

圖資料庫和知識圖譜對於推理和決策能提供強有力的支撐。知識圖譜融合多方的資訊來源,以及多方的可能性,去做推理和更精準的決策,是別的技術暫時無法替代的。

星環科技利用自研的圖資料庫與知識圖譜平臺,已在多個專案上支援客戶的複雜關係分析場景, 降低圖分析門檻,提升視覺化效果,更好為業務場景服務。


02

星環科技提供一體化的圖資料庫和知識圖譜平臺

星環科技通過自主研發、創造性地將新知識、新技術應用於各類服務領域, 幫助企業構建圖資料庫、知識圖譜平臺新基礎設施,推動產業升級與發展。

星環科技在研發圖資料庫之初,目標就是為了解決客戶無法查詢千億級大圖的問題。隨著星環分散式圖資料庫StellarDB產品的不斷髮展與升級,客戶不僅可以穩定為上層業務提供查詢業務,而且又降低叢集節點數量,以及資料匯入成本。

在國內市場,星環科技的圖資料庫和知識圖譜平臺,經過大量使用者的驗證,擁有眾多優勢。其中,星環分散式圖資料庫StellarDB由星環科技自主研發, 擁有完整自主產權、多項專利和信通院的認證證照,同時又具備完整的企業級功能,如使用者認證、許可權管理、資料熱備份、資源控制等,具備高效能的圖查詢能力,以及近20種常見圖演算法。

此外,星環圖資料庫StellarDB同時也 支援SQL操作和圖資料查詢,可同時操作結構化資料和圖資料。

星環科技的知識圖譜平臺 Sophon KG 可直觀地展現資料和知識間的關係,並可進一步疊加演算法,進行深度的資訊挖掘。 它結合了有監督、無監督和半監督學習,適用於各種機器學習場景,是深度學習與高維特徵的完美融合,也是傳統重特徵機器學習應用的突破。

Sophon KG 依託於 Sophon Base基礎平臺和星環分散式圖資料庫StellarDB,集知識的獲取、融合、儲存、計算以及應用為一體;支援拖曳式圖譜構建、分散式圖譜儲存、分散式圖譜計算以及互動式圖譜分析等功能;結合了圖計算和 NLP 能力的知識圖譜產品,構建好資料藍圖,生成圖譜後,使用者可以在知識圖譜平臺中對圖網路進行多種圖計算操作, 如挖掘高危使用者、尋找異常社群等,用於金融等領域中的反欺詐場景。


星環科技StellarDB作為一款自主研發多年的分散式圖資料庫,其產品能力已通過中國資訊通訊研究院《圖資料庫基礎能力評測》測試,並擁有多項專利。在國產化適配 方面,可相容銀河麒麟、中標麒麟等國產作業系統。

產品榮譽方面,曾獲2021第六屆融城杯金融科技創新十佳案例、第二屆浦發銀行國際金融科技創新大賽金獎、2020服貿會科技創新服務示範案例,並作為增強資料分析代表入圍Gartner《Hype Cycle for ICT in China, 2021》。

標準參編方面,星環科技產品研發團隊參與編寫了中國電子技術標準化研究院出版的《知識圖譜標準化白皮書》、《知識圖譜選型與實施指南》、IEEE-P2907課題《資訊科技 人工智慧 知識圖譜技術框架》(國標計劃號20192137-T-469),不斷為行業標準制定建言獻策。


03

星環科技引領金融等行業圖計算應用

目前,星環科技圖資料庫和知識圖譜平臺在多個行業都得到應用,也出現一些典型的應用場景。

在金融行業,交易類相關的資金鍊路分析、反欺詐、反洗錢等都是圖資料庫適合的場景; 在公共安全領域,社交關係的推導和關聯,可以尋找隱藏的社會關係; 在工業領域,裝置之間相互連線形成網路,通過圖資料庫可以快速分析關鍵裝置等。

星環科技基於圖資料庫和知識圖譜平臺,通過互動式圖譜分析工具、分散式圖演算法、行業圖譜模板庫,助力金融監管機構、交易所、銀行、證券等金融機構構建大宗商品、政策、債券、銀行對公業務、證券 “黑嘴識別” 輿情等企業級智慧知識圖譜, 實現反洗錢、反欺詐、高風險主體及市場識別違規行為,藉助圖譜技術發現專家規則及傳統指標無法識別的風險,明確風險傳導路徑,提高風控精度和風控水平。

多年來,星環科技將人工智慧技術與行業應用、場景驅動有效結合, 在公共安全場景,對公安大資料、欺詐和洗錢案例的相關金融資料等進行文字語義分析、知識抽取、知識融合等操作,將人、事物、組織、地點等實體抽取出來,同時根據抽取出的實體間一對一、一對多或多對多的關係等對各實體進行關聯,從而構建一張具有多維度多層網路結構的犯罪偵查圖譜。

醫療衛生場景,綜合海量多源的就醫、出行、社交等相關資料,構建COVID-19疫情圖譜,並利用圖計算、圖譜挖掘和圖嵌入演算法,瞭解疫情現狀及時空動態變化,從而實現關鍵人物的追蹤和傳播途徑的挖掘。

在商業智慧場景,利用社交網路、使用者/物品屬性、多媒體資訊、權威經驗和規則等建立本體模型並抽取相關實體和關係,實現各實體間豐富的語義關聯,並結合推薦演算法,實現千人千面的推薦。

圖並沒有特定的行業限制,所有行為都可以用圖來表達。 圖資料庫與知識圖譜一體化開啟圖技術應用的一道大門,會為使用者資料價值發現帶來更好的體驗。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69994106/viewspace-2845914/,如需轉載,請註明出處,否則將追究法律責任。

相關文章