圖數據和知識圖譜,數字化轉型的新引擎

圖技術使一切產生關聯(Graph relates everything)。Gartner在 「2021年十大數據和分析趨勢」中預言,**到 2025 年,圖技術(graph technologies)將用於80%數據與分析的創新,**高於2021年的10%,圖技術將會促進整個組織的快速決策。

在圖技術市場,圖資料庫和知識圖譜平台逐漸走向一體化,為用戶的圖數據和知識圖譜應用提供一體化的解決方案。**星環科技自主研發的圖資料庫和知識圖譜平台,已大量應用於金融、公共安全、營銷等領域,**為金融風控、產業鏈/擔保鏈/供應鏈上下游分析、智慧投研、可疑團伙發現、產品或服務的精準推薦、社交網路分析、輿情監控、疫情溯源與防控等場景提供堅實的技術支撐。

01

圖技術將是企業必不可少的數據基礎設施

Gartner預測,圖技術已成為現代數據和分析的基礎,能夠增強並改進用戶協作、機器學習模型和可解釋的人工智慧。

未來,圖數據和知識圖譜將成為企業必不可少的新型數據基礎設施,在企業的數字化中發揮不可替代的作用。

目前,數據之間的網狀關係讓圖資料庫與傳統的關係型資料庫的計算方式產生了比較大的差異,傳統的關係型資料庫存儲的數據均為結構化數據,而圖資料庫存儲的是半結構化數據,可以存儲異構的節點和邊,更貼近於現實世界中的模型。

傳統的關係型資料庫是以表格資訊計算每個數據之後得出結論,**而圖資料庫深度關聯數據之間的關係,讓分析者能更多維度地觀察和分析數據,**讓數據分析效率更高,洞察更深層的數據價值。

關係型資料庫通過JOIN來處理多層關聯關係分析,在數據量較大時存在嚴重性能問題,無法適應圖模型的相關應用,這也是為什麼一些圖數據的處理用傳統資料庫計算需要耗費很長時間,而圖資料庫則可以將處理時間大幅度縮短。

分隔 「圖資料庫+知識圖譜」 組合,圖應用整個通路是無法跑通的,是殘缺的。圖資料庫+知識圖譜融合的越緊密,才能在 「實體」、「屬性」 的數據分析,「關聯關係」 的存算分析,「語義」 的表示和存算分析,「知識」 的存算分析和推理等四個層次發揮更大的功效。

與其他的技術相比,圖資料庫和知識圖譜可以解決其他技術難以解決的問題,如知識和數據的孤島問題,**圖資料庫和知識圖譜善於解決跨領域或跨部門的問題的分析、建模、處置、研究。**如人口普查會涉及社會學、經濟學等不同的領域,需要把多種多樣的知識進行匯總,形成知識庫。知識庫就是資訊推理和抽取,還要進行資訊融合,甚至要做一些推測,比如人口的組成,人口對今後產業的影響,甚至是分析知識庫來輔助決策。而利用圖資料庫和知識圖譜可以很好地打破領域和部門的界限。

金融事件有多種類型的資訊,包括交易側的資訊、客戶資訊等。這種資訊雖然不是知識孤島,但資訊量大,過於冗雜。那麼,如何剔除繁冗資訊來提取出主幹訊號?如何進行資訊的篩選、融合?圖資料庫和知識圖譜作為一個新興的工具和技術,就能很好地解決這樣的問題。

圖資料庫和知識圖譜對於推理和決策能提供強有力的支撐。知識圖譜融合多方的資訊來源,以及多方的可能性,去做推理和更精準的決策,是別的技術暫時無法替代的。

星環科技利用自研的圖資料庫與知識圖譜平台,已在多個項目上支援客戶的複雜關係分析場景,**降低圖分析門檻,提升可視化效果,**更好為業務場景服務。

02

星環科技提供一體化的圖資料庫和知識圖譜平台

星環科技通過自主研發、創造性地將新知識、新技術應用於各類服務領域,幫助企業構建圖資料庫、知識圖譜平台新基礎設施,推動產業升級與發展。

星環科技在研發圖資料庫之初,目標就是為了解決客戶無法查詢千億級大圖的問題。隨著星環分散式圖資料庫StellarDB產品的不斷發展與升級,客戶不僅可以穩定為上層業務提供查詢業務,而且又降低集群節點數量,以及數據導入成本。

在中國市場,星環科技的圖資料庫和知識圖譜平台,經過大量用戶的驗證,擁有眾多優勢。其中,星環分散式圖資料庫StellarDB由星環科技自主研發,**擁有完整自主產權、多項專利和信通院的認證證書,同時又具備完整的企業級功能,**如用戶認證、許可權管理、數據熱備份、資源控制等,具備高性能的圖查詢能力,以及近20種常見圖演算法。

此外,星環圖資料庫StellarDB同時也支援SQL操作和圖數據查詢,可同時操作結構化數據和圖數據。

星環科技的知識圖譜平台 Sophon KG 可直觀地展現數據和知識間的關係,並可進一步疊加演算法,進行深度的資訊挖掘。**它結合了有監督、無監督和半監督學習,適用於各種機器學習場景,**是深度學習與高維特徵的完美融合,也是傳統重特徵機器學習應用的突破。

Sophon KG 依託於 Sophon Base基礎平台和星環分散式圖資料庫StellarDB,集知識的獲取、融合、存儲、計算以及應用為一體;支援拖曳式圖譜構建、分散式圖譜存儲、分散式圖譜計算以及互動式圖譜分析等功能;結合了圖計算和 NLP 能力的知識圖譜產品,構建好數據藍圖,生成圖譜後,用戶可以在知識圖譜平台中對圖網路進行多種圖計算操作,如挖掘高危用戶、尋找異常社群等,用於金融等領域中的反欺詐場景。

星環科技StellarDB作為一款自主研發多年的分散式圖資料庫,其產品能力已通過中國資訊通訊研究院《圖資料庫基礎能力評測》測試,並擁有多項專利。在國產化適配方面,可兼容銀河麒麟、中標麒麟等國產作業系統。

**產品榮譽方面,**曾獲2021第六屆融城杯金融科技創新十佳案例、第二屆浦發銀行國際金融科技創新大賽金獎、2020服貿會科技創新服務示範案例,並作為增強數據分析代表入圍Gartner《Hype Cycle for ICT in China, 2021》。

**標準參編方面,**星環科技產品研發團隊參與編寫了中國電子技術標準化研究院出版的《知識圖譜標準化白皮書》、《知識圖譜選型與實施指南》、IEEE-P2907課題《資訊技術 人工智慧 知識圖譜技術框架》(國標計劃號20192137-T-469),不斷為行業標準制定建言獻策。

03

星環科技引領金融等行業圖計算應用

目前,星環科技圖資料庫和知識圖譜平台在多個行業都得到應用,也出現一些典型的應用場景。

**在金融行業,**交易類相關的資金鏈路分析、反欺詐、反洗錢等都是圖資料庫適合的場景;**在公共安全領域,**社交關係的推導和關聯,可以尋找隱藏的社會關係;**在工業領域,**設備之間相互連接形成網路,通過圖資料庫可以快速分析關鍵設備等。

星環科技基於圖資料庫和知識圖譜平台,通過互動式圖譜分析工具、分散式圖演算法、行業圖譜模板庫,助力金融監管機構、交易所、銀行、證券等金融機構構建大宗商品、政策、債券、銀行對公業務、證券 「黑嘴識別」 輿情等企業級智慧知識圖譜,**實現反洗錢、反欺詐、高風險主體及市場識別違規行為,**藉助圖譜技術發現專家規則及傳統指標無法識別的風險,明確風險傳導路徑,提高風控精度和風控水平。

多年來,星環科技將人工智慧技術與行業應用、場景驅動有效結合,**在公共安全場景,**對公安大數據、欺詐和洗錢案例的相關金融數據等進行文本語義分析、知識抽取、知識融合等操作,將人、事物、組織、地點等實體抽取出來,同時根據抽取出的實體間一對一、一對多或多對多的關係等對各實體進行關聯,從而構建一張具有多維度多層網路結構的犯罪偵查圖譜。

**醫療衛生場景,**綜合海量多源的就醫、出行、社交等相關數據,構建COVID-19疫情圖譜,並利用圖計算、圖譜挖掘和圖嵌入演算法,了解疫情現狀及時空動態變化,從而實現關鍵人物的追蹤和傳播途徑的挖掘。

在商業智慧場景,利用社交網路、用戶/物品屬性、多媒體資訊、權威經驗和規則等創建本體模型並抽取相關實體和關係,實現各實體間豐富的語義關聯,並結合推薦演算法,實現千人千面的推薦。

圖並沒有特定的行業限制,所有行為都可以用圖來表達。圖資料庫與知識圖譜一體化開啟圖技術應用的一道大門,會為用戶數據價值發現帶來更好的體驗。