如何利用国产图数据库打造金融行业方案?
近年来,人工智能、图计算、区块链等为代表的新兴技术发展方兴未艾,推动着金融业数字化转型进入深水区。作为科技创新大潮下的核心基础技术之一,图计算技术凭借在数据分析和处理领域的独特优势,逐渐在金融业数字化转型中发挥着愈来愈重要的作用。
目前,金融行业知识图谱应用正处于爆发期。星环科技首席金融行业架构师曾晨光介绍,在国内,利用企业自研的国产图数据库、知识图谱平台和知识挖掘应用经验,完全可以构建监管和金融行业的知识图谱方案,既能满足用户金融风险监管、精准营销、投资分析交易等核心应用场景的需求,又能满足自主可控与安全的要求。
作为国内大数据与人工智能基础软件的领头羊,星环科技利用自研的具有自主知识产权分布式图数据库Transwarp StellarDB和知识图谱平台Sophon KG,与金融行业的头部机构合作,构建了多个领域的知识图谱应用场景,涉及集团派系知识图谱、银行对公知识图谱和零售知识图谱,证券公司反洗钱知识图谱、投研知识图谱等应用,并取得了出色的应用效果。
01
金融行业图应用
正从监管、大银行向中小银行渗透
从2019年底开始,图数据库等开始在国内的监管机构、各大交易所、大型银行等开始应用。这些机构纷纷选择国产自主研发的企业级分布式图数据库和知识图谱平台,构建知识图谱应用。
与此同时,国产的图数据库、知识图谱平台以及知识挖掘应用技术与产品不断涌现,知识图谱全栈整体解决方案逐渐完善。到了2021年,图技术商业化的步伐不断加快,在监管、金融行业的应用也将从大型银行,走向成本敏感的中小型金融机构。
曾晨光介绍,目前,金融机构知识图谱应用发展面临的挑战主要有两个:
**一是图数据源匮乏。**受支持图谱表达和存储的实体、关系、属性三元组的图数据源获取瓶颈的制约,早期知识图谱最早应用于监管和大银行的风险图谱,如反洗钱、反欺诈图谱应用等,取得了不错的效果。这类应用一般都属于同构图,整个图谱Schema中只包含一类实体和一类关系,相对容易实现。
而大于一类实体和关系的异构图近年来发展迅速,包括工商数据网络、司法数据、供应链、产业链、价值链、担保链、社交网络等应用场景的异构图数据源不断丰富,预示着未来2-3年,异构图知识图谱将是金融行业应用的主战场。
**二是图技术的成熟度。**金融机构在知识图谱应用中的主要投入除了图数据源以外,主要包括图数据库、知识图谱建模平台选购,以及知识图谱应用构建等。由于图数据库+知识图谱PaaS+图挖掘应用等技术成熟度不高,导致知识图谱商业化落地很难实现标准化。而定制化程度越高的新技术投入的预算就越高,只有大型金融机构才有资金实力投入预研性质的开发或者选型,限制了知识图谱的应用与推广。
面对金融机构的关系发现和关系查询等需求,传统关系型数据库需要不断地多表关联,跨表查询,在面对图结构大于10度以上的关系搜索时就会出现严重的性能瓶颈,甚至出现算不出来的现象。
传统的关系型数据库显然无法满足金融机构金融监管、金融风控、金融投研等图计算的需求,而分布式图数据库因为可以处理超大规模的图计算应用,因而受到金融机构的青睐。同时拥有图数据库、知识图谱平台、图挖掘应用开发的供应商更受用户的欢迎。
02
星环科技
实现金融行业三大图计算应用场景
星环科技利用自研的分布式图数据库Transwarp StellarDB和知识图谱平台Sophon KG,以及图挖掘应用开发的丰富经验,与金融行业的头部机构合作,构建了多个不同类型的知识图谱应用场景。
曾晨光介绍,星环科技成功落地的知识图谱应用可以分为金融监管+风险合规类、精准营销类、投资研究类的三类,分别面向金融机构三大业务条线。
风险是金融的命脉,也是国家监管科技的主干。金融监管+风险合规的知识图谱是星环科技最早开始投入建设和技术研发的方向。面向超大规模图网络,星环科技率先发布了支持空间3D的图展示,避免了二维图的展示对于超过万节点的图无法清晰体现的弊端;同时结合反洗钱网络图谱利用属性图中节点带有地理定位属性,构建了跨境可疑资金转正图网络,对于可疑跨境交易一目了然。
今天,大型金融机构可能存在上千万家的B端或者C端用户,如何实现针对不同用户的精准营销?在营销知识图谱方面,星环科技面向银行开发了对公知识图谱的技术,实现了在营销端沉淀业务知识,充分发挥图谱价值,帮助银行实现诸如疫情期间小微企业信贷精准投放等应用。
在金融和资本市场,最重要的金融业务就是投资,利用知识图谱刻画人类研究成果,进行知识图谱化表达和构建,也是多家券商和基金公司在探索金融科技赋能投资收益效果的发展路线图。在投资知识图谱方面,星环科技通过全栈能力,深度融合NLP+知识图谱技术,通过知识表示学习等领先的知识图谱技术,实现智能投研知识图谱,赋能投资研究场景应用。
在数据的获取、存储、计算、分发、管理的全生命周期中,需要大数据、云计算、人工智能三大技术的融合系统。星环科技提供ABC融合的一体化技术解决方案,使用统一一套引擎去驱动不同的数据模型,满足异质性数据多模型和多源性数据多模态的处理需求,增强统一性,降低系统的风险,增加可靠性和稳定性,实现从数据到业务畅通进行。
星环科技为用户串联起了从底层的关系型数据库、大数据平台到中层的图数据库,再到上层知识图谱应用的全栈产品,实现了从最底层独立的“点”分析到关系的“线”分析再到事件的“面”分析,最终形成行业全面的“体”分析的全栈智能分析赋能。从点到面再到体的一站式分析工具提供,可以搭建紧密相扣的工作流链路,对于用户而言,能够大量节省开发成本和基础算力,显著提升分析性能。
星环科技针对知识挖掘应用具备从底层到顶层的完整解决方案。在底层,星环科技拥有极速大数据大数据平台TDH、大数据应用开发工具TDS和智能分析工具Sophon,依托平台上的Transwarp StellarDB分布式图数据库,可以进行海量图数据的存储与实时操作。在图数据库上层,有基于用户交互的图可视化管理与分析平台Sophon KG。
基于以上产品,可以赋予用户构建完整图应用生态的能力。整套系统以分布式文件系统为基础,具备超大规模的节点边处理能力。同时也具备极强的可扩展性,可以横向进行灵活扩展,以应对数据的增长与处理能力要求的提高。同时,整个平台具备独立的系统构架,可以灵活便捷地与各类系统进行快速耦合。
03
国产自研技术
与产品金融行业图计算应用大显身手
国内头部金融机构在知识图谱应用中,大多优先选择国产自研的图数据库和知识图谱平台,其原因不外乎三个:
**一是金融和监管关系到国家金融安全与发展稳定,**选择自主可控的产品,避免被国外技术“卡脖子”。
其次,放眼世界监管和金融领域,中国金融机构C端或B端客户数量是最多的,国外的产品往往很难遇到这么大规模的数据计算场景,产品具有先天的缺陷。而国产产品从诞生起,就针对用户庞大图数量来研发产品,能够满足金融机构的应用需求。
另外,在图数据库和知识图谱平台产品发展上,国内企业与国际企业几乎同时起步,而自主研发的国产技术与产品在技术上并不比国外企业差,在一些技术上还超过了国外的产品。
星环图数据库是国内第一款自研分布式图数据库,可支持万亿边规模图数据存储,具备查询速度快、分析能力强、稳定性高的特点。如星环科技的分布式图数据库产品StellarDB就能够存储大规模图,数量可以达到百亿节点千亿边;支持的图分析算法丰富,性能表现优异;自主研发,已经用于众多金融行业,用于反洗钱、风险控制、营销等多种场景。
星环科技是国内同时具备图数据库、知识图谱平台、图挖掘应用开发能力的企业,其全栈能力,可以助力金融机构快速构建知识图谱应用。