首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种适用于公私联动场景的实体融合方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海银行股份有限公司

摘要:本发明涉及一种适用于公私联动场景的实体融合方法,包括以下步骤:S1:从各业务原系统中采集客户信息表及关联关系表,得到包含多个实体及各实体间关联关系的数据集;S2:根据数据集构建各实体间的知识图谱;S3:根据特定规则对知识图谱进行融合,特定规则依据实体关联拓扑结构及实体名称设置;S4:采用TF‑IDF算法和加权编辑距离算法对对公实体进行进一步融合。本发明利用知识图谱及NLP的相关技术,实现了针对对公客户、对私客户中重复实体、关系边的融合,以及矛盾实体、关系边的修复,解决了原有公私联动模型中大量存在的实体重复以及实体冲突等问题。

主权项:1.一种适用于公私联动场景的实体融合方法,其特征在于,包括以下步骤:S1:从各业务原系统中采集客户信息表及关联关系表,得到包含多个实体及各实体间关联关系的数据集,其中,关联关系表中的关联关系包括对公-对公关系、对公-对私关系和对私-对私关系,对公-对公关系包括股权关系、担保关系、资金关系以及同高管;对公-对私关系包括高管关系、法人关系以及控股关系;对私-对私关系包括交易关系、亲属关系、住址关系以及ip地址关系;S2:根据数据集构建各实体间的知识图谱;S3:根据特定规则对知识图谱进行融合,特定规则依据实体关联拓扑结构及实体名称设置,包括以下特定规则:若多个同名实体与同一实体存在至少一条类型相同的强关联边,和或,存在至少两条类型相同的弱关联边,则所述多个同名实体融合为一个实体;若存在同名对公实体时,在不同业务条线或数据源中存在不同的编号,则融合一个对公实体;若两个对公实体间存在强关联边,则与这两个对公实体都存在至少一条强关联边或两条弱关联边的同名实体融合为一个实体;对于任意两个对公实体,存在多对同名对私实体与这两个对公实体有至少一条强关联边或两条弱关联边,则每对同名对私实体融合为一个对私实体;其中,强关联边类型包括股权关系、担保关系、高管关系以及实控人关系,弱关联边类型包括交易关系、集团关系、同股东关系、同高管关系、同地址关系以及同电话关系;S4:对对公实体进行进一步融合,融合方式如下:S41:将各企业的名称划分为多个分词,并对分词进行去重处理,所述企业为对公实体;S42:利用TF-IDF算法,计算所有企业名称中每个分词的词频;S43:根据各分词的词频计算各分词的权重;S44:根据各分词的权重,利用加权编辑距离算法,计算任意两个企业名称间的加权编辑距离;S45:根据任意两个企业名称间的加权编辑距离计算相似度,计算公式如下: 其中,sima,bi,j为a企业和b企业间的名称相似度;i为a企业的名称中各分词的序号;j为b企业的名称中各分词的序号;Leva,bi,j为a企业和b企业名称间的加权编辑距离,m为a企业的名称中分词的总数;n为b企业的名称中分词的总数;S46:预设融合阈值,若任意两个企业间的名称相似度大于等于融合阈值,则融合当前的两个企业;反之则不融合。

全文数据:

权利要求:

百度查询: 上海银行股份有限公司 一种适用于公私联动场景的实体融合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。