首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种多维度交易数据自动对账方法及系统_北京微保科技有限责任公司_202311734469.3 

申请/专利权人:北京微保科技有限责任公司

申请日:2023-12-15

公开(公告)日:2024-06-21

公开(公告)号:CN117725451B

主分类号:G06F18/23213

分类号:G06F18/23213;G06Q40/04

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.04.05#实质审查的生效;2024.03.19#公开

摘要:本发明涉及财务数据聚类技术领域,具体涉及一种多维度交易数据自动对账方法及系统,可以应用于新兴软件和新型信息技术服务,以及大数据分析和挖掘服务,获取待对账的两个多维度目标交易数据,根据初始k值进行初始聚类得到多个初始聚类簇,然后根据各初始聚类簇的形状规整程度以及多维度目标交易数据的整体密度情况和数据点距离差异情况,确定数据分布特征指标,由此对初始k值进行修正,然后根据修正后的k值对对应的多维度目标交易数据再次聚类,然后再次聚类的差异情况,获取多源差异特征指标,最后,根据多源差异特征指标,得到目标k值,解决了现有k值获取方式的选取不当的问题,由此得到适合多维交易数据对账的理想聚类结果。

主权项:1.一种多维度交易数据自动对账方法,其特征在于,包括:获取待对账的两个多维度目标交易数据;根据初始k值,采用k均值聚类算法对各多维度目标交易数据进行初始聚类,得到初始k值个初始聚类簇;根据各初始聚类簇的形状规整程度,以及对应多维度目标交易数据的整体密度情况和数据点距离差异情况,确定各多维度目标交易数据对应的数据分布特征指标;基于所述数据分布特征指标,对所述初始k值进行修正,得到与各多维度目标交易数据对应的中间k值,并根据各中间k值,对对应的多维度目标交易数据再次聚类,得到中间k值个中间聚类簇;根据两个多维度目标交易数据中所处相同中间聚类簇的数据数量差异情况以及数据密度差异情况,获取多源差异特征指标;根据所述多源差异特征指标,对所述初始k值进行修正,得到目标k值;所述获取待对账的两个多维度目标交易数据,包括:获取待对账的两个多维度初始交易数据;对账双方为支付API与企业内部订单库,用于分别从支付API与企业内部订单库中下拉对账单,作为对账的两份数据源,获取到的两份数据源为两个多维度初始交易数据,所述多维度初始交易数据包括多个维度的相关交易数据,所述多个维度包括:交易金额、交易时间、产品代码、交易参与方、交易状态、交易类型和风险评估数据;对各多维度初始交易数据进行PCA主成分分析,获取特征值最大的两个特征向量;根据所述特征值最大的两个特征向量,得到对应的二维交易数据,作为所述多维度目标交易数据;根据两个多维度目标交易数据中所处相同中间聚类簇的数据数量差异情况以及数据密度差异情况,获取多源差异特征指标,包括:分别将其中一个多维度目标交易数据映射到另一个多维度目标交易数据中,得到映射前后对应的中间聚类簇中的数据点数量差异;根据映射前后对应的中间聚类簇中的数据点数量差异,得到整体密度变化指标;根据映射前后的所述数据点数量差异以及映射前后的中间聚类簇的面积差异,得到内部密度变化指标;根据所述整体密度变化指标和内部密度变化指标,得到所述多源差异特征指标,所述多源差异特征指标与所述整体密度变化指标和内部密度变化指标均呈正相关关系;分别将其中一个多维度目标交易数据映射到另一个多维度目标交易数据中,得到映射前后对应的中间聚类簇中的数据点数量差异,包括:设定两个多维度目标交易数据分别是第一多维度目标交易数据和第二多维度目标交易数据;将第二多维度目标交易数据映射到第一多维度目标交易数据中得到第一映射交易数据,获取第一映射交易数据中与第一多维度目标交易数据相对应的各所述中间聚类簇中的数据点数量,得到映射后的数据点数量,并结合第一多维度目标交易数据中各所述中间聚类簇中的映射前的数据点数量,得到第一多维度目标交易数据的映射前后对应的各中间聚类簇中的数据点数量差异,定义为第一映射数量差异;将第一多维度目标交易数据映射到第二多维度目标交易数据中得到第二映射交易数据,获取第二映射交易数据中与第二多维度目标交易数据相对应的各所述中间聚类簇中的数据点数量,得到映射后的数据点数量,并结合第二多维度目标交易数据中各所述中间聚类簇中的映射前的数据点数量,得到第二多维度目标交易数据的映射前后对应的各中间聚类簇中的数据点数量差异,定义为第二映射数量差异;相应地,根据映射前后对应的中间聚类簇中的数据点数量差异,得到整体密度变化指标,包括:计算第一映射数量差异与第一多维度目标交易数据对应的最小外接矩形的面积的比值,得到第一密度变化指标;计算第二映射数量差异与第二多维度目标交易数据对应的最小外接矩形的面积的比值,得到第二密度变化指标;求取所述第一密度变化指标和第二密度变化指标的均值,得到整体密度变化指标;所述根据映射前后的数据点数量差异以及映射前后的中间聚类簇的面积差异,得到内部密度变化指标,包括:获取第一映射交易数据中与第一多维度目标交易数据相对应的各所述中间聚类簇,与第一多维度目标交易数据中的对应各所述中间聚类簇的区域面积的差值绝对值,将所有所述中间聚类簇对应的区域面积的差值绝对值求和,得到第一面积差异;获取第一映射交易数据中与第一多维度目标交易数据相对应的各所述中间聚类簇的数据密度,与第一多维度目标交易数据中的对应各所述中间聚类簇的数据密度的差值绝对值,将所有所述中间聚类簇对应的数据密度的差值绝对值求和,得到第一数据密度差异;获取第二映射交易数据中与第二多维度目标交易数据相对应的各所述中间聚类簇,与第二多维度目标交易数据中的对应各所述中间聚类簇的区域面积的差值绝对值,将所有所述中间聚类簇对应的区域面积的差值绝对值求和,得到第二面积差异;获取第二映射交易数据中与第二多维度目标交易数据相对应的各所述中间聚类簇的数据密度,与第二多维度目标交易数据中的对应各所述中间聚类簇的数据密度的差值绝对值,将所有所述中间聚类簇对应的数据密度的差值绝对值求和,得到第二数据密度差异;计算所述第一面积差异和第一数据密度差异的乘积,得到第一乘积;计算所述第二面积差异和第二数据密度差异的乘积,得到第二乘积;计算第一乘积和第二乘积的均值,得到内部密度变化指标;根据所述多源差异特征指标,对所述初始k值进行修正,得到目标k值,包括:比较所述多源差异特征指标与预设阈值,若所述多源差异特征指标小于预设阈值,获取所述多源差异特征指标的负相关归一化值,并将负相关归一化值与所述初始k值相乘,得到的乘积为所述目标k值。

全文数据:

权利要求:

百度查询: 北京微保科技有限责任公司 一种多维度交易数据自动对账方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。