首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于迁移学习分布式期望最大化金融数据聚类方法及系统_济南大学_202111026341.2 

申请/专利权人:济南大学

申请日:2021-09-02

公开(公告)日:2024-06-07

公开(公告)号:CN113688934B

主分类号:G06F18/23213

分类号:G06F18/23213;G06F17/16;G06F17/18;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.06.07#授权;2021.12.10#实质审查的生效;2021.11.23#公开

摘要:本发明公开了一种基于迁移学习分布式期望最大化金融数据聚类方法,用于细分金融领域分布式P2P网络环境下的客户数据。包括:获取待聚类客户金融数据的业务部门并将各部门数据进行集群分布式存储;各个节点分别进行聚类分析,得到初始聚类结果,并基于各个节点上的初始聚类结果进行统计分析,得到迁移学习的初始模型参数集合;根据设定的目标函数,基于当前模型参数集合计算当前模型目标函数值;在邻居节点之间进行模型参数迁移;对于各个节点上的每个数据点进行类别划分。本发明通过在分布式期望最大化算法中引入迁移学习项,能够显示揭示节点间的协作机制,加速算法收敛,同时,提高聚类精度,精准细分金融客户。

主权项:1.一种基于迁移学习分布式期望最大化金融数据聚类方法,其特征在于,包括以下步骤:获取待聚类客户金融数据的业务部门并将各部门数据进行集群分布式存储;各个节点分别采用K-means++聚类方法进行聚类分析,得到初始聚类结果,并基于各个节点上的初始聚类结果进行统计分析,得到迁移学习的初始模型参数集合,具体为:读入分布式P2P网络拓扑结构,解析出网络的节点个数J,第j个节点所包含的样本个数Nj及样本的维度D,第j个节点所包含的邻居集合Bj,计算得出网络总样本个数为;用户输入细分金融客户聚类数K,并设置参数α=10-3;最后在每个节点上执行K-means++算法,得到初始的划分结果;根据设定的目标函数,基于当前模型参数集合计算当前模型目标函数值;在邻居节点之间进行模型参数迁移,计算新的模型目标函数值,若两次模型目标函数值的差值超过设定阈值,重复上述模型参数迁移步骤,否则,迭代终止;其中,模型参数集合记为并将其定义为TDEM算法的模型参数集合,表示第j个节点第k类的混合比例,,其中表示第j个节点第k类的簇均值,表示第j个节点第k类的协方差矩阵,初始模型参数集合记为;所述设定的目标函数为: 其中,t表示迭代次数,J表示节点个数,Nj表示第j个节点上的数据点个数,K表示类别个数,表示第j个节点第n个数据点第k类的后验概率,为第j个节点到第i个节点之间的学习因子,i表示第i个节点,表示第j个节点所包含的邻居集合,表示参数为的高斯分布函数,其中表示第i个节点第k类的簇均值,表示第i个节点第k类的协方差矩阵;对于各个节点上的每个数据点进行类别划分。

全文数据:

权利要求:

百度查询: 济南大学 基于迁移学习分布式期望最大化金融数据聚类方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。