首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

融入标签与文本交互机制的银行交易流水分类方法及系统 

申请/专利权人:民生科技有限责任公司

申请日:2021-01-28

公开(公告)日:2024-05-10

公开(公告)号:CN113449103B

主分类号:G06F16/35

分类号:G06F16/35;G06F16/215;G06F16/38;G06F40/284;G06N3/02;G06Q40/04

优先权:

专利状态码:有效-授权

法律状态:2024.05.10#授权;2021.10.22#实质审查的生效;2021.09.28#公开

摘要:本发明公开了一种融入标签与文本交互机制的银行交易流水分类方法及系统,涉及金融业务处理领域。该方法包括:对交易流水数据进行标注和清洗,构建模型训练所需的训练数据;采用融入交互机制的神经网络模型,基于训练数据不断优化模型;调用最优模型,对新的交易流水进行打标;输出对应流水标签,并根据用户设置,自动推送每周、每月或每季度的消费报表。该系统可实时对用户交易流水进行打标,并向用户展示特定周期的支出配比,使用户能够全面系统的了解自己的消费结构。相比传统的分类系统,该系统加入了一个交互层,显式的计算标签与文本的匹配度,为之后的标签预测起引导作用。

主权项:1.一种融入标签与文本交互机制的银行交易流水分类方法,其特征在于,所述方法包括以下步骤:数据构建步骤:对交易流水数据进行标注和清洗,构建模型训练所需的训练数据;模型训练步骤:采用融入交互机制的神经网络模型,基于训练数据不断优化所述神经网络模型;标签预测步骤:调用优化后的神经网络模型,对新的交易流水进行打标;结果展示步骤:输出对应流水标签,并根据用户设置,自动推送每周、每月或每季度的消费报表,其中,所述模型训练步骤具体包括:采用融入标签与文本交互机制的分类模型,基于训练数据进行训练,利用词级别信息,通过向量的点积运算得到文本中每个词与每个类别的匹配度,并将该匹配度应用到最终的预测层,其中,所述采用融入标签与文本交互机制的分类模型具体训练过程如下:输入层:采用word2vec模型将训练数据的词映射成连续的向量,每一条交易流水数据字段的向量表示为: 其中指交易流水数据第i个词si的向量表示,Rd中的R表示实数空间,d表示向量的维度,标签lq对应的描述字段desq的向量表示为: 其中指描述字段第j个词wj的向量表示,所有标签描述对应的向量表示矩阵为: L∈Rc×m×d,其中Rc×m×d表示DES的取值范围为实数空间,形状为c×m×d;编码层:将Se和DESe分别输入到门控循环单元GatedRecurrentUnit,GRU中进行编码,其中需要c个GRU编码器分别对c类标签进行单独编码,分别得到交易流水和标签描述的编码表示:Sh∈Rn×d,DESh∈Rc×d,其中,Rn×d表示Sh的取值范围为实数空间,形状为n×d,Rc×d表示DESh的取值范围为实数空间,形状为c×d,其中,对S进行编码时保留每个时刻的输出,对每个标签描述desq进行编码时仅保留最后的隐状态: 交互层:计算每个词si与每个标签描述desq的匹配度,基于此得到更细粒度的分类线索,其中,匹配度计算公式如下: Q∈Rc×n 其中,Q通过将两个矩阵进行相乘得到,T表示矩阵的转置;全连接层:将Q输入到全连接层,并采用ReLU激活函数得到O,再通过softmax函数得到交易流水数据S对应每个类别的概率P:O=ReLUI×W+b,W∈Rn×1P=softmaxO={p1,p2,...,pc},其中,W为参数矩阵,b为偏置,均为模型要学习的参数;输出层:将对应最大概率值的标签作为预测结果输出:Labelpre=argmaxP;其中,基于以下损失函数对模型进行优化: 其中,表示第i条交易流水对应的正确标签在第j维的数值,表示模型预测的第i条交易流水标签为j的概率。

全文数据:

权利要求:

百度查询: 民生科技有限责任公司 融入标签与文本交互机制的银行交易流水分类方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。