【发明授权】一种资讯分类处理的方法及系统_中国银行股份有限公司_202110762167.1

导航：龙图腾网> 最新专利技术> 一种资讯分类处理的方法及系统_中国银行股份有限公司_202110762167.1

申请/专利权人：中国银行股份有限公司

申请日：2021-07-06

公开（公告）日：2024-05-28

公开（公告）号：CN113434685B

主分类号：G06F16/35

分类号：G06F16/35;G06F40/30;G06F16/953;G06N3/0442;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.05.28#授权;2021.10.15#实质审查的生效;2021.09.24#公开

摘要：本发明提出了一种资讯分类处理的方法及系统，涉及自然语言处理及机器学习技术领域，该方法包括：采集资讯数据，对所述资讯数据进行预处理；建立资讯分类模型，将预处理后的资讯数据输入至资讯分类模型中，通过所述资讯分类模型将资讯数据映射到高维空间得到文本中词语之间的关系，并利用LSTM提取文本特征的语义信息；根据文本特征的语义信息分析得到特征权重，按照特征权重进行信息增强，优化资讯分类模型；根据预处理后的资讯数据设置训练集及测试集，对优化后的资讯分类模型进行训练，并利用测试集对训练模型进行测试；获取待分类的资讯数据，利用训练完成的资讯分类模型对待分类的资讯数据进行类别划分，得到分类结果。

主权项：1.一种资讯分类处理的方法，其特征在于，该方法包括：采集资讯数据，对所述资讯数据进行预处理；建立资讯分类模型，将预处理后的资讯数据输入至资讯分类模型中，通过所述资讯分类模型将资讯数据映射到高维空间得到文本中词语之间的关系，并利用LSTM提取文本特征的语义信息；根据文本特征的语义信息分析得到特征权重，按照特征权重进行信息增强，优化资讯分类模型；根据预处理后的资讯数据设置训练集及测试集，对优化后的资讯分类模型进行训练，并利用测试集对训练模型进行测试；获取待分类的资讯数据，利用训练完成的资讯分类模型对待分类的资讯数据进行类别划分，得到分类结果；其中，建立资讯分类模型，将预处理后的资讯数据输入至资讯分类模型中，通过所述资讯分类模型将资讯数据映射到高维空间得到文本中词语之间的关系，并利用LSTM提取文本特征的语义信息，包括：根据文本中词语之间的关系，利用LSTM对文本进行前向及后向特征提取，得到文本特征的前向和后向语义信息；将文本特征的前向和后向语义信息进行整合，按照特征维度进行拼接得到新特征；其中，文本中的每个文字通过相应的所述新特征、文本特征的前向和后向语义信息进行表示；其中，根据文本特征的语义信息分析得到特征权重，按照特征权重进行信息增强，优化资讯分类模型，包括：对新特征进行处理，选择性增大有效特征的影响，并抑制无效特征的影响，其中，信息增强的选择逻辑为：设置输入数据维度为[B,S,H*2]，其中，B表示数据批量，S表示文本长度，H表示LSTM隐层神经元数；将S个文字的特征按矩阵第二个维度相加，并求均值得到[B,1,H*2]维度的第一数据，其中，第一数据包含了整个文本所有的信息；将第一数据的矩阵输入一个全连接神经网络中，输入神经元数为H*2，隐层神经元数为H，输出层神经元数为H*2，全连接神经网络最终输出一个[H*2,1]维度的第一权重矩阵，所述第一权重矩阵代表文本中每个文字在每个特征维度上的权重，用于对特征按重要性进行增强；利用所述第一权重矩阵与输入数据[B,S,H*2]相乘，得到[B,S,1]的第二权重矩阵，所述第二权重矩阵代表文本中每个文字的权重，用于对文字特征进行增强，利用第二权重矩阵与输入数据[B,S,H*2]相乘，得到最终的文本特征矩阵[B,H*2]，将最终的文本特征矩阵输入到分类层中，得到最终的分类结果；按照特征重要度对每个文字的特征进行增强或抑制，对所有文字的特征按重要度进行增强或抑制，优化资讯分类模型。

全文数据：

权利要求：

百度查询：中国银行股份有限公司一种资讯分类处理的方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种汽车排气管制作加工焊接装置_潍坊鸿洋机械科技有限公司_202410431304.7

下一篇：基于零代词补齐的汉越数据增强方法_昆明理工大学_202210374347.7

相关技术

一种汽车排气管制作加工焊接装置_潍坊鸿洋机械科技有限公司_202410431304.7

基于零代词补齐的汉越数据增强方法_昆明理工大学_202210374347.7

基于学生T过程的微带天线优化方法和优化系统_江苏科技大学_202111415452.2

一种固态电解质包覆的钴酸锂正极材料及其制备方法_英德市科恒新能源科技有限公司_202410408908.X

促进多面板用户设备的不连续接收_诺基亚技术有限公司_201880095028.4

一种Invar合金焊丝及其制备、焊接方法_西安钢研功能材料股份有限公司_202311708375.9

一种新能源汽车配件生产定位钻孔装置_西安翔凌汽车零部件有限公司_202210366932.2

一种流量监测装置_成都锦城学院_202410425182.0

制造时基于裕量退化的可靠性验收的半导体抽样测试方法_北京航空航天大学_202410458839.3

一种可变任意尺寸模具的挤吹机及其挤吹工艺_晋江里弗兰新材料有限公司_202410445743.3

一种针对空中目标的雷达可探测性评价方法_中国人民解放军63921部队_202210250664.8

一种便于安装的制粒切刀系统_创志科技(江苏)股份有限公司_202211619873.1

处理相关技术

基片处理装置和基片处理方法_东京毅力科创株式会社_202311669163.4

图像处理方法及图像处理设备_东软医疗系统股份有限公司_202410410737.4

基板处理方法以及基板处理装置_细美事有限公司_202311332641.2

视频处理方法和视频处理装置_北京达佳互联信息技术有限公司_202111387536.X

图像处理装置和图像处理方法_爱思开海力士有限公司_202311055069.X

基板处理装置和基板处理方法_东京毅力科创株式会社_202410274298.9

音频处理方法及音频处理装置_维沃移动通信(杭州)有限公司_202111020935.2

图像处理装置和图像处理方法_爱思开海力士有限公司_202310957003.3

处理盒_珠海三润精密制造有限公司_202211640997.8

处理盒_珠海三润精密制造有限公司_202211641047.7

资讯相关技术

一种资讯事件图谱化系统_南京证券股份有限公司_202410227182.X

基于本地部署大模型的多策略资讯分析方法_上海捷晓信息技术有限公司_202410191546.3

资讯推送方法、装置、电子设备及存储介质_百度在线网络技术(北京)有限公司_202010753964.9

基于智能页面解析的实时资讯爬虫方法、装置及设备_宁波深擎信息科技有限公司_202111404747.X

一种资讯分类处理的方法及系统_中国银行股份有限公司_202110762167.1

资讯数据推送方法、系统与存储介质_杭州高能云科技有限公司_202410496099.2

资讯展示方法、装置、电子设备及存储介质_北京达佳互联信息技术有限公司_202410166397.5

一种资讯推荐方法、系统、设备及介质_广东水利电力职业技术学院(广东省水利电力技工学校)_202410091554.0

资讯推荐方法、电子设备和服务器_上海幻电信息科技有限公司_202010513525.0

一种资讯推荐方法、装置、服务器与存储介质_腾讯科技(深圳)有限公司_201810819517.1

方法相关技术

配置方法_意法半导体(大西部)公司_202311748134.7

设备控制方法方法和装置_珠海格力电器股份有限公司_202111537707.2

模型预训练方法、模型训练方法、对象处理方法及装置_北京百度网讯科技有限公司_202310701200.9

脱水方法_赛纳塔生物有限公司_202280073278.4

任务处理方法、法律问答方法及任务处理模型训练方法_阿里巴巴(中国)有限公司_202410660148.1

移动台、基站、发送方法及接收方法_松下电器(美国)知识产权公司_201980043653.9

模型构建方法、图像分割方法、装置、设备、介质_北京字跳网络技术有限公司_202211634709.8

测试结构及其形成方法及测试方法_中芯国际集成电路制造(北京)有限公司_202211638350.1

消息发送方法、装置和资源分配方法、装置_北京小米移动软件有限公司_201880000686.0

窗口插件配置方法、窗口数据采集方法及装置_北京字节跳动网络技术有限公司_202111209776.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种资讯分类处理的方法及系统_中国银行股份有限公司_202110762167.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务