一种基于预训练模型的核电站维修经验文本匹配方法

导航：龙图腾网> 最新专利技术> 一种基于预训练模型的核电站维修经验文本匹配方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：武汉理工大学

摘要：本发明提供了一种基于预训练模型的核电站维修经验文本匹配方法，包括：1、获取用户查询的维修主题，并对核电站维修文档非结构化数据进行清洗，组成原始数据集；2、对数据进行增强，得到包含第一文本、第二文本数据对的最终的数据集，3、构建多任务的训练集、验证集和测试集，并进一步分词处理；4、通过预训练文本匹配模型对第一文本、第二文本数据对进行语义特征提取，生成匹配权重矩阵；5、将用户查询的维修主题输入到文本匹配模型中，对维修经验主题进行语义分析，进而给出相匹配关联的维修经验文档。相比于其他方法，本发明能够从解决多种长度文本匹配使用一个模型进行训练匹配的准确度、核电站领域没有维修文本数据集及匹配系统的问题。

主权项：1.一种基于预训练模型的核电站维修经验文本匹配方法，其特征在于，包括：S1：获取用户查询的维修主题，对核电站维修文档非结构化数据进行清洗，得到标准维修主题和标准维修目的，组成原始数据集；S2：在原始数据集的基础上，对数据进行增强，得到最终数据集，最终数据集中包含由第一文本和第二文本构成的数据对；S3：在最终数据集上构建多任务的训练集、验证集和测试集，并对构建的数据集进行分词处理，多任务包括短短匹配、短长匹配、长长匹配三大类的语义匹配任务；S4：通过预训练文本匹配模型对最终数据集中由第一文本和第二文本组成的数据对进行语义特征提取，生成文本数据对间的匹配权重矩阵，匹配权重矩阵包含多层次交互信息，预训练文本匹配模型为基于Roformer的预训练模型；S5：将用户查询的维修主题输入到预训练文本匹配模型中，获得待查询维修主题文本向量，根据待查询维修主题文本向量与步骤S4生成的文本数据对间的匹配权重矩阵之间的相似度，获取相似度高于相似度阈值的维修主题，并将相似度高于相似度阈值的维修主题对应的维修文档返回给用户；其中，基于Roformer的预训练模型包括嵌入层、位置编码层、多头注意力层、前馈神经网络层、交互注意力层和预测层，其中，嵌入层用于对第一文本和第二文本进行文本向量化表示，位置编码层用于对嵌入层得到文本向量化表示进行相对位置编码，多头注意力层用于根据相对位置编码的结果进行注意力计算，前馈神经网络层用于对多头注意力层的结果进行线性变换，交互注意力层用于对文本数据进行多层次的信息交互，预测层用于根据交互注意力层的结果得到匹配结果；嵌入层采用BERT模型，预测层包括最大池化、全连接层和softmax层，步骤S4包括：S401：采用BERT模型分别对第一文本和第二文本进行文本向量化表示，得到嵌入矩阵A和嵌入矩阵B；S402：通过位置编码层将嵌入矩阵A和嵌入矩阵B进行相对位置编码，得到第一向量和第二向量；S403：对编码后获得的数值化第一向量和第二向量，通过Roformer模型的多头注意力层进行注意力计算、前馈神经网络层进行线性变换；S404：通过Roformer的交互注意力层，对第一向量和第二向量之间进行信息交互，获得丰富的上下文信息和交互信息，得到包含两个文本多层次交互信息的第一交互矩阵和第二交互矩阵；S405：对第一交互矩阵和第二交互矩阵分别进行最大池化操作，得到降维压缩后的第一预测向量和第二预测向量并计算第一预测向量和第一预测向量之间的匹配结果其中，v1和v2分别为第一预测向量和第一预测向量，对应第一文本和第二文本，表示v1和v2对应元素逐个相乘，强调两个文本之间相同之处，|v1-v2|表示v1和v2对应元素逐个相减，强调两个文本之间不同之处，F表示将获取的四个向量拼接，再输入到全连接层，最终通过分类器softmax输出匹配权重矩阵。

全文数据：

权利要求：

百度查询：武汉理工大学一种基于预训练模型的核电站维修经验文本匹配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种机器人定位方法、装置及存储介质

下一篇：多功能包皮延长恢复器及阴茎增长锻炼器

相关技术

一种机器人定位方法、装置及存储介质

多功能包皮延长恢复器及阴茎增长锻炼器

电池信息生成方法及生成系统

一种集取料、排料及送料于一体的工件输送装置

推入式耳塞及使用芯轴制造其的方法

一种低温快固保温型复合涂层喷涂参数确定方法、介质及系统

移动体控制系统

一种钢丝绳切断铆钉铆接自动一体机

一种口服液瓶盖结构

一种页面属性获取方法、装置及计算机设备、存储介质

一种铰链装置及洗碗机

一种中央空调及控制方法

维修相关技术

一种维修平台维修用辅助照明设备_芜湖中科飞机制造有限公司_202311390598.5

钻井设备维修用工作台_陕西昶冉翡实业有限公司_202323644288.X

一种维修用旋转设备_飞克机器人科技(东莞)有限公司_202322400098.7

一种机电维修支撑装置_河南中烟工业有限责任公司_202322964106.0

一种便于维修的立柱_山东得邦电力设备有限公司_202420205788.9

鞋楦托盘用维修辅助装置_际华三五一四制革制鞋有限公司_202323584342.6

沥青路面裂缝维修装置_邓少鸿_202323413048.9

汽车维修平台的控制方法及系统_深圳联鹏高远智能科技有限公司_202410944234.5

一种便于维修的储能柜_深圳市中科华宇科技有限公司_202323468162.1

一种汽车维修的焊接装置_广州市新广昌汽车服务有限公司_202420194777.5

核电站相关技术

一种用于核电站并带有视频监控系统的电子围栏_深圳市依电科技有限公司_202410938617.1

一种核电站环境异常监测装置_江苏核电有限公司_202410574871.8

一种核电站棒控电源系统的发电机差动保护方法_华北电力大学(保定)_202410717268.0

一种快速评估大型商用客机撞击下核电站安全性的方法_同济大学_202410719437.4

核电站压水反应堆通量图数据修正方法、装置和终端设备_广东核电合营有限公司_202110805837.3

一种基于预训练模型的核电站维修经验文本匹配方法_武汉理工大学_202210214810.1

用于核电站压力容器贯穿管的空化水射流表面强化处理系统及方法_苏州热工研究院有限公司_201811504119.7

一种核电数据采集机柜_中核核电运行管理有限公司_202410725683.0

核电厂抗台风影响评估方法及系统_中广核工程有限公司_202210391136.4

一种换电站_奥动新能源汽车科技有限公司_202322669979.9

经验相关技术

一种考虑调度经验的强化学习优化调度方法及系统_暨南大学_202410911380.8

一种中医临床诊疗经验智能化传承系统及方法_河南经方云科技有限公司_202410851767.9

一种基于预训练模型的核电站维修经验文本匹配方法_武汉理工大学_202210214810.1

用于计算实例内的增强安全计算的经验证孤立运行时环境_亚马逊科技公司_202410666808.7

基于经验模态分解的运动想象人工数据生成方法及装置_华东理工大学_202111129725.7

基于预测及经验回放的DDQN的空调系统综合能耗优化方法_浙江恒隆智慧科技集团有限公司_202411105631.X

核电厂工作许可证申请的经验反馈数据的智能推送方法_中核核电运行管理有限公司_202011242141.6

一种核电厂辐射工作许可证申请的经验反馈智能推荐方法_中核核电运行管理有限公司_202011240386.5

基于优先经验回放机制的机器人路径规划方法及系统_山东交通学院_202211199553.5

基于经验小波分解和iTransformer的锂电池剩余寿命预测方法_重庆理工大学_202410663122.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于预训练模型的核电站维修经验文本匹配方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务