基于词格和相对位置嵌入的中文问题生成统一预训练方法

导航：龙图腾网> 最新专利技术> 基于词格和相对位置嵌入的中文问题生成统一预训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西安理工大学

摘要：本发明公开了基于词格和相对位置嵌入的中文问题生成统一预训练方法，具体包括如下步骤：对Robert参数进行领域预训练；使用半监督半人工的方式，快速且准确的生成目标领域词典；根据词典将输入中字和词的相对位置信息融入Transformer层；新建的Transformer层，通过大量开放域问答数据，进行任务预训练；生成问题的训练和推断。本发明在模型输入中加入了每个单子和领域词汇的相对位置信息，模型不仅能学到更多的位置关系也可以在针对目标领域输入生成问题时具有更好的效果。领域预训练和任务预训练也被应用于模型用于增强模型在特定领域的推断能力。基于同样的问答数据集本发明提出模型具有更好的效果。

主权项：1.基于词格和相对位置嵌入的中文问题生成统一预训练方法，其特征在于，使用了领域预训练和任务预训练，同时使用半监督半人工的方式生成领域词典，在任务预训练阶段首先将输入中的领域词汇索引记录在输入序列中位置的头和尾，并且将索引到的词汇拼接在输入序列之后，然后记录每个词和子之间的相对位置并输入到Unilm模型中最后一个自建的Transformer模块，最后的通过解码器解码得到生成的问题，具体包括如下步骤：步骤1，对Roberta参数进行领域预训练，具体步骤为：在领域预训练中模型的Transformerblock初始参数取自Wiki百科语料训练的基础Roberta，然后对互联网上爬取的领域信息文本进行模型预训练，预训练使用了Roberta的双向遮盖预训练机制和全词遮盖机制，全词遮盖中的词典使用公开的开放领域词典，来适应预训练的需要，通过使用这两种机制，我们对模型的预处理进行了优化；步骤2，使用半监督半人工的方式，快速且准确的生成目标领域词典，具体步骤为：为了更快的获取目标领域词典，使用半监督半人工的方式加快词典生成效率，首先人工选取目标领域的电子文档和开放领域的大规模词典，将目标领域文档输入命名实体识别深度学习模型，将模型识别的实体加入领域词典，然后通过基于规则的方式，将大规模开放领域的词在目标领域文本中进行索引，将索引存在的词加如目标领域词典，最后将形成的领域词典经过人工审查，形成最终的领域词汇词典；步骤3，构建特殊的mask矩阵，提高模型的生成能力，具体步骤为：在模型的训练过程中，原始文本和目标问句被拼接，然后被送入模型进行训练，其中，文本中的前半部的token可以和前后两个方向的文本进行关注，后半部的token仅仅能够关注到左边的前半部文本；步骤4，构建特殊的相对位置嵌入矩阵，根据步骤2中的词典将输入中字和词的相对位置信息融入Transformer层，具体步骤为：“相对位置嵌入”能将每个单字或词汇之间的位置关系加入到attention的计算之中，强化transformer中的注意力机制，因此在任务预训练阶段对每个单字和词汇使用了相对位置编码，同时相对位置编码可以清晰的表达出每个词汇之间的位置信息；步骤5，新建的Transformer层，继承Roberta模型第12层参数,通过大量开放域问答数据，进行任务预训练，具体步骤为：为了节省计算资源，和对较小人工标注数据集的适应，需要采用预训练模型的迁移方案来提供足够的常用百科知识和领域信息，因此，将融入了词格和相对位置编码的Transformer层继承了经过步骤1进行领域预训练的Roberta参数的最后一层，进行百科知识和领域知识的迁移；由于本模型的参数较多且人工标注的问答数据往往较少，因此加入了任务预训练，通过从网络爬取的大量开放领域的问答数据，对模型进行任务预训练，增强模型在问题生成方面的能力；步骤6，生成问题的训练和推断。

全文数据：

权利要求：

百度查询：西安理工大学基于词格和相对位置嵌入的中文问题生成统一预训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于区域人体感应的通风柜控制方法及系统

下一篇：一种冰孔约束下水下航行体出水试验装置及试验方法

相关技术

基于区域人体感应的通风柜控制方法及系统

一种冰孔约束下水下航行体出水试验装置及试验方法

一种磷酸铈钴锂改性类单晶富锂锰基正极材料的制备方法及其产物

一种物体边沿位置的检测装置及方法

基于场景感知的自动化编队群组引导方法

一种导热系数低的复合墙体保温砌块及其制备方法

一种适用于现货市场的电网结构仿真方法

一种PCF板的连接结构及其使用方法

一种新型鹅星状病毒疫苗及其制备方法与应用

镭雕装置

像素补偿方法、装置、设备、显示面板及存储介质

一种基于AI的纸币识别方法及纸币清分机

嵌入相关技术

一种嵌入式温控器_湖南长铁装备制造有限公司_202420017936.4

一种嵌入式实验模组_江西机电职业技术学院_202322844890.1

一种嵌入式音响安装结构_深圳市尊特数码有限公司_202420220141.3

一种板式模块间嵌入式檐口_中国矿业大学_202420309147.8

一种嵌入式车载触摸屏_湖北牧轩电子科技有限公司_202420546798.9

嵌入式系统的测试方法、装置及设备_中国科学院微电子研究所_202311797383.5

具有屏蔽焊盘的嵌入式封装_英飞凌科技股份有限公司_202410284011.0

一种嵌入式交换机_湖北敏捷物联网络科技有限公司_202322902924.8

一种嵌入式空气净化设备_深圳市力拓光电科技有限公司_202420195768.8

具有用于将待嵌入的网络应用嵌入到周围网络应用中的系统的工业自动化系统和方法_西门子股份公司_202080026582.4

生成相关技术

数据生成装置、数据生成方法以及记录介质_株式会社东芝_202010896712.1

气溶胶生成装置_尼科创业贸易有限公司_202280092023.2

气溶胶生成装置_东莞黑马电子科技有限公司_202420281299.1

多相时钟生成装置_恩智浦有限公司_202410021656.5

安全音速高度生成_霍尼韦尔国际公司_201811138906.4

一种全息掩模版图的生成方法及生成装置_光科芯图(北京)科技有限公司_202410296901.3

模型生成、获取方法、视频生成方法、设备和介质_中兴通讯股份有限公司_202310286640.2

气溶胶生成组件及气溶胶切换式生成装置_东莞黑马电子科技有限公司_202323648315.0

图像生成数据的处理方法、图像生成方法和装置_腾讯科技(深圳)有限公司_202410635196.5

基于生成对抗网络的形状缺陷样本生成方法、系统及介质_浙江霖研精密科技有限公司_202411171701.1

问题相关技术

问题数据的意图分类方法和装置_企查查科技股份有限公司_202411019217.7

问题定位方法、装置、相关设备及存储介质_中国移动通信有限公司研究院_202310271992.0

治疗男性前列腺问题的药酒_益甘圣(宁德)生物科技有限公司_202410923414.5

一种针对状态相关数据缺失问题的EM迭代滤波算法_同济大学_202410826196.3

基于多维度自动评测的便民问题处理系统_青岛蓝图智库信息技术有限公司_202410748497.9

利用求解对流扩散反问题获得河流上游污染浓度的计算方法_华北电力大学_202410876883.6

一种解决医疗时序数据不规则问题的方法和装置_中国人民解放军总医院_202410639597.8

基于人工智能的矿山生态问题识别方法及系统_四川省华地建设工程有限责任公司_202411159181.2

用于识别在求取行驶路径时的问题的方法和装置_宝马汽车股份有限公司_202380021284.X

面向多步推理问题的智能解答方法、系统、装置与介质_中国科学技术大学_202411151158.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于词格和相对位置嵌入的中文问题生成统一预训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务