恭喜大连民族大学赵丹丹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜大连民族大学申请的专利一种基于对抗迁移学习的命名实体识别模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114722818B 。
龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210108942.6,技术领域涉及:G06F40/295;该发明授权一种基于对抗迁移学习的命名实体识别模型是由赵丹丹;张志浩;孟佳娜;苏文设计研发完成,并于2022-01-28向国家知识产权局提交的专利申请。
本一种基于对抗迁移学习的命名实体识别模型在说明书摘要公布了:本发明属于自然语言处理领域,涉及一种基于对抗迁移学习的命名实体识别模型。包括:S1.嵌入层;S2.BiLSTM特征提取层;S3.注意力机制层;S4.对抗迁移层;S5.CRF解码层。有益效果:为了更准确的确定实体边界信息,本发明将分词任务中学习到的知识迁移到实体识别任务中,即利用分词任务中对实体边界检测有帮助的信息来提高实体识别任务的效果;本发明利用大量训练好的或者已经标注好的数据集进行迁移学习,将模型在大量语料上学习的知识迁移到特定领域或者特定语言NER任务中,从而提升NER效果。提出了解决跨任务、跨语言和跨领域NER的统一性框架。
本发明授权一种基于对抗迁移学习的命名实体识别模型在权利要求书中公布了:1.一种基于对抗迁移学习的命名实体识别模型,其特征在于,包括:S1.嵌入层:用于提取单词级别特征、提取词语字符级别特征及特征融合;S2.BiLSTM特征提取层:使用BiLSTM获取输入序列的上下文信息;S3.注意力机制层:使用多头注意力机制捕获语义相互关联信息的多重特征并学习在不同的表示子空间里相关的信息;S4.对抗迁移层:通过对抗神经网络在迁移学习的数据集之间施以权重以平衡数据集;S5.CRF解码层:计算最优标签序列;该模型通过嵌入层将文本X序列转化、提取、池化、特征融合后得到全连接网络的输出vi;BiLSTM特征提取层以全连接网络的输出vi为输入,通过门控机制,提取输入序列上下文的单词级特征,输出hshared、hsource、hTarget;hsource、hTarget分别作为注意力机制层的输入,通过多头注意力机制捕获文本丰富的信息,提升文本性能,输出为A;hshared作为对抗迁移层的输入,通过权重α平衡高低资源的训练规模差异大的影响,使资源域和目标域中提取的特征表示更加兼容;A作为CRF层的输入,CRF过滤神经网络模型输出的每个标签的分数,分数最高的标签是训练的最好结果;所述嵌入层包括以下步骤:Glove提取单词级别特征:将文本序列转换为预训练字向量;CNN提取词语字符级别特征:将字向量送入CNN提取词语字符级别特征,即通过占位符使得词向量矩阵变为统一大小,然后通过卷积从每个词语由字向量构成的矩阵中提取当前词语字符级别的特征,再通过池化提取特征中的关键信息得到词语字符级别特征特征融合:将单词级向量和字符级向量进行串联操作,然后将串联得到的向量输入到一个全连接的神经网络中,以集成字符级特征和单词级特征;所述BiLSTM特征提取层分为用于提取资源收集数据的资源BiLSTM、用于提取目标数据的目标BiLSTM、用于提取共享特征的共享BiLSTM。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连民族大学,其通讯地址为:116600 辽宁省大连市经济技术开发区辽河西路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。