【发明授权】一种基于双向序列生成的汉语篇章连接词识别方法_华东交通大学_202410417577.6

导航：龙图腾网> 最新专利技术> 一种基于双向序列生成的汉语篇章连接词识别方法_华东交通大学_202410417577.6

申请/专利权人：华东交通大学

申请日：2024-04-09

公开（公告）日：2024-06-21

公开（公告）号：CN118013962B

主分类号：G06F40/284

分类号：G06F40/284;G06F40/30;G06F40/289;G06N3/0442

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2024.05.28#实质审查的生效;2024.05.10#公开

摘要：本发明提供一种基于双向序列生成的汉语篇章连接词识别方法，通过句子预处理及编码模块学习候选篇章连接词的初始语义向量表示，基于Longformer的段落编码模块通过全局注意力机制和局部注意力机制引入段落级别的上下文信息，计算候选篇章连接词的最终语义向量表示，基于双向序列生成的预测模块包括正向生成层和反向生成层，分别使用两个长短时记忆网络从左至右和从右至左预测篇章连接词序列，实现篇章连接词的识别，此外，通过后处理模块处理复合连接词的识别问题，并通过互学习代价增强的训练模块使正向生成层和反向生成层能相互学习，提升识别的性能，本发明能够充分捕获篇章连接词之间双向长距离的依赖关系，显著地提高汉语篇章连接词识别的性能。

主权项：1.一种基于双向序列生成的汉语篇章连接词识别方法，其特征在于，应用于汉语篇章连接词识别模型，所述汉语篇章连接词识别模型包括句子预处理及编码模块、基于Longformer的段落编码模块、基于双向序列生成的预测模块、后处理模块和互学习代价增强的训练模块；所述方法包括：通过句子预处理及编码模块对输入段落中的每个句子进行预处理，得到预处理后的句子，预处理过程包括中文分词、标记候选篇章连接词和拼接预定义占位符，然后通过预训练语言模型得到预处理后的句子中所有词条的初始语义向量表示；基于Longformer的段落编码模块通过全局注意力机制和局部注意力机制引入段落级别的上下文信息，在所有词条的初始语义向量表示的基础上，计算候选篇章连接词的最终语义向量表示；基于双向序列生成的预测模块包括正向生成层和反向生成层，以候选篇章连接词的最终语义向量表示为输入，正向生成层基于长短时记忆网络从左到右生成篇章连接词序列，以计算正向预测时每个候选篇章连接词为篇章连接词的概率分布，反向生成层基于长短时记忆网络从右到左生成篇章连接词序列，以计算反向预测时每个候选篇章连接词为篇章连接词的概率分布，并通过互学习代价增强的训练模块使正向生成层和反向生成层相互学习，然后对正向生成层和反向生成层计算的概率分布求平均值，将平均值作为每个候选篇章连接词为篇章连接词的最终预测结果，从而识别出篇章连接词；在后处理模块中，以基于双向序列生成的预测模块识别出的篇章连接词为输入，利用预定义的启发式规则对篇章连接词进行配对，以识别出输入段落中的复合篇章连接词；基于双向序列生成的预测模块满足以下条件式：；；其中，表示正向预测时第个候选篇章连接词为篇章连接词的概率分布，表示反向预测时第个候选篇章连接词为篇章连接词的概率分布，表示第个候选篇章连接词为篇章连接词的最终预测结果，表示归一化指数函数，和为正向生成层中需要学习的参数，为从左至右的长短时记忆网络，和为中的隐状态，是正向预测时基于注意力机制计算的输入段落中与第个候选篇章连接词相关的上下文信息的向量表示，表示正向预测时前一预测结果的向量表示，和为反向生成层中需要学习的参数，为从右至左的长短时记忆网络，和为中的隐状态，是反向预测时基于注意力机制计算的输入段落中与第个候选篇章连接词相关的上下文信息的向量表示，表示反向预测时前一预测结果的向量表示；通过互学习代价增强的训练模块满足以下条件式：；为训练基于Longformer的段落编码模块和正向生成层的代价函数，为训练反向生成层的代价函数，为基于Longformer的段落编码模块和正向生成层中的参数的集合，为反向生成层中的参数的集合，D为人工标注的训练数据集，CE为交叉熵代价计算函数，为第个候选篇章连接词为篇章连接词的真实概率分布，和为权重系数，MSE为基于均方误差的互学习代价计算函数。

全文数据：

权利要求：

百度查询：华东交通大学一种基于双向序列生成的汉语篇章连接词识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于化纤在线取丝饼自动暂存的中转机器人_安歌科技(集团)股份有限公司_202210543752.7

下一篇：耐拉伸航空用电缆_广东南缆电缆有限公司_202410436836.X

相关技术

一种用于化纤在线取丝饼自动暂存的中转机器人_安歌科技(集团)股份有限公司_202210543752.7

耐拉伸航空用电缆_广东南缆电缆有限公司_202410436836.X

用于铝基复合材料焊接的超声波预热激光焊接设备_恒超源洗净科技(深圳)有限公司_202410448442.6

一种采棉机摘锭座管测量装置_浙江亚嘉采棉机配件有限公司_202410465107.7

模型轻量化方法、装置、计算机设备、存储介质及程序产品_苏州元脑智能科技有限公司_202410372700.7

一种搅拌式反应釜_江苏中特特种金属装备有限公司_202410183133.0

一种汽车排气管制作加工焊接装置_潍坊鸿洋机械科技有限公司_202410431304.7

一种汽车风窗玻璃试验中AB区的投射设备_中汽研汽车检验中心(武汉)有限公司_202410456408.3

一种新能源汽车配件生产定位钻孔装置_西安翔凌汽车零部件有限公司_202210366932.2

一种冰醋酸中微量乙酸酐的检测方法_浙江圣兆药物科技股份有限公司_202211266952.9

基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法_青岛科技大学_202410508360.6

一种间隔条浇灌胶质的装置_河南金拇指防水工程有限公司_202210302950.4

篇章相关技术

一种基于双向序列生成的汉语篇章连接词识别方法_华东交通大学_202410417577.6

篇章解析方法及电子设备、存储装置_科大讯飞(北京)有限公司_202011225699.3

篇章级事件抽取方法、系统和设备_北京感易智能科技有限公司_202111543337.3

一种段落大意引导的汉语篇章结构分析方法_华东交通大学_202410566175.2

一种细分领域增强的隐式篇章关系识别方法_华东交通大学_202410488368.0

一种基于双向序列生成的汉语篇章连接词识别方法_华东交通大学_202410417577.6

基于参数高效微调进行语义适应的多粒度迁移学习的篇章级神经机器翻译方法_昆明理工大学_202410277952.1

一种文档的篇章级事件论元抽取方法、系统及介质_中国科学院信息工程研究所_202410024769.0

一种面向新闻篇章的弱监督虚假文本片段过滤方法_中国人民解放军国防科技大学_202311682005.2

一种基于问答式系统的篇章级核心事件抽取方法_河海大学_202111133607.3

汉语相关技术

基于30键键盘的汉语拼音简拼或形码简拼输入法_米环科技(长春)有限公司_202410643173.9

一种基于双向序列生成的汉语篇章连接词识别方法_华东交通大学_202410417577.6

基于30键键盘的汉语拼音全拼输入法_米环科技(长春)有限公司_202410643161.6

基于30键键盘的汉语拼音双拼输入法_米环科技(长春)有限公司_202410643170.5

汉语辐射组合词学习装置_黑龙江中轴线工程设计咨询有限公司_202322808737.3

一种基于汉语拼音的藏文快速智能输入系统及方法_西藏大学_202410084141.X

一种用于汉语言文学教学用辅助装置_赣州职业技术学院_202410190844.0

一种段落大意引导的汉语篇章结构分析方法_华东交通大学_202410566175.2

一种新型汉语言文学汉字书写装置_张慧颖_202410470654.4

嘈杂环境下听障人士汉语发音计算机辅助学习方法及装置_兰州大学_202410571244.9

连接相关技术

用于连接立柱与横梁的连接组件及立柱与横梁的连接结构_嘉兴海虹机电科技股份有限公司_202322669322.2

连接公头、连接母头、电缆连接器、电缆及电梯电缆总成_上海贝恩科电缆有限公司_202322979191.8

连接器和连接器组件_番禺得意精密电子工业有限公司_202410477648.1

钢结构梁连接件及连接方法_青岛海信建筑设计院有限公司_202410335356.4

连接器插头及连接器_深圳乔合里科技股份有限公司_202322997744.2

射频同轴连接器外部连接结构_深圳市泛玛科技有限公司_202410366972.6

电连接器_苹果公司_202311773874.6

弹簧连接端子_WAGO管理有限责任公司_201911134187.3

电连接器_东莞立讯技术有限公司_202410458935.8

电连接器_立讯精密工业股份有限公司_202410538851.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于双向序列生成的汉语篇章连接词识别方法_华东交通大学_202410417577.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务