基于句子主干的稀缺资源神经机器翻译的数据增强方法

导航：龙图腾网> 最新专利技术> 基于句子主干的稀缺资源神经机器翻译的数据增强方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：营口理工学院

摘要：本发明公开了基于句子主干的稀缺资源神经机器翻译的数据增强方法，涉及神经机器翻译技术领域；该数据增强方法包括以下步骤：构造原始双语数据集；构建反向翻译模型，采用原始双语数据集训练反向翻译模型；采用句子主干提取算法将目标语言句子生成为目标语言句子主干；基于反向翻译模型翻译目标语言句子主干得到源语言句子主干；将源语言句子主干和目标语言句子主干组合构造伪双语数据集；将原始双语数据集和伪双语数据集合并，作为神经机器翻译模型的训练集。本发明通过目标语端句子主干和反向翻译模型生成伪平行数据，从而扩充训练数据，通过该方法，可以更加充分地利用现有数据，增加训练样本的多样性，提升模型的翻译质量。

主权项：1.基于句子主干的稀缺资源神经机器翻译的数据增强方法，其特征在于，包括以下步骤：S1、构造原始双语数据集D＝{S,T}，原始双语数据集D包括源语言句子S和目标语言句子T；S2、构建反向翻译模型，采用原始双语数据集D训练反向翻译模型；S3、采用句子主干提取算法将目标语言句子T生成为目标语言句子主干T′；S4、基于反向翻译模型翻译目标语言句子主干T′得到源语言句子主干S′；S5、将源语言句子主干S′和目标语言句子主干T′组合构造伪双语数据集D′＝{S′,T′}；S6、将原始双语数据集D和伪双语数据集D′合并，作为神经机器翻译模型的训练集。

全文数据：

权利要求：

百度查询：营口理工学院基于句子主干的稀缺资源神经机器翻译的数据增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于令牌的认证方法、装置、设备及存储介质

下一篇：近地空间星群电离层等离子体环境量化表征方法

相关技术

基于令牌的认证方法、装置、设备及存储介质

近地空间星群电离层等离子体环境量化表征方法

一种可变形更换照射模式的智慧路灯

一种破碎机

一种用于环保设备制造的金属线材加工设备

交通艇

一种汽车排气管隔热罩材料及其制备方法

一种用户视频质差根因分析方法和电子设备和存储介质

阻燃尼龙及其制备方法

一种多点位施力的牙齿间隙保持器及其使用方法

一种含Cu抗菌不锈钢透射电镜样品的制备方法

大体积混凝土智能养护系统及养护方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于句子主干的稀缺资源神经机器翻译的数据增强方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务