【发明授权】基于多策略原型生成的低资源神经机器翻译方法_昆明理工大学_202210293213.2

导航：龙图腾网> 最新专利技术> 基于多策略原型生成的低资源神经机器翻译方法_昆明理工大学_202210293213.2

申请/专利权人：昆明理工大学

申请日：2022-03-24

公开（公告）日：2024-04-23

公开（公告）号：CN114676708B

主分类号：G06F40/58

分类号：G06F40/58;G06F40/242;G06F40/30;G06F16/2458;G06N3/0455;G06N3/0442;G06N3/0499;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.23#授权;2022.07.15#实质审查的生效;2022.06.28#公开

摘要：本发明涉及基于多策略原型生成的低资源神经机器翻译方法，属于自然语言处理技术领域。本发明包括步骤：首先结合利用关键词匹配和分布式表示匹配检索原型序列，如未能获得匹配，则利用伪原型生成方法产生可用的伪原型序列。其次，为有效地利用原型序列，对传统的编码器‑解码器框架进行了改进。编码端使用额外的编码器接收原型序列输入；解码端在利用门控机制控制信息流动的同时，使用改进的损失函数减少低质量原型序列对模型的影响。本发明提出的方法能够基于少量平行语料有效地提升检索结果的数量和质量，适用于低资源环境下及相似性语言环境下的神经机器翻译。

主权项：1.基于多策略原型生成的低资源神经机器翻译方法，其特征在于：所述方法的具体步骤如下：Step1、语料预处理：预处理不同规模的平行训练语料、验证语料和测试语料，用于模型训练、参数调优和效果测试；并构建多语言全局替换词典和关键词词典，用于伪原型生成；Step2、原型生成：利用基于多种策略混合的原型生成方法进行原型生成，以保证原型序列的可用性；该步骤的具体思路为：首先结合使用模糊匹配和分布式表示匹配进行原型检索，如未检索到原型，则利用词替换操作对输入句子中的关键词进行替换，得到伪原型序列；Step3、融入原型序列的翻译模型构建：改进传统基于注意力机制的神经机器翻译模型的编解码器结构，以更好的融入原型序列，使用步骤Step1，Step2的语料作为模型输入，产生最终译文；所述Step2的具体步骤为：Step2.1、结合使用模糊匹配和分布式表示匹配进行原型检索；具体实现如下：翻译记忆库是由L对平行句组成的集合{sl,tl:l＝1,…,L},其中sl为源句，tl为目标句；对给定的输入句子x，首先使用关键词匹配于翻译记忆库中进行检索；采用模糊匹配作为关键词匹配方法，其定义为: 其中EDx,si是x,si间的编辑距离,|x|为x的句长；与基于关键词的匹配方法不同，分布式表示匹配根据句子向量表征之间的距离进行检索，某种程度上是利用语义信息进行相似性检索的手段，也因此提供了与关键词匹配不同的检索视角；基于余弦相似度的分布式表示匹配定义为：其中hx和分别为x和si的向量表征，||hx||为向量hx的度量；为实现快速计算，首先使用多语言预训练模型mBERT得到句子x和si的向量表征，随后依据表征，使用faiss工具进行相似性匹配；当模糊匹配能够得到最优匹配源句sbest时，利用分布式表示匹配得到top-k个匹配结果的集合s′＝{s1,s2,…,sk},如sbest∈s′，则选取sbest对应的目标端句子tbest作为原型序列；当模糊匹配未能检索到匹配源句或时，则通过分布式表示匹配检索出最优匹配源句sbest；Step2.2、若Step2.1未检索到原型，则对输入的句子进行关键词替换，生成伪原型，称之为基于词替换的伪原型生成；具体包含以下两种替换策略；全局替换:当输入句子未能检索到匹配时，基于最大化原则，利用双语词典对输入句子中的词进行尽力替换，替换后的句子被称为伪原型序列；关键词替换：从双语词典中抽取重要名词和实体构建关键词词典；当输入句子未能检索到匹配时，利用该词典对输入句子中的关键词进行替换，生成伪原型序列，替换次数上限小于设定的阈值；期望在共享词表的基础上，该混合了源端和重要目标端词汇的伪原型序列能够为译文的生成提供指导。

全文数据：

权利要求：

百度查询：昆明理工大学基于多策略原型生成的低资源神经机器翻译方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：制备切换器外壳的模具_苏州文博菲电子科技有限公司_202322555450.4

下一篇：一种用建筑垃圾制备的高强混凝土排水管_南京运达新型建材有限公司_202322364972.6

相关技术

制备切换器外壳的模具_苏州文博菲电子科技有限公司_202322555450.4

一种用建筑垃圾制备的高强混凝土排水管_南京运达新型建材有限公司_202322364972.6

一种用于IGBT焊接的移动载具_无锡骄成智能科技有限公司_202322451811.0

一种砂卵地层浅埋暗挖快速注浆施工设备_中铁六局集团有限公司_202322371235.9

一种具有快装结构的液晶显示屏_深圳市众投微电子科技有限公司_202322542428.6

一种深基坑支撑梁架结构_福建省岩田基建工程技术有限公司_202322458916.9

换向阀铸造模具_烟台古河智能装备有限公司_202322526540.0

雷达安装结构及车辆_长城汽车股份有限公司_202322575661.4

一种加强型装配式钢结构节点_广西建设职业技术学院_202322606607.1

一种锂电池保护板散热结构_深圳市海马士电子有限公司_202322405576.3

免疫反应预处理机构及免疫检测设备_星童医疗技术(苏州)有限公司_202322390637.3

一键式智能配茶机_上海嘻粒粒食品科技有限公司_202322460102.9

资源相关技术

页面UI的资源处理方法、页面UI的资源处理装置及介质_优地网络有限公司_202311755903.6

基于资源引用关系模型实现低代码全量资源的重构方法_江西博微新技术有限公司_202410024602.4

基于资源部署审核的容器云资源管理方法_国网四川省电力公司信息通信公司_202410252598.7

具有减少的感测的侧链路资源池资源使用的过程_苹果公司_202180023582.3

资源指示方法、装置及存储介质_中兴通讯股份有限公司_202311724996.6

网络资源保护装置_中国联合网络通信集团有限公司_202322563222.1

协调的UE间资源分配_弗劳恩霍夫应用研究促进协会_202180059265.7

资源调度方法及相关装置_华为技术有限公司_202211340725.6

资源推荐方法及相关装置_马上消费金融股份有限公司_202311723003.3

随机接入资源配置方法和装置_成都华为技术有限公司_201910028792.6

低相关技术

芳烃低聚物的精制方法、精制芳烃低聚物及其应用_中国石油化工股份有限公司_202211320867.6

一种低矿化度成因低阻油层的录井识别方法_中国石油天然气集团有限公司_202010782956.7

一种可低剪切低降粘调节阀的内部结构_博锐格科技温州有限公司_202321405033.5

基于边界约束和低秩模型的低照度图像增强方法及系统_陕西科技大学_202410128479.0

低碳区域建筑能源优化系统_江苏氿川能源科技有限公司_202322735468.2

一种低纹波转矩电机_深圳市金源机电科技有限公司_202322685860.0

一种低色号低气味聚异氰酸酯固化剂的制备方法_万华化学集团股份有限公司_202211336745.6

一种低阻高效冷却系统_苏州新弘亚能源管理有限公司_202322343055.X

低黏度硬化剂的制造方法_南亚塑胶工业股份有限公司_202211419171.9

一种低流量涡轮流量计_上海银流计测仪器有限公司_202321888205.9

神经相关技术

植入式神经刺激延伸导线_常州瑞神安医疗器械有限公司_202111061293.0

图像深度预测神经网络_谷歌有限责任公司_202010612045.X

用于神经渲染的多核系统_上海科技大学_202180102463.7

治疗神经退行性疾病的方法_上海日馨医药科技股份有限公司_202280060164.6

一种神经外科头部固定护理装置_海口市人民医院(中南大学湘雅医学院附属海口医院)_202410300938.9

一种神经外科脑部手术辅助仪_山东省公共卫生临床中心_202410298405.1

神经网络剪枝方法及相关装置_哲库科技(上海)有限公司_202211271227.0

一种神经内科疼痛缓解设备_安建华_202210074177.0

基于图神经网络的客户画像分析方法_上海栈略数据技术有限公司_202311741157.5

神经电刺激电极组件及其制备方法_北京品驰医疗设备有限公司_201910339477.5

龙图腾网&IPTOP

【发明授权】基于多策略原型生成的低资源神经机器翻译方法_昆明理工大学_202210293213.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务