买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:厦门大学
摘要:本发明公开了一种基于译文树结构解码路径动态选择的机器翻译方法和介质,其中方法包括:获取人工标注的机器翻译数据;对目标语言句子进行解析,以得到该目标语言句子对应的目标语言成分句法树,并根据源语言句子和对应的目标语言成分句法树生成训练数据;进行模型的训练,以生成基于译文树结构解码路径动态选择的机器翻译模型;获取待翻译源语言句子,并将待翻译源语言句子输入到基于译文树结构解码路径动态选择的机器翻译模型,以通过基于译文树结构解码路径动态选择的机器翻译模型生成对应的目标语言成分句法树和目标语言句子;能够有效提高机器翻译过程中成分句法树的生成效率,提高机器翻译准确率。
主权项:1.一种基于译文树结构解码路径动态选择的机器翻译方法,其特征在于,包括以下步骤:获取人工标注的机器翻译数据,其中,所述人工标注的机器翻译数据包括源语言句子和对应的目标语言句子,所述源语言句子和对应的目标语言句子形成平行句对;通过目标语言句子对应的解析器对所述目标语言句子进行解析,以得到该目标语言句子对应的目标语言成分句法树,并根据所述源语言句子和对应的目标语言成分句法树生成训练数据;根据所述训练数据进行模型的训练,以生成基于译文树结构解码路径动态选择的机器翻译模型,其中所述基于译文树结构解码路径动态选择的机器翻译模型包括编码器、解码器和分支选择器;获取待翻译源语言句子,并将所述待翻译源语言句子输入到所述基于译文树结构解码路径动态选择的机器翻译模型,以通过所述基于译文树结构解码路径动态选择的机器翻译模型生成对应的目标语言成分句法树和目标语言句子;根据所述训练数据进行模型的训练,包括:使用随机分支顺序下的序列数据对模型进行预训练;使用强化学习的方式对所述分支选择器进行训练;在使用强化学习的方式对所述分支选择器进行训练的过程中,通过分支选择器预测分支的数量,如果分支的个数为多个,则通过决策网络进行分支的选择;通过决策网络进行分支的选择包括,对每个分支的优先级进行打分;其中,根据以下公式进行优先级的打分:Scorefi=W2tanhW1[st:hat:hft:Eni]其中,Scorefi表示每个分支的优先级分数,W1和W2表示矩阵参数,st表示当前时刻的隐状态,hat表示父节点的隐状态,hft表示兄弟节点的隐状态,Eni表示每个分支所在的位置;在对每个分支的优先级进行打分之后,还包括:计算每个分支被选择的概率,并计算每种分支排序方式被选择的概率;其中,每种分支排序方式被选择的概率根据以下公式计算: 其中,πo表示分支排序方式被选择的概率,m表示分支的数量,pt表示第i个生成的分支为的概率,表示第i个被生成的分支,表示按照顺序已经生成的前i-1个分支。
全文数据:
权利要求:
百度查询: 厦门大学 基于译文树结构解码路径动态选择的机器翻译方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。