首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于句法依存关系动态编码的语句处理方法及装置_澳门大学_201810966363.9 

申请/专利权人:澳门大学

申请日:2018-08-23

公开(公告)日:2024-05-17

公开(公告)号:CN110895660B

主分类号:G06F40/58

分类号:G06F40/58;G06F40/12;G06F40/211

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2022.11.04#著录事项变更;2020.07.31#实质审查的生效;2020.03.20#公开

摘要:本发明的实施例公开了一种基于句法依存关系动态编码的语句处理方法及装置,该方法在进行翻译的过程中,通过依存树挖掘出语句中各单词之间的依存关系,基于挖掘出的依存关系和各源端单词的原始隐藏状态向量对各源端单词进行编码,得到对应于各源端单词的编码隐藏状态向量。根据各源端单词的编码隐藏状态向量进行解码得到用目标语言表示的语句。该方法在对源端单词的编码过程中,通过依存树充分挖掘了语句之间的依存关系和句法信息,避免了高层节点复用低层节点信息导致的过度翻译问题。另一方面,该方法中模型的计算过程简单,计算资源的占用较少,更易于部署与应用。

主权项:1.一种基于句法依存关系动态编码的语句处理方法,其特征在于,包括:获取欲翻译成目标语言的源语言语句,计算所述源语言语句中每一源端单词对应的原始隐藏状态向量;生成表示所述源语言语句中各源端单词之间的依存关系的依存树,结合所述依存树和每一源端单词对应的原始隐藏状态向量编码对应于每一源端单词的编码隐藏状态向量;根据每一源端单词对应的编码隐藏状态向量和存储的所述目标语言的词表解码出对应于所述源语言语句的目标语言语句,输出所述目标语言语句;其中,所述生成表示所述源语言语句中各源端单词之间的依存关系的依存树,结合所述依存树和每一源端单词对应的原始隐藏状态向量编码对应于每一源端单词的编码隐藏状态向量,包括:通过预先训练的依存句法分析器生成对应于所述源语言语句的依存树;对所述源语言语句中的任一待编码源端单词,在所述依存树中,获取所述待编码源端单词所在的当前节点的目标父节点和目标兄弟节点,得到所述父节点处的第一源端单词和所述兄弟节点处的第二源端单词,根据所述第一源端单词对应的原始隐藏状态向量、所述第二源端单词对应的原始隐藏状态向量和所述待编码源端单词对应的原始隐藏状态向量计算对应于所述待编码源端单词的低维隐含向量;根据对应于所述待编码源端单词的低维隐含向量计算对应于所述待编码源端单词的目标动态矩阵参数和目标动态偏差参数,由所述目标动态矩阵参数、所述目标动态偏差参数、所述第一源端单词对应的原始隐藏状态向量、所述第二源端单词对应的原始隐藏状态向量和所述待编码源端单词对应的原始隐藏状态向量计算对应于所述待编码源端单词的编码隐藏状态向量;所述根据对应于所述待编码源端单词的低维隐含向量计算对应于所述待编码源端单词的目标动态矩阵参数和目标动态偏差参数,包括:根据公式Mz=PDzQ计算对应于所述待编码源端单词的目标动态矩阵参数,通过bz=Bz,计算对应于所述待编码源端单词的目标动态偏差参数;其中,P、Q和B均为模型中训练的静态矩阵参数,目标动态矩阵参数中的W*z,U*z以及V*z分别为由不同的P和Q计算得到的Mz,Dz表示所述待编码源端单词的低维隐含向量z的对角矩阵。

全文数据:

权利要求:

百度查询: 澳门大学 一种基于句法依存关系动态编码的语句处理方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。