首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于旋转位置编码的端到端语音翻译方法及系统 

申请/专利权人:西北工业大学;西北工业大学深圳研究院

申请日:2024-01-09

公开(公告)日:2024-06-25

公开(公告)号:CN118248148A

主分类号:G10L15/26

分类号:G10L15/26;G10L15/16;G10L15/06;G10L25/24;G10L25/30;G06F40/58;G06N3/0455;G06N3/08

优先权:

专利状态码:在审-公开

法律状态:2024.06.25#公开

摘要:本申请的实施例涉及自然语言处理技术领域,公开了一种基于旋转位置编码的端到端语音翻译方法及系统,该方法包括:基于Transformer模型的模型架构构建端到端的语音翻译模型,语音翻译模型设有编码器层,编码器层基于旋转位置编码对自身的输入特征序列进行位置编码,并基于自注意力机制进行注意力计算,得到中间特征表示;初始化编码器层中的各编码器的参数,使用语音翻译语料库中的语音数据及其对应的转录文本对语音翻译模型进行迭代训练至收敛,得到训练完成的语音翻译模型;将待翻译的源语言语音输入至训练完成的语音翻译模型中,获得训练完成的语音翻译模型输出的目标语言的文本,可以直接利用相对位置信息,快速进行语音翻译。

主权项:1.一种基于旋转位置编码的端到端语音翻译方法,其特征在于,包括:基于Transformer模型的模型架构构建端到端的语音翻译模型;其中,所述语音翻译模型的编码器层中设有添加有旋转位置编码模块的多头自注意力层,所述编码器层通过所述旋转位置编码模块对自身的输入特征序列进行位置编码,并基于自注意力机制中的内积机制进行注意力计算,将绝对位置信息以相对位置编码的形式编码到所述输入特征序列中,得到所述输入特征对应的中间特征表示;初始化所述编码器层中的各编码器的参数,使用语音翻译语料库中的语音数据及其对应的翻译文本,对参数初始化后的所述语音翻译模型进行迭代训练至收敛,得到训练完成的语音翻译模型;将待翻译的源语言语音输入至所述训练完成的语音翻译模型中,获得所述训练完成的语音翻译模型输出的目标语言的文本。

全文数据:

权利要求:

百度查询: 西北工业大学;西北工业大学深圳研究院 一种基于旋转位置编码的端到端语音翻译方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。