买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京网智天元大数据科技有限公司;网智天元科技集团股份有限公司
摘要:本申请提供了一种基于预训练模型的汉藏语翻译装置及藏语翻译方法,通过识别藏语字符结构得到藏语音节序列,进而由藏语音节的词性区分度和各个藏语音节之间的梯度距离确定藏语音节之间的语义粒度,再通过所述语义粒度和音节识别的损失确定藏语翻译过程中每个藏语音节的单词贡献度;对藏语音节序列中藏语音节进行多尺度组合,得到音节段落,进而确定每个音节段落中藏语音节的粒度熵,通过粒度熵和音节段落的语义损失确定藏语翻译过程中每个音节段落的段落优先级;再基于所有单词贡献度和所有段落优先级对藏语文本进行梯度翻译。采用本申请的方案,可实现藏语文本中藏语音节与音节段落之间的梯度分级翻译,从而提高藏语翻译的可信度。
主权项:1.一种基于预训练模型的藏语翻译方法,其特征在于,包括下述步骤:获取待翻译的藏语文本;对所述藏语文本中藏语字符结构进行音节识别,进而得到藏语音节序列,基于预训练的语义模型确定所述藏语音节序列中各个藏语音节的语义损失;确定所述藏语音节序列中各个藏语音节的词性区分度,根据所有的词性区分度和所述藏语音节序列中各个藏语音节之间的梯度距离确定每个藏语音节与其它所有藏语音节之间的语义粒度,进而通过每个藏语音节的语义粒度和语义损失确定藏语翻译过程中所述每个藏语音节的单词贡献度;基于预训练的段落模型对所述藏语音节序列中所有藏语音节进行多尺度组合,得到多个音节段落,进而确定各个音节段落中所有藏语音节的粒度熵,通过所有的粒度熵和各个音节段落的语义损失确定藏语翻译过程中每个音节段落的段落优先级;基于所有单词贡献度和所有段落优先级对所述藏语文本进行梯度翻译。
全文数据:
权利要求:
百度查询: 北京网智天元大数据科技有限公司 网智天元科技集团股份有限公司 一种基于预训练模型的汉藏语翻译装置及藏语翻译方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。