首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本翻译方法、装置、电子设备及存储介质 

申请/专利权人:平安科技(深圳)有限公司

申请日:2022-02-16

公开(公告)日:2024-06-25

公开(公告)号:CN114490668B

主分类号:G06F16/22

分类号:G06F16/22;G06F16/28;G06F40/289;G06F40/58

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2022.05.31#实质审查的生效;2022.05.13#公开

摘要:本发明涉及自然语言处理技术领域,提供一种文本翻译方法、装置、电子设备及存储介质,接收到待翻译文本的翻译指令时,先对待翻译文本进行递归拆分,得到多个第一文本字符串,接着根据翻译指令对每个第一文本字符串进行词根匹配翻译,得到多个第二文本字符串,从而实现了待翻译文本的翻译,翻译效率高,通过计算每个第二文本字符串的ASCII码值,从而根据ASCII码值从多个第二文本字符串中选取多个候选文本字符串,最后根据所述多个候选文本字符串生成所述待翻译文本的目标翻译文本,翻译准确度高。快速且准确的文本翻译,有助于开发人员快速进行数据表存储、规范统一命名的数据表表结构输出,提高了开发效率。

主权项:1.一种文本翻译方法,其特征在于,所述方法包括:响应于对待翻译文本的翻译指令,对所述待翻译文本进行递归拆分,得到多个第一文本字符串,包括:获取所述待翻译文本的文本字符串长度,并根据所述文本字符串长度确定递归拆分总层;在进行第一层拆分时,对所述待翻译文本进行逐字拆分,并使用预设拆分符将逐字拆分得到的字符串进行连接,得到一个第一文本字符串;在进行当前层拆分时,根据所述当前层的层数对所述待翻译文本进行拆分,得到第一待翻译子文本和第二待翻译子文本,对所述第一待翻译子文本进行逐字拆分并使用所述预设拆分符进行连接得到第一文本子字符串,对所述第二待翻译子文本进行整体拆分并使用所述预设拆分符进行连接得到第二文本子字符串,使用所述预设拆分符连接所述第一文本子字符串和所述第二文本子字符串得到一个第一文本字符串;对所述第二待翻译子文本按照所述当前层的上一层的拆分过程进行再拆分,直到按照所述第一层的拆分过程进行再拆分为止,将所述第一文本子字符串与每次再拆分得到的文本子字符串进行合并,得到多个第一文本字符串;在进行最后一层拆分时,对所述待翻译文本进行整体拆分,得到一个第一文本字符串;根据所述翻译指令对每个所述第一文本字符串进行词根匹配翻译,得到多个第二文本字符串;计算每个所述第二文本字符串的ASCII码值,并根据所述ASCII码值从所述多个第二文本字符串中选取多个候选文本字符串;根据所述多个候选文本字符串生成所述待翻译文本的目标翻译文本,包括:计算所述候选文本字符串中每个候选文本子字符串在所述待翻译文本中的重要度,包括:识别每个候选文本子字符串的词性并根据预设词性-权重表确定每个候选文本子字符串的第一权重值;计算每个候选文本子字符串的信息量并根据所述信息量确定每个候选文本子字符串的第二权重值;根据每个候选文本子字符串的所述第一权重值及对应的所述第二权重值计算得到重要度;根据所述重要度计算对应的所述候选文本字符串的匹配质量;根据所述匹配质量从所述多个候选文本字符串中选取一个候选文本字符串作为目标文本字符串;将所述目标文本字符串确定为所述待翻译文本的目标翻译文本。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 文本翻译方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。