首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

语句切分方法及装置、存储介质、处理器及终端设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:阿里巴巴集团控股有限公司

摘要:本发明公开了一种语句切分方法及装置、存储介质、处理器及终端设备。其中,该方法包括:获取训练数据,其中,训练数据是至少基于词对齐关系,通过对初始双语句对进行切分后,形成的待使用双语句对;通过训练数据训练得到语句切分模型;采用语句切分模型对待切分的语句进行切分。本发明解决了相关技术中在进行文字翻译时,无法有效对语句和或句对进行切分,导致翻译偏差很大的技术问题。

主权项:1.一种语句切分方法,其特征在于,包括:对初始双语句对进行词对齐处理,得到包含词对齐结果的双语句对,其中,所述词对齐结果采用词对齐连线表示词对齐关系;在包含词对齐结果的双语句对中确定多个备选的切分点,其中,通过所述多个备选的切分点得到的切分线与所述词对齐连线不相交;按照预设规则从所述多个备选的切分点中筛选出部分切分点;从所述部分切分点中选取属于同一条切分线的第一切分点和第二切分点,其中,所述第一切分点用于对所述初始双语句对中的第一语句进行切分,所述第二切分点用于对所述初始双语句对中的第二语句进行切分;通过为所述第一语句构建的第一语言模型计算由所述第一切分点分割的上下文单词的第一分数,以及通过为所述第二语句构建的第二语言模型计算由所述第二切分点分割的上下文单词的第二分数;采用所述第一分数与所述第二分数之和确定最终使用的切分点,利用所述最终使用的切分点对所述包含词对齐结果的双语句对进行切分处理,得到切分后双语句,并将所述切分后双语句确定为训练数据;通过所述训练数据训练得到语句切分模型;采用所述语句切分模型对待切分的语句进行切分。

全文数据:

权利要求:

百度查询: 阿里巴巴集团控股有限公司 语句切分方法及装置、存储介质、处理器及终端设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。