Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜成都优译信息技术股份有限公司廖富林获国家专利权

恭喜成都优译信息技术股份有限公司廖富林获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜成都优译信息技术股份有限公司申请的专利一种多语种文本术语提取方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114330380B

龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111615844.3,技术领域涉及:G06F40/58;该发明授权一种多语种文本术语提取方法、装置、设备及介质是由廖富林;李明;张马成设计研发完成,并于2021-12-27向国家知识产权局提交的专利申请。

一种多语种文本术语提取方法、装置、设备及介质在说明书摘要公布了:本发明公开了一种多语种文本术语提取方法、装置、设备及介质,涉及自然语言处理技术领域。该方法通过获取同一文本内容对应的不同语种的原始文本,将各语种对应的原始文本的文本内容翻译成统一的语种,得到标准文本,然后对各标准文本进行分句、分词预处理,得到不同标准文本的标准词,接着对不同标准文本中的标准词进行对齐识别,以确认不同语种的文本内容是否对齐,当识别结果为对齐时,则将对齐的各语种对应的原始文本作为术语提取文本,对术语提取文本中的待处理词进行词性分析和词频统计,确定高频名词词汇,然后对高频名词词汇进行关联关系匹配,以实现从不同语种的文本内容中提取术语的技术效果。

本发明授权一种多语种文本术语提取方法、装置、设备及介质在权利要求书中公布了:1.一种多语种文本术语提取方法,其特征在于,包括:获取同一文本内容对应的不同语种的原始文本;将各语种对应的原始文本的文本内容翻译成统一的语种,得到标准文本;对不同标准文本进行对齐识别,获取识别结果;当识别结果为对齐时,则将对齐的各语种对应的原始文本作为术语提取文本,对术语提取文本中的待处理词进行词性分析和词频统计,确定高频名词词汇;对所述高频名词词汇进行关联关系匹配,获取术语;所述对术语提取文本中的待处理词进行词性分析和词频统计,确定高频名词词汇,包括:对术语提取文本进行分句、分词预处理,得到各术语提取文本的待处理词;通过词性分析工具对各术语提取文本中的待处理词进行词性分析,选取词性为名词的待处理词作为有效名词;统计每个有效名词在对应各术语提取文本中的词频,当有效名词的词频满足预设高频判断条件,则将对应的有效名词定义为高频名词词汇;所述对所述高频名词词汇进行关联关系匹配,获取术语,包括:根据术语提取文本中的语种选择对应的双语词典,通过双语词典对所述高频名词词汇进行关联关系查询,当在双语词典中查询到高频名词词汇存在匹配关系时,则认为该高频名词词汇在对应语种中为术语;当在双语词典中没有查询到高频名词词汇的匹配关系时,则获取高频名词词汇在不同语种的术语提取文本中的句子作为术语判断句子;当不同语种的术语判断句子数量一致,且高频名词词汇在各术语提取文本中的术语判断句子出现的次数相同,则认为该高频名词词汇在对应语种中为术语;所述对各标准文本进行对齐识别,获取识别结果,包括:确定各标准文本中的标准词的意思关系和位置关系,若不同标准文本中的标准词的意思关系一致且处于相同位置,则认为标准词对齐;统计对齐的标准词的数量,当对齐的标准词的数量满足预设条件,则认为标准词所在的句子对齐,得到对齐的识别结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都优译信息技术股份有限公司,其通讯地址为:610000 四川省成都市中国(四川)自由贸易试验区成都高新区世纪城南路599号5栋401号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。