首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种文献查重的方法、装置、存储介质及电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学院文献情报中心

摘要:本申请提供了一种文献查重的方法、装置、存储介质及电子设备,该方法包括:对待查重文本与对比库进行对比,获取第一筛选结果;在所述第一筛选结果中存在所述文本内容的情况下,则对所述文本内容和所述待查重文本进行句向量相似度计算,获取第二筛选结果,所述待查重文本和所述目标文本中均含有至少一种语句类型;对所述目标文本和所述待查重文本进行重复度计算,获取所述至少一种语句类型中每种语句类型对应的语句重复度值;根据所述每种语句类型对应的语句重复度值和所述每种语句类型的权重值,获取所述待查重文本的文本查重结果。本申请实施例可以提升文本的查重效率和精准度。

主权项:1.一种文献查重的方法,其特征在于,包括:对待查重文本与对比库进行对比,获取第一筛选结果,其中,所述第一筛选结果表征所述对比库中是否存在与所述待查重文本相似的文本内容;在所述第一筛选结果中存在所述文本内容的情况下,则对所述文本内容和所述待查重文本进行句向量相似度计算,获取第二筛选结果,其中,所述第二筛选结果表征所述文本内容中与所述待查重文本相似的目标文本,所述待查重文本和所述目标文本中均含有至少一种语句类型;对所述目标文本和所述待查重文本进行重复度计算,获取所述至少一种语句类型中每种语句类型对应的语句重复度值;根据所述每种语句类型对应的语句重复度值和所述每种语句类型的权重值,获取所述待查重文本的文本查重结果;所述对待查重文本与对比库进行对比,获取第一筛选结果,包括:对所述待查重文本进行关键词抽取,获取文本关键词;对所述文本关键词进行分词,得到重要词;将所述文本关键词和所述重要词进行两两组合并筛选,获取检索关键词;以所述检索关键词为索引在所述对比库中检索,得到所述第一筛选结果。

全文数据:

权利要求:

百度查询: 中国科学院文献情报中心 一种文献查重的方法、装置、存储介质及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。