申请/专利权人:中国科学院文献情报中心
申请日:2024-04-15
公开(公告)日:2024-06-25
公开(公告)号:CN118245564A
主分类号:G06F16/31
分类号:G06F16/31;G06F16/33;G06F40/205;G06F40/279;G06F40/12;G06F40/30
优先权:
专利状态码:在审-公开
法律状态:2024.06.25#公开
摘要:本发明公开了一种支持语义查重查新的特征比对库构建方法及装置,涉及人工智能相关领域,该方法包括:导入领域文本库,利用知识元解析模块对领域文本库进行解析,输出多个层级知识元;分别进行关键词识别,输出每个层级知识元对应的关键词特征向量;进行语义化计算,得到每个层级知识元对应的多个语义特征;构建语义多维索引库;利用语义多维索引库对第一待查文本进行多层级查重查新。解决了现有比对库构建和查询方面存在的语义挖掘不足,数据处理效率低下以及索引机制低效的技术问题,达到了实现对文本深层语义的挖掘和多层级结构的利用,提高比对库的准确性和查询效率的技术效果。
主权项:1.一种支持语义查重查新的特征比对库构建方法,其特征在于,所述方法包括:导入领域文本库,利用知识元解析模块对所述领域文本库进行解析,输出多个层级知识元;对所述多个层级知识元分别进行关键词识别,输出每个层级知识元对应的关键词特征向量;对每个层级知识元对应的关键词特征向量进行语义化计算,得到每个层级知识元对应的多个语义特征,其中,所述多个语义特征包括语步标签、科研实体和文本向量;按照每个层级知识元对应的多个语义特征,构建语义多维索引库,其中,所述语义多维索引库包括多个索引比对库,且所述多个索引比对库与所述多个层级知识元相对应;利用所述语义多维索引库对第一待查文本进行多层级查重查新。
全文数据:
权利要求:
百度查询: 中国科学院文献情报中心 一种支持语义查重查新的特征比对库构建方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。