申请/专利权人:深圳云天励飞技术有限公司
申请日:2019-12-31
公开(公告)日:2024-06-07
公开(公告)号:CN113127712B
主分类号:G06F16/906
分类号:G06F16/906;G06F18/23213;G06F18/214;G06V10/762;G06V10/774
优先权:
专利状态码:有效-授权
法律状态:2024.06.07#授权;2021.08.03#实质审查的生效;2021.07.16#公开
摘要:本申请适用于数据处理技术领域,提供了一种归档方法及装置,包括:对特征集的特征数据进行数据处理,获得训练后的模型及特征数据的聚类中心;根据训练后的模型对所有档案的封面和聚类中心进行计算,获得所有档案的封面的编码数据;根据封面编码数据对待处理档案进行归档。本申请通过对特征集的特征数据进行数据处理,预先获得特征集特征数据的聚类中心,实现对特征数据进行压缩处理,根据所有档案的封面和聚类中心计算,获得所有档案的封面的编码数据,在归档过程中直接获取待处理档案与档案的封面编码数据之间的距离,即可对待处理档案进行归档,减小了归档过程中的计算量和数据的存储量,提高了对待处理档案归档的处理效率。
主权项:1.一种归档方法,其特征在于,包括:对训练样本数据的特征集的特征数据进行数据处理,以获得该特征集的聚类中心;获取档案的封面;将所述档案的封面和所述特征集的聚类中心进行计算,以获得所述档案的封面的封面编码数据;根据所述封面编码数据对待处理档案进行归档;其中,所述将所述档案的封面和所述特征集的聚类中心进行计算,以获得所述档案的封面的封面编码数据,包括:获取每个档案的X个封面的特征数据;其中,X为正整数;将每个档案的每个封面的特征数据分成互不相交的P个部分;根据所述特征集的聚类中心对每个档案的每个封面的每个部分特征数据进行编码,获得所有档案的所有封面的所有部分的封面编码数据;所述根据所述封面编码数据对待处理档案进行归档,包括:计算特征集的每一个部分的聚类中心的距离向量池;将待处理档案的特征数据分成P个部分;根据特征集的聚类中心计算获得待处理档案的待处理档案编码数据;其中,所述待处理档案编码数据包括P个部分的档案编码数据;根据特征集的所有部分的聚类中心对应的距离向量池获取所述待处理档案的待处理档案编码数据与每一个档案的每一个封面的封面编码数据之间的相似度;计算所述待处理档案的待处理档案编码数据与每一个档案的所有封面的封面编码数据之间的相似度的平均值;获取所有平均值中的最大值,并比较所述最大值和预设的归档阈值的大小;若所述最大值大于或等于所述归档阈值,则判定所述待处理档案归档成功。
全文数据:
权利要求:
百度查询: 深圳云天励飞技术有限公司 一种归档方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。