首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于随机森林算法的人像视图档案准确性检测方法_南京启数智能系统有限公司_202410413396.6 

申请/专利权人:南京启数智能系统有限公司

申请日:2024-04-08

公开(公告)日:2024-06-21

公开(公告)号:CN118015661B

主分类号:G06V40/10

分类号:G06V40/10;G06V20/70;G06V10/762;G06V10/764;G06V10/778;G06V10/774

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.05.28#实质审查的生效;2024.05.10#公开

摘要:本发明公开了一种基于随机森林算法的人像视图档案准确性检测方法,包括以下步骤:获取人像视图档案,人工标注人像视图档案是否正确,标注完成后对人像视图档案进行清洗、特征处理和增减;对处理后的数据进行向量化处理,并获得数据集;将数据集划分为训练集和测试集,并对训练集进行循环的训练,至随机森林模型能够对训练集训练的结果在预设范围内;然后再对随机森林模型进行验证,若随机森林模型的验证结果在预期范围内,则随机森林模型训练结束,反之将验证错的数据放至训练集,继续在训练集中对随机森林模型进行训练;本方法利用随机森林预测模型算法对人像视图档案进行聚类质量评估,分析出不同场景下不同算法的人像聚类准确性。

主权项:1.一种基于随机森林算法的人像视图档案准确性检测方法,其特征在于,包括以下步骤:S1,获取人像视图档案,人工标注人像视图档案是否正确,标注完成后对人像视图档案进行清洗、特征处理和增减;S2,对处理后的人像视图档案进行向量化处理,并获得数据集;S3,将数据集划分为训练集和测试集,并对训练集进行循环的训练,至随机森林模型能够对训练集训练的结果在预设范围内;S4,然后再对随机森林模型进行验证,若随机森林模型的验证结果在预期范围内,则随机森林模型训练结束,反之将验证错的数据放至训练集,继续在训练集中对随机森林模型进行训练;步骤S1还包括步骤:S101,获取人像视图档案,根据人像视图档案实际情况,人工对人像视图档案打上是否正确的标签,标签类型包括0或1,其中0表示错误、1表示正确;S102,对人像视图档案进行数据清洗和特征处理,并基于概率统计对人像视图档案进行增减;步骤S2还包括步骤:S201,将步骤S102清洗后的人像视图档案进行向量化处理,生成多维特征向量,并获得由向量和标签构成的数据集,其中向量的主要字段为人脸抓拍设备数量分布、车辆抓拍设备数量分布、年龄段数量分布、性别数量分布、戴口罩数量分布、戴帽子数量分布、侧脸数量分布和或俯仰照数量分布;步骤S3还包括步骤:S301,对步骤S201得到的数据集进行划分,将其中的80%作为训练集,剩余的20%作为测试集,并保证训练集与测试集内数据的标签类型的比例相同;S302,采用随机森林算法对训练集进行训练,以训练集中的向量作为特征X,以标签作为目标值Y,并通过网格搜索的调参方法调节模型参数,训练随机森林分类器内的若干个决策树,形成随机森林模型,其中基尼系数用作决策树节点的分裂标准;所述S4还包括步骤:S401,对随机森林模型做验证时采用五折交叉验证,既将数据平均分成五份,每次取其中一份做测试,剩余份数用来训练,实验五次后求平均值,并在测试集上输出ROC曲线对随机森林模型进行评估,若结果不符合预设标准,则返回步骤S3对随机森林模型进行再次训练及调参;S402,若结果符合预设标准则将该随机森林模型作为预测模型、导出并存储在分布式集群路径下;S403,根据步骤S402中预测模型在分布式集群存储的路径,加载该预测模型并且对测试集进行预测,预测结果包含四列,即archive_no,correct,probability,prediction;S404,在步骤S403的预测结果中,当probability值小于threshold值时,prediction为0,表示不可用,当probability值大于threshold值时,prediction为1,表示可用,其中,threshold值在预测时为预设的阈值。

全文数据:

权利要求:

百度查询: 南京启数智能系统有限公司 一种基于随机森林算法的人像视图档案准确性检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。