首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种脏数据筛选方法_玩出梦想(上海)科技有限公司_202410144675.7 

申请/专利权人:玩出梦想(上海)科技有限公司

申请日:2024-02-01

公开(公告)日:2024-06-07

公开(公告)号:CN118155051A

主分类号:G06V10/98

分类号:G06V10/98;G06V10/764;G06V10/774;G06V10/82;G06N3/045;G06T7/70

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.25#实质审查的生效;2024.06.07#公开

摘要:本发明提供一种脏数据筛选方法,在特征提取步骤中,通过提取在视觉算法中的数据特征,将有效数据与脏数据区分开来,为了后续步骤提供了一个筛选基准。在训练步骤中,通过transformer训练一个脏数据筛选模型,当数据被输入脏数据筛选模型,这个脏数据筛选模型能够将其中的脏数据筛选出来。为了训练出准确率以及稳定性高的模型,将通过人工标注的方法先对样本数据进行标注。并在循环步骤中将人工标注的结果重新作为训练数据并重复训练出脏数据筛选模型,从而提升脏数据筛选模型的准确性以及稳定性。

主权项:1.一种脏数据筛选方法,其特征在于,具体包括如下步骤:数据采集步骤,通过多目相机实时采集环境图像作为样本数据,共采集N个样本数据,每一个样本数据为任意一帧中每一目相机所采集的环境图像的集合,所述环境图像能够包括目标物图像;特征提取步骤,在每一样本数据中提取d个包含目标物信息的特征;第一筛选步骤,随机抽取n个样本数据,使得nN,并对n个样本数据进行标注,确认每一个样本数据是否为脏数据;训练步骤,将n个样本数据置入一个transformer中,每一样本数据包含d个特征,获取针对所述样本数据的机器学习模型;以及第二筛选步骤,将每一样本数据置入所述机器学习模型中,获取每一样本数据的标签,每一样本数据的标签能够表示该样本数据是否为脏数据;若一个样本数据为脏数据,则该样本数据的标签的数值置为1;若一个样本数据不为脏数据,则该样本数据的标签的数值置为0。

全文数据:

权利要求:

百度查询: 玩出梦想(上海)科技有限公司 一种脏数据筛选方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。