买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海有个机器人有限公司
摘要:本发明公开了一种基于主动学习技术的机器人数据收集迭代训练方法、系统以及储存介质,包括如下步骤:S1、取预设比例的已标注的图片数据作为训练数据,并将剩下比例的图片数据作为测试数据;S2、建立监督深度学习模型,并用所述训练数据对深度学习模型进行训练优所述监督深度学习模型;S3、用所述测试数据对所述监督深度学习模型检测结果的置信度进行检测;S4、制定机器人收集粗略业务数据集策略,并收集的粗略业务数据集;S5、引入主动学习课程指导主动学习过程挖掘对收集的粗略业务数据中低置信度样本进行人工标注,本专利借助主动学习技术,实现了一种半监督的机器人数据收集迭代系统,大大提高了数据收集的有效性,减少了人工标注的成本。
主权项:1.一种基于主动学习技术的机器人数据收集迭代训练方法,其特征在于,包括如下步骤:S1、取预设比例的已标注的图片数据作为训练数据,并将剩下比例的图片数据作为测试数据;S2、建立监督深度学习模型,并用所述训练数据对深度学习模型进行训练以优化所述监督深度学习模型;S3、用所述测试数据对所述监督深度学习模型检测结果的置信度进行检测;S4、制定机器人收集粗略业务数据集策略,并收集粗略业务数据集;S5、引入主动学习课程指导主动学习过程挖掘对收集的粗略业务数据中低置信度样本进行人工标注;还包括:收集和保存已标注的业务数据;将图片中所有待检测的目标标注,记录每个目标类别、位置信息;设定粗略收集业务数据的标准;在机器人运动决策层实施埋点,在机器人运动状态时,间隔预设时间内保存摄像头捕捉到的数据;当业务模型识别结果影响机器人规划决策时,此时的摄像头数据设定为关键数据,并按照时间戳命名的方式保存,最后整合两组数据去除同名文件;将业务池中收集到的未标注数据集打包分别放入模型池中4个不同规模的模型测试,保存不同模型的测试结果;4个不同模型分别为YogoMini训练模型、YogoSmall训练模型、YogoMedium训练模型和YogoBig训练模型;所述YogoMini训练模型是业务模型,其参数规模量小于YogoSmall训练模型、YogoMedium训练模型和YogoBig训练模型中任意一个的参数规模量;所述YogoSmall训练模型、YogoMedium训练模型和YogoBig训练模型均为参数规模模型,所述YogoSmall训练模型、YogoMedium训练模型和YogoBig训练模型的参数量规模依次增大;根据不同模型的测试结果采用交叉熵的策略筛选有效数据;所述交叉熵定义如下:CEs1,s2=s2lns1+1-s2ln1-s1其中,CE表示交叉熵,s1和s2是表示函数的输入参数,s1和s2分别来自YogoMini训练模型、YogoSmall训练模型、YogoMedium训练模型和YogoBig训练模中两个模型的置信度score;对粗略收集的业务数据集中所有数据按照Dscore排序升序,挑选出预设比例的数据作为初次筛选数据;Dscore表示4个模型置信度score的差异化,Dscore的计算过程为:Dscore=CEs1+s2+CEs2+s3+CEs3+s4其中,s1、s2、s3和s4分别表示YogoMini训练模型、YogoSmall训练模型、YogoMedium训练模型和YogoBig训练模型中各个模型的置信度score;按照各个模型定位差异筛选数据;采用交并比的方式算各个模型直接结果定位差异性,所述业务数据集中初次挑选后的数据按照Dbbox排序升序,再次挑选出第一预设比例数据作为最终筛选数据集结果;Dbboxi,bboxi+1=lnIOUbboxi,bboxi+1,其中,bboxi和bboxi+1分别是两个网络的预测结果,这两个结果是,是来自于两个不同的所述YogoMini训练模型、YogoSmall训练模型、YogoMedium训练模型和YogoBig训练模型,IOU表示交并比;引入主动学习采用人工微调模型的输出结果,剔除重复的、无效的数据,并将调整完毕的数据放入数据池中,更新模型池图片,标定文件及训练文件。
全文数据:
权利要求:
百度查询: 上海有个机器人有限公司 一种基于主动学习技术的机器人数据收集迭代训练方法、系统以及储存介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。