首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种抓取操作技能学习方法_青岛理工大学_202410268771.2 

申请/专利权人:青岛理工大学

申请日:2024-03-11

公开(公告)日:2024-06-21

公开(公告)号:CN118228773A

主分类号:G06N3/0464

分类号:G06N3/0464;B25J9/16;G06N3/0499;G06N3/045;G06N3/048;G06N3/084;G06V10/40;G06V10/82

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:本发明公开了一种抓取操作技能学习方法,属于机器人抓取技术领域,本发明通过减少在任何给定情况下可用的行动数量来实现更快的计划,有助于从数据中更高效和精确地学习模型,且在基于深度Q网络的视觉推动抓取VPG模型基础上,通过为推动动作网络和抓取动作网络分别训练一个可供性的网络模型,能够限制不合理抓取位姿和无效推动操作的行为,有效地提升了学习的效率,更好地提升抓取效率和抓取成功率。

主权项:1.一种抓取操作技能学习方法,其特征在于,包括以下步骤:S1、基于VPG模型,确定动作网络;S2、根据动作网络,采用前馈全卷积网络构建了可供性网络模型,其中,可供性网络模型具体包括推动动作可供性网络模型和抓取动作可供性网络模型;S2.1、在ImageNet数据库中预训练两个并行的121层前馈全卷积网络,然后进行通道级联,再加上2个额外的1x1卷积层与非线性激活函数和空间批归一化处理,然后进行上采样;S2.2、一个前馈全卷积网络将高度图的颜色通道作为输入,而另一个前馈全卷积网络则将高度图的深度通道作为输入,则构建了推动动作可供性网络模型和抓取动作可供性网络模型;S3、训练可供性网络模型;S3.1、对VPG训练多次操作进行数据收集,获取RGB高度图、深度高度图以及像素位置信息;S3.2、创建一个与输入图像大小相同的零矩阵,对于推动动作,计算执行推动操作前后深度高度图之间的像素点差值总和,若超过设定阈值τ,则设置执行该推动动作的像素位置点标签数值为1;对于抓取动作,若机器人夹爪手指之间对端距离超过设定阈值,设置该抓取动作的像素位置点标签为1;S3.3、将动作可供性标签、对应推动和抓取动作的深度和彩色信息分别输入搭建好的网络中;S3.4、从深度和颜色高度图中提取相关特征进行特征拼接后经过归一化和卷积处理,然后上采样出可供性预测数值,并使用Huber损失函数进行迭代训练;S4、通过所述可供性网络模型来输出抓取动作和推动动作的可供性预测数值,其中,包括推动可供性预测值Apush以及抓取可供性预测值Agrasp,如果某像素位置点的推动或抓取可供性预测数值为负值,则将该像素位置点的对应可供性预测数值设置为0;S5、将各个动作网络输出的期望值与对应可供性网络输出的可供性数值进行数乘运算,并根据结果决定最终执行动作。

全文数据:

权利要求:

百度查询: 青岛理工大学 一种抓取操作技能学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。