首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种杂乱场景下机器人自主拾取与放置位姿获取方法 

申请/专利权人:湖南大学

申请日:2024-03-25

公开(公告)日:2024-05-28

公开(公告)号:CN118081758A

主分类号:B25J9/16

分类号:B25J9/16

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.14#实质审查的生效;2024.05.28#公开

摘要:本发明公开了一种杂乱场景下机器人自主拾取与放置位姿获取方法,该方案将相机获取的工作场景彩色、深度图像作为输入,利用语义分割模型获取目标信息并加强输入信息表征能力,采用一种演员‑评论家形式的深度强化学习方法自主移除障碍物探索目标物体位姿,再利用基于深度特征模板匹配的方法获取目标放置位姿,最后拾取放置物体到特定位姿,该方案可以实现在复杂场景中探索出被遮挡目标物体并放置到特定的位姿。该方案实现了依据拾取位姿对目标放置位姿的高精度定位,在杂乱场景中目标拾取成功率可达80%以上,从整体提高了目标放置位姿获取任务的成功率和稳定性。

主权项:1.一种杂乱场景下机器人自主拾取位姿获取方法,其特征在于,包括如下步骤:S1、获取工作空间中目标随机杂乱堆放且被障碍物遮挡场景的图像;S2、利用已知的相机外参对S1获得的图像做正交投影以及语义分割,得到彩色、深度高度图以及目标掩码,并对彩色、深度高度图以及目标掩码作等角旋转得到图像作为视觉观察;S3、构建并训练基于演员-评论家深度强化学习的目标拾取位姿获取模型;所述基于演员-评论家深度强化学习的目标拾取位姿获取模型由一个评论家网络和两个演员执行器组成,两个演员执行器分别为基于贝叶斯的演员执行器和基于分类器的演员执行器;所述目标拾取位姿获取模型训练过程中,以视觉观察作为强化学习状态表示,评论家网络依据状态信息评判所有潜在动作,演员执行器根据所有动作的得分和经验知识执行该状态下的最佳动作,改变当前状态得到下一个状态,以此往复,得到演员执行器的执行动作序列,移除障碍物后,演员执行器下一执行动作对应的位姿,作为最终获取最佳拾取位姿;在每一次迭代训练中视觉观察为输入信息,输出信息为机器人依据当前状态下做出的非抓握动作和或抓握动作;S4、将实时获取的图像按照S2处理后得到的视觉观察,输入训练好的目标拾取位姿获取模型,输出一系列不可预知的动作序列,通过不可预知的动作序列重新排列目标周围杂乱的物体来移除障碍物探索目标,直至目标周围空间满足无碰撞抓握时,获取该状态下的执行动作对应的目标最佳拾取位姿。

全文数据:

权利要求:

百度查询: 湖南大学 一种杂乱场景下机器人自主拾取与放置位姿获取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。