首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种机器人基于先前最少信息量抓取不熟悉物体的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳慧智星晨科技有限公司

摘要:一种机器人基于先前最少信息量抓取不熟悉物体的方法。本发明引入了一种无需模型的深度强化学习DRL的抓取方案。这个框架称之为深度强化抓取策略DRGP。我们的系统只需在简单的几何对象上训练,就可以在新的对象上有效地进行泛化。所提出的自学习系统强调非策略学习方法,并通过试错的方式快速学习。该机器人训练端到端的策略从只进行视觉观察到决策以寻求最佳的抓取策略。感知网络利用完全卷积网络,将视觉观察映射为具有不同采样点的密集像素Q值的抓取动作。每一个像素代表一个机器人执行的原始动作的位置和姿态。在对有限的模拟对象进行训练后,所获得的知识成功地转移到现实生活场景中,并对新的对象未见过的对象进行泛化。

主权项:1.一种基于无模型DRL的端到端自学习方法。我们的智能体Agent,即机器人机械手从头开始学习,从视觉观察到决策,通过试错的方式,以非策略Q-learning框架的形式进行训练。DRGP不同于传统的先验方法,它需要启发式或硬编码参数。我们利用Q-learning的概念来解决机器人学习抓取动作的问题。机器人通过执行定义的动作与环境进行反复交互。根据环境中可能发生的变化,将响应作为奖励给机器人。智能体通过将未来的奖励最大化来逐步学习,这个过程不断地重复,直到环境中的问题得到解决。通过试错过程进行不同的动作组合。机器人寻找最佳的序列,直到环境达到终点状态。

全文数据:

权利要求:

百度查询: 深圳慧智星晨科技有限公司 一种机器人基于先前最少信息量抓取不熟悉物体的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。