一种机器人基于先前最少信息量抓取不熟悉物体的方法

导航：龙图腾网> 最新专利技术> 一种机器人基于先前最少信息量抓取不熟悉物体的方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：深圳慧智星晨科技有限公司

摘要：一种机器人基于先前最少信息量抓取不熟悉物体的方法。本发明引入了一种无需模型的深度强化学习DRL的抓取方案。这个框架称之为深度强化抓取策略DRGP。我们的系统只需在简单的几何对象上训练，就可以在新的对象上有效地进行泛化。所提出的自学习系统强调非策略学习方法，并通过试错的方式快速学习。该机器人训练端到端的策略从只进行视觉观察到决策以寻求最佳的抓取策略。感知网络利用完全卷积网络，将视觉观察映射为具有不同采样点的密集像素Q值的抓取动作。每一个像素代表一个机器人执行的原始动作的位置和姿态。在对有限的模拟对象进行训练后，所获得的知识成功地转移到现实生活场景中，并对新的对象未见过的对象进行泛化。

主权项：1.一种基于无模型DRL的端到端自学习方法。我们的智能体Agent，即机器人机械手从头开始学习，从视觉观察到决策，通过试错的方式，以非策略Q-learning框架的形式进行训练。DRGP不同于传统的先验方法，它需要启发式或硬编码参数。我们利用Q-learning的概念来解决机器人学习抓取动作的问题。机器人通过执行定义的动作与环境进行反复交互。根据环境中可能发生的变化，将响应作为奖励给机器人。智能体通过将未来的奖励最大化来逐步学习，这个过程不断地重复，直到环境中的问题得到解决。通过试错过程进行不同的动作组合。机器人寻找最佳的序列，直到环境达到终点状态。

全文数据：

权利要求：

百度查询：深圳慧智星晨科技有限公司一种机器人基于先前最少信息量抓取不熟悉物体的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电力标准知识的标签自动化标注方法、系统及存储介质

下一篇：一种观赏树木运输种植装置及运输车

相关技术

电力标准知识的标签自动化标注方法、系统及存储介质

一种观赏树木运输种植装置及运输车

柔性石墨烯霍尔传感器及其制备方法

一种不等厚火山口玻璃后盖周抛方法

一种重型机械龙门自动焊接装置

一种高效的柔性钙钛矿太阳能电池封装方法

一种家具耐用性综合测试平台及其测试方法

一种齿轨车的制动方法、装置、设备及存储介质

一种高速机械磨削主轴加工装置

一种人脸识别环卫作业电子工牌

制氢装置以及氢发电系统

用于车辆空调系统的控制方法、装置、程序产品及介质

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种机器人基于先前最少信息量抓取不熟悉物体的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务