首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

在训练和细化机器人控制策略中使用模仿学习的系统和方法 

申请/专利权人:谷歌有限责任公司

申请日:2022-02-04

公开(公告)日:2024-06-25

公开(公告)号:CN117295589B

主分类号:B25J9/16

分类号:B25J9/16

优先权:["20210316 US 17/203,296"]

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.01.12#实质审查的生效;2023.12.26#公开

摘要:本文描述的实现方式涉及使用模仿学习技术来训练和细化机器人控制策略。机器人控制策略可以基于各种机器人任务的人演示来初始训练。此外,机器人控制策略可以基于在机器人执行机器人任务时的人为干预来细化。在一些实现方式中,机器人控制策略可以确定机器人是否将在机器人任务的执行中故障,并且提示人为干预机器人任务的执行。在附加的或替代的实现方式中,动作序列的表示可以在视觉上显现以呈现给人,并且人可以主动干预机器人任务的执行。

主权项:1.一种使用一个或多个处理器实现的方法,所述方法包括:从机器人的一个或多个视觉组件接收捕获机器人的环境的视觉数据实例,所述视觉数据实例是在机器人对机器人任务的执行期间被捕获到的;使用机器人控制策略处理视觉数据实例以生成要由机器人在机器人任务期间执行的动作序列,所述动作序列包括要由机器人执行以推进机器人任务的初始动作和被预测为跟随所述初始动作的多个预测动作;基于使用机器人控制策略处理视觉数据实例,确定机器人是否会在机器人任务的执行中故障;以及响应于确定机器人会在机器人任务的执行中故障:使提示经由计算设备或机器人的界面显现,所述提示请求计算设备的用户干预机器人任务的执行;基于所述提示,从计算设备的用户接收干预机器人任务的执行的用户输入,所述用户输入是经由计算设备或附加计算设备的输入设备被接收的;以及基于所述用户输入使机器人控制策略被更新,响应于确定机器人不会在机器人动作的执行中故障,使机器人执行初始动作;以及直到机器人完成机器人任务的执行为止:从机器人的视觉组件中的一个或多个接收捕获机器人的环境的附加视觉数据实例,所述附加视觉数据实例是在机器人对机器人任务的执行期间被捕获到的;使用机器人控制策略处理附加视觉数据实例以生成要由机器人在机器人任务期间执行的附加动作序列,所述附加动作序列包括要由机器人执行以推进机器人任务的下一个动作和被预测为跟随所述下一个动作的附加多个预测动作;以及基于使用机器人控制策略处理附加视觉数据实例,确定机器人是否会在机器人任务的执行中故障。

全文数据:

权利要求:

百度查询: 谷歌有限责任公司 在训练和细化机器人控制策略中使用模仿学习的系统和方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。