Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜达闼机器人股份有限公司崔文昊获国家专利权

恭喜达闼机器人股份有限公司崔文昊获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜达闼机器人股份有限公司申请的专利智能体的训练方法、装置、存储介质及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114706381B

龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210209711.4,技术领域涉及:G05D1/43;该发明授权智能体的训练方法、装置、存储介质及电子设备是由崔文昊;肖羽佳设计研发完成,并于2022-03-04向国家知识产权局提交的专利申请。

智能体的训练方法、装置、存储介质及电子设备在说明书摘要公布了:本公开涉及一种智能体的训练方法、装置、存储介质及电子设备,涉及终端技术领域,该方法包括:从环境引擎中获取环境状态信息,环境引擎中包括预先建立的虚拟环境,虚拟环境包括至少一个物体对应的物体对象,以及智能体对应的智能体对象,环境状态信息用于指示虚拟环境中的每个物体对象和智能体对象的状态。根据环境状态信息以及智能体包括的控制模型,确定控制信息,并将控制信息发送至环境引擎,以使环境引擎根据控制信息控制虚拟环境中的物体对象以及智能体对象。从环境引擎中获取更新后的环境状态信息,并根据更新后的环境状态信息确定目标奖励。根据目标奖励训练控制模型。本公开能够降低智能体训练的复杂度,并提高智能体训练的准确性。

本发明授权智能体的训练方法、装置、存储介质及电子设备在权利要求书中公布了:1.一种智能体的训练方法,其特征在于,所述方法包括:从环境引擎中获取环境状态信息,所述环境引擎中包括预先建立的虚拟环境,所述虚拟环境包括至少一个物体对应的物体对象,以及智能体对应的智能体对象,所述环境状态信息用于指示所述虚拟环境中的每个所述物体对象和所述智能体对象的状态;根据所述环境状态信息以及所述智能体包括的控制模型,确定控制信息,并将所述控制信息发送至所述环境引擎,以使所述环境引擎根据所述控制信息控制所述虚拟环境中的所述智能体对象;从所述环境引擎中获取更新后的环境状态信息,并根据所述更新后的环境状态信息确定目标奖励;根据所述目标奖励训练所述控制模型;所述根据所述环境状态信息以及所述智能体包括的控制模型,确定控制信息,并将所述控制信息发送至所述环境引擎,包括:对所述环境状态信息进行语义识别,以得到所述环境状态信息中包含的语义信息,所述语义信息包括:所述虚拟环境中的每个所述物体对象和所述智能体对象的位姿和属性;将所述语义信息作为所述控制模型中动作网络的输入,以得到所述动作网络输出的控制指令;将所述控制指令封装为所述控制信息,并将所述控制信息发送至所述环境引擎,所述控制信息包括:所述智能体的控制速度、控制角度、控制位置坐标和目标关节的控制角度中的至少一种;所述对所述环境状态信息进行语义识别,以得到所述环境状态信息中包含的语义信息,包括:对所述环境状态信息进行语义识别,以得到所述虚拟环境中的目标物体对象的中心位置、轴线位置,所述虚拟环境中障碍物体对象的包围盒坐标,以及所述智能体对象的目标部位的中心位置;或者,对所述环境状态信息进行语义识别,以得到预设区域内每个子区域的标识,所述预设区域为所述虚拟环境中与所述智能体对象满足预设位置关系的区域,所述子区域为按照预设尺寸对所述预设区域内进行划分得到的区域,每个子区域的标识用于指示该子区域内包含的对象的种类,所述种类包括:目标物体对象、障碍物体对象、智能体对象。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人达闼机器人股份有限公司,其通讯地址为:201111 上海市闵行区中青路207号8幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。