华院计算技术(上海)股份有限公司王玉帛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华院计算技术(上海)股份有限公司申请的专利一种人形机器人控制方法、系统、存储介质和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119238533B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411651055.9,技术领域涉及:B25J9/16;该发明授权一种人形机器人控制方法、系统、存储介质和程序产品是由王玉帛;沈旭立;曹培;虞钉钉;徐清;宣晓华设计研发完成,并于2024-11-18向国家知识产权局提交的专利申请。
本一种人形机器人控制方法、系统、存储介质和程序产品在说明书摘要公布了:本发明提供一种人形机器人控制方法、系统、存储介质和程序产品,属于计算机视觉领域。其中方法包括:预处理专家动作数据,将专家动作数据处理成和目标机器人骨骼架构相当的专家数据;在仿真环境中采用人形结构搭建机器人,配置机器人的关节参数,每个关节自由度由独立的物理控制模块进行控制;构建机器人的策略表征方法,包括状态空间、动作空间、奖励函数、多帧式控制方式;对机器人进行初始化;最小化每帧上的机器人动作与专家动作间的差异,最大化奖励函数,驱动机器人学习。本发明可以辅助人形机器人的学习过程,使得机器人可以在完成任务的同时拟人化,并且训练速度有所提升。
本发明授权一种人形机器人控制方法、系统、存储介质和程序产品在权利要求书中公布了:1.一种人形机器人控制方法,其特征在于,包括以下步骤: 预处理专家动作数据,将专家动作数据处理成和目标机器人骨骼架构相当的专家数据; 在仿真环境中采用人形结构搭建机器人,配置机器人的关节参数,每个关节自由度由独立的物理控制模块进行控制; 构建机器人的策略表征方法,包括状态空间、动作空间、奖励函数、多帧式控制方式; 所述状态空间包括骨盆相对于地面原点的位置、每段刚体的质心位置、旋转信息、线速度信息、角速度信息、时间变量; 所述多帧式控制方式包括: 将当前状态之前帧的历史状态拼接在一起,组成一个新的特征向量,作为策略网络的输入,捕捉动作间的时序信息; 所述策略网络的输入表征为: ; 其中,表示将当前状态的前帧历史状态拼接后组成的状态向量; 所述策略网络包括全连接网络、若干个LSTM模块和线性层网络; 在仿真环境模拟更新的每一步,将时序信息送入策略网络中,策略网络输出动作分布均值,然后从动作分布中采样生成一个动作; 所述动作分布表征为: ; 其中,为动作值,具体意义为关节旋转;s为仿真环境返回的机器人状态值;为状态到动作的条件概率分布,被建模为高斯分布;均值为由网络输出的,方差为一个固定的初始值; 对机器人进行初始化; 最小化每帧上的机器人动作与专家动作间的差异,最大化奖励函数,驱动机器人学习。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华院计算技术(上海)股份有限公司,其通讯地址为:200436 上海市静安区万荣路1256、1258号9楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。