恭喜深圳市人工智能与机器人研究院罗冰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜深圳市人工智能与机器人研究院申请的专利基于联邦学习的强化学习的模型聚合方法以及相关设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114692893B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210320107.9,技术领域涉及:G06N20/00;该发明授权基于联邦学习的强化学习的模型聚合方法以及相关设备是由罗冰;叶霆威;肖文力;黄建伟设计研发完成,并于2022-03-29向国家知识产权局提交的专利申请。
本基于联邦学习的强化学习的模型聚合方法以及相关设备在说明书摘要公布了:本申请实施例公开了基于联邦学习的强化学习的模型聚合方法以及相关设备,用于在联邦学习的架构下,对每个机器人强化学习后得到的本地模型进行聚合,以提升训练效率。本申请实施例方法包括:在第M个聚合周期,接收参与联邦学习的多个机器人中每个机器人发送的目标本地模型和训练贡献;其中,目标本地模型为机器人在第M个聚合周期对聚合服务器发送的聚合模型进行训练得到的,当M为1时,聚合模型为预设的初始聚合模型,当M大于1时,聚合模型为第M‑1个聚合周期得到的目标聚合模型;训练贡献用于表示机器人训练目标本地模型耗费的资源;基于每个机器人的训练贡献聚合和多个机器人发送的目标本地模型,得到第M个聚合周期的目标聚合模型。
本发明授权基于联邦学习的强化学习的模型聚合方法以及相关设备在权利要求书中公布了:1.一种基于联邦学习的强化学习的模型聚合方法,其特征在于,应用于多机器人协作导航场景下的聚合服务器,所述方法包括:在第M个聚合周期,接收参与联邦学习的多个机器人中每个机器人发送的目标本地模型和训练贡献;其中,所述目标本地模型和所述训练贡献为所述机器人响应定时聚合请求发送的;所述目标本地模型为所述机器人在第M个聚合周期对所述聚合服务器发送的聚合模型进行训练得到的,当M为1时,所述聚合模型为预设的初始聚合模型,当M大于1时,所述聚合模型为第M-1个聚合周期得到的目标聚合模型;所述训练贡献用于表示所述机器人训练所述目标本地模型耗费的资源;基于所述每个机器人的训练贡献聚合和所述多个机器人发送的目标本地模型,得到第M个聚合周期的目标聚合模型;所述基于所述每个机器人的训练贡献聚合所述多个机器人发送的目标本地模型,得到第M个聚合周期的目标聚合模型,包括:基于公式计算第M个聚合周期的目标聚合模型的模型参数,其中,是第M个聚合周期目标聚合模型的模型参数,为第M个聚合周期每个机器人的目标本地模型的模型参数,为第M个聚合周期第n个机器人训练相应目标本地模型的训练贡献,包括第M个聚合周期第n个机器人训练使用的样本数量;根据目标聚合模型的模型参数确定所述第M个聚合周期的目标聚合模型;在向每个所述机器人发送定时聚合请求之后,所述方法还包括:接收每个所述机器人发送的第M个聚合周期的本地训练状况,所述本地训练状况包括所述机器人在第M个聚合周期训练聚合模型的训练幅度;基于每个所述机器人发送的第M个聚合周期的本地训练状况,判断第M+1个聚合周期是否满足预设调频条件;若第M+1个聚合周期满足预设调频条件,则调整预设时长,所述定时聚合请求按照预设时长定时发起。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市人工智能与机器人研究院,其通讯地址为:518129 广东省深圳市龙岗区坂田街道雅宝路1号星河WORLDG2-14、15层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。