Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京同方智科科技有限公司王帅获国家专利权

恭喜北京同方智科科技有限公司王帅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京同方智科科技有限公司申请的专利基于联邦学习的分层多智能体博弈对抗和协同决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119443312B

龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510027115.8,技术领域涉及:G06N20/00;该发明授权基于联邦学习的分层多智能体博弈对抗和协同决策方法是由王帅;范黎;于斌;路静;唐微微设计研发完成,并于2025-01-08向国家知识产权局提交的专利申请。

基于联邦学习的分层多智能体博弈对抗和协同决策方法在说明书摘要公布了:本发明公开了基于联邦学习的分层多智能体博弈对抗和协同决策方法,包括:通过设立一个包含多个智能体的联邦学习框架,智能体分别位于不同的区域内,利用所在区域的数据进行局部模型的训练;联邦学习框架内,在每个智能体内部部署分层强化学习模型;利用分层强化学习模型,使多个智能体在博弈环境中进行对抗训练;在博弈对抗的基础上,对智能体进行监测,基于监测数据引入协同决策算法,协调多个智能体的行为;在达到预设的训练轮次或满足特定条件时,将本地模型参数上传至中央服务器,进行全局优化。本发明方法能够确保在保护隐私的前提下,实现多智能体间的高效协同与策略优化,在复杂多变的环境中保持高度的适应性和鲁棒性。

本发明授权基于联邦学习的分层多智能体博弈对抗和协同决策方法在权利要求书中公布了:1.基于联邦学习的分层多智能体博弈对抗和协同决策方法,其特征在于,该方法包括:步骤S1,设立一个包含多个智能体的联邦学习框架,智能体分别位于不同的区域内,利用所在区域的数据进行局部模型的训练;步骤S2,联邦学习框架内,在每个智能体内部部署分层强化学习模型,包括顶层策略控制模型和个体策略执行模型;步骤S3,利用分层强化学习模型,使多个智能体在博弈环境中进行对抗训练;步骤S4,在博弈对抗的基础上,对智能体进行监测,基于监测数据引入协同决策算法,协调多个智能体的行为,避免冲突和死锁,其中,监测数据包括智能体的位置、速度、决策选择、交互历史;步骤S5,在达到预设的训练轮次或满足特定条件时,每个智能体将本地模型参数上传至中央服务器,通过联邦学习框架共享模型参数进行全局优化,其中,预设的训练轮次指智能体利用所在区域数据进行局部模型训练的轮次,本地模型是智能体位于不同区域内的局部模型;其中在步骤S4中,还包括如下子步骤:S4-1,在博弈对抗的过程中,监测并记录各个智能体的行为、决策以及它们之间的相互作用;S4-2,基于监测数据,启动协同决策算法,利用分层强化学习模型的顶层策略控制层来协调多个智能体的行为,具体公式为: ;其中,表示智能体i的策略,表示智能体i的奖励函数,表示在时间t时的全局状态,表示智能体i在时间t时的动作,表示智能体i和智能体j之间由于动作冲突产生的成本,是调节冲突成本的权重系数;S4-3,根据协同决策算法的输出,调整各个智能体的策略选择,消除冲突和死锁,优化整体性能。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京同方智科科技有限公司,其通讯地址为:100080 北京市海淀区王庄路清华同方科技大厦A座25层室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。