Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

多智能体系统在合作竞争关系下的反同步优化控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安庆师范大学

摘要:本发明公开了多智能体系统在合作竞争关系下的反同步优化控制方法,包括:设计自适应合作竞争强度函数;基于设计的合作竞争强度函数重新定义局部误差系统;根据局部误差系统设计合理的奖励函数,此奖励函数可以有效避免现有方法中的激励条件;使用深度决定性策略梯度算法近似最优控制策略时,采用演员‑评论家网络结构;在AC神经网络框架中,设计了一种经验回放和目标网络机制,以消除数据之间的相关性并调整AC神经网络的权重。本发明中的多智能体系统中包括合作‑竞争关系的多智能体,根据多智能体系统中智能体之间的交互关系将智能体分为两个组,这种复杂的内部关系比单一的合作或者竞争关系,更符合现实,实现反同步控制。

主权项:1.多智能体系统在合作竞争关系下的反同步优化控制方法,其特征在于,包括以下步骤:S1:根据多智能体系统之间的连接复杂性,确定系统的拓扑结构及拉普拉斯连接矩阵;S2:创建自适应合作竞争强度函数,基于此,构建新的局部误差系统并重新定义合理的性能函数;多智能体系统包括领导者与跟随者模式,每个智能体包含自身的状态信息,第i个智能体的状态信息表示为xik,xjk表示第j个智能体的状态信息,任意两个智能体之间的合作或者竞争关系分别表示为:xjk-xik和xjk+xik;S3:针对多智能体系统精确模型未知的情形,采用Actor-Critic网络结构分别近似智能体的控制动作和性能函数;S4:Critic对Actor近似的控制动作进行评价,Actor根据Critic的评价对控制动作进行调整,整个过程使用梯度下降更新,在训练神经网络参数时加入了经验回放和目标网络技术,当神经网络参数趋于稳定时,即获取到最优反同步的控制策略;所述S2设计自适应合作竞争强度函数时,使用改进后的DDPG算法近似未知精确模型进行多智能体系统的最优反同步控制;所述S2中的自适应合作竞争强度函数如下: 其中,sigmoid函数的表达式为基于此,重构内部误差系统 其中gi表示追随者是否与领导者之间有信息交互,gi=1表示追随者与领导者之间有信息交互,gi=0表示无;x0k表示领导者的状态信息,aij表示智能体之间的连接关系,aij=1表示智能体之间是合作关系,aij=-1表示智能体之间是竞争关系。

全文数据:

权利要求:

百度查询: 安庆师范大学 多智能体系统在合作竞争关系下的反同步优化控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。