买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西北工业大学;上海润璋智能科技股份有限公司
摘要:本发明公开了一种策略迭代算法及装置,涉及多智能体技术领域,用以解决现有涉及多个智能体之间协作与切换时,因拓扑关系无法修改导致团队协作无法体现的问题。该算法包括:根据追踪器在第步的第一状态、逃避器在第步的第一状态、在第步的状态改变量得到追踪器在第步的更新状态和逃避器在第步的更新状态;根据追踪器在第步的更新状态和逃避器在第步的更新状态确定追踪器与逃避器之间的第一距离,若第一距离满足交换公式,则根据交换公式对所述第一距离对应的边权进行交换,并更新邻接矩阵;若更新系统价值函数第一系统价值函数的差值绝对值小于错误阈值,将第步的更新控制策略确定为最终控制策略。
主权项:1.一种策略迭代算法,其特征在于,包括:根据追踪器在第步的第一状态和逃避器在第步中的第一状态,确定追踪器与逃避器在第步的第一状态误差以及系统在第步的第一系统价值函数;根据所述系统在第步的第一系统价值函数、输入函数、控制量饱和阈值依次得到在第步的第一状态价值信息、在第步的第一状态输出信息和在第步的第一控制策略;根据在第步的第一控制策略和系统状态函数得到在第步的状态改变量;根据所述追踪器在第步的第一状态、所述逃避器在第步的第一状态和在第步的状态改变量得到所述追踪器在第步的更新状态和所述逃避器在第步的更新状态;根据所述追踪器在第步的更新状态和所述逃避器在第步的更新状态确定追踪器与逃避器之间的第一距离,若所述第一距离满足交换公式,则根据交换公式对所述第一距离对应的边权进行交换,并更新邻接矩阵;若系统在第步的更新系统价值函数与系统在第步的第一系统价值函数的差值绝对值小于错误阈值,根据系统在第步的更新系统价值函数确定在第步的更新控制策略,将在第步的更新控制策略确定为最终控制策略。
全文数据:
权利要求:
百度查询: 西北工业大学 上海润璋智能科技股份有限公司 一种策略迭代算法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。