Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学曹向辉获国家专利权

东南大学曹向辉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利一种处理通信延迟的多智能体强化学习方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116595373B

龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310571611.0,技术领域涉及:G06F18/214;该发明授权一种处理通信延迟的多智能体强化学习方法是由曹向辉;梅建国设计研发完成,并于2023-05-21向国家知识产权局提交的专利申请。

一种处理通信延迟的多智能体强化学习方法在说明书摘要公布了:本发明公开了一种处理通信延迟的多智能体强化学习方法,其特点是该方法采用基于通信的多智能体强化学习方法,使用通信缓存池代替延迟信息以及以Transformer为通信特征提取网络进行信息特征提取,再结合硬注意力机制、软注意力机制进一步完成信息整合,最终根据整合信息完成动作决策。本发明与现有技术相比更好地解决了多智能体通信过程中存在通信延迟问题,实现对延迟具有鲁棒性的通信协议,减轻通信延迟对于智能体决策的影响,实现在通信延迟情况下高效完成任务,使得多智能体强化学习能够应用于具有更强的现实通信约束的任务场景。

本发明授权一种处理通信延迟的多智能体强化学习方法在权利要求书中公布了:1.一种处理通信延迟的多智能体强化学习方法,该学习方法包括以下步骤: S1.初始化神经网络优化器梯度以及经验回放池 S2.构建任务环境,随机初始化所有智能体的位置以及对应的通信缓存池 S3.智能体根据自身对与环境的局部观测获得局部观测状态; S4.智能体通过通信内容生成网络生成包含隐藏特征的通信内容,再将通信内容通过广播的形式发送给其他队友; S5.智能体根据彼此之间的距离确定实时通信队友集合以及延迟通信队友集合; S6.基于实时通信队友集合以及延迟通信队友集合确定实时通信信息以及延迟通信信息; S7.基于随机确定的延迟跳数,延迟信息经过多跳延迟后在未来时刻被指定智能体接收; S8.智能体用通信缓存池中的信息代替当前时刻的延迟信息; S9.智能体根据当前接收到的信息以及延迟信息的代替信息更新通信缓存池; S10.智能体接收来自过去的延迟信息,忽视其中的过时信息并处理有效的延迟信息; S11.智能体通过通信特征提取网络整合所有通信信息; S12.智能体通过双重注意力网络针对整合信息计算通信信息权重; S13.智能体根据整合的信息以及通信信息权重计算动作策略以及动作策略价值函数; S14.智能体执行动作与环境交互,并获得相应的奖励和下一状态的局部观测状态; S15.将经验保存至经验回放池 S16.重复步骤S3-S15,直至达到单次训练回合最大次数或所有智能体完成任务; S17.使用经验回放池中的训练样本计算损失函数梯度,并使用神经网络优化器对整个网络进行优化; S18.重复步骤S2-S17不断优化网络,直至网络收敛或达到最大训练轮次。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。