Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜哈尔滨工程大学三亚南海创新发展基地付金宇获国家专利权

恭喜哈尔滨工程大学三亚南海创新发展基地付金宇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜哈尔滨工程大学三亚南海创新发展基地申请的专利博弈策略规划方法、系统、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120010265B

龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510457530.7,技术领域涉及:G05B13/04;该发明授权博弈策略规划方法、系统、电子设备及存储介质是由付金宇;李晔;曹建;马腾;刘思佳;韩兆亮设计研发完成,并于2025-04-11向国家知识产权局提交的专利申请。

博弈策略规划方法、系统、电子设备及存储介质在说明书摘要公布了:本申请提供了一种博弈策略规划方法、系统、电子设备及存储介质,涉及人工智能技术领域,所述方法应用于多智能体,多智能体包括至少一个无人机和至少一个无人艇,所述方法通过实时获取目标博弈区域的环境数据、姿态数据、位置数据和博弈方数据,构建精确的环境模型及状态、动作空间,并运用蒙特卡洛算法与确定性策略梯度算法高效求解当前任务的目标函数,生成博弈反制策略集,并基于博弈反制策略集确定每个智能体执行当前任务的运动规划数据,控制每个智能体按规划执行任务,显著提升了多智能体的博弈反制策略生成准确性、任务分配准确性与任务执行效率。

本发明授权博弈策略规划方法、系统、电子设备及存储介质在权利要求书中公布了:1.一种博弈策略规划方法,其特征在于,应用于多智能体,多智能体包括至少一个无人机和至少一个无人艇,所述方法包括: 获取目标博弈区域的区域数据,所述区域数据包括环境数据、姿态数据、位置数据和博弈方数据; 根据区域数据进行环境建模,构建状态空间、动作空间及约束条件; 根据状态空间、动作空间及约束条件确定目标函数,并利用蒙特卡洛算法与确定性策略梯度算法求解生成博弈反制策略集; 根据当前任务的任务数据、所述区域数据和所述博弈反制策略集,确定当前任务的任务规划数据,所述任务规划数据包括每个智能体的运动规划数据; 控制每个智能体根据其对应的运动规划数据执行当前任务; 其中,利用蒙特卡洛算法与确定性策略梯度算法求解生成博弈反制策略集,包括:通过蒙特卡洛算法对状态空间和动作空间进行随机采样,模拟智能体行为并计算目标函数值,通过多次采样和计算获得初始解;基于所述初始解,采用确定性策略梯度算法优化策略参数,最大化目标函数,直至收敛或达到停止条件;提取策略参数优化过程中的最优策略,构建博弈反制策略集,具体为: 根据状态空间、动作空间和约束条件确定目标函数: 其中,为策略的参数,E为期望,s为状态空间内的状态,a为动作空间内与状态对应的动作,μ为策略,为状态s按照策略μ的分布采样,表示奖惩函数,奖惩函数用于根据奖励机制确定状态s在执行动作a后的奖励; 确定目标函数的梯度为: 其中,为从经验回放缓冲区D中采样得到的状态s的期望,为策略函数关于的梯度,为状态s下,智能体根据参数选择动作a的概率分布,为动作价值函数关于动作a的梯度,并将动作a固定为策略所选择的动作,为状态s下采取动作a,并遵循策略μ继续交互下去所获得的期望累积奖励; 基于蒙特卡洛算法、确定性策略梯度算法以及目标函数的梯度,确定使目标函数最大化的多个策略参数; 根据使目标函数最大化的多个策略参数和,确定多个初始博弈反制策略; 对所述多个初始博弈反制策略进行多轮迭代博弈仿真,并基于多轮迭代博弈仿真结果确定博弈反制策略集,博弈反制策略集用于示出智能体在目标博弈区域中可能遇到的各种情况下的最优应对博弈反制策略。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工程大学三亚南海创新发展基地,其通讯地址为:572000 海南省三亚市崖州区崖州湾科技城百泰产业园四号楼四楼A129区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。