买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种实现智能实时决策系统实时确定最优决策动作的方法_中国科学技术大学_202210180990.6 

申请/专利权人:中国科学技术大学

申请日:2022-02-25

公开(公告)日:2024-04-30

公开(公告)号:CN114462566B

主分类号:G06Q10/0637

分类号:G06Q10/0637;G06N3/092;G06Q10/04;G06Q50/26;G06Q50/06

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2022.05.27#实质审查的生效;2022.05.10#公开

摘要:本发明公开了一种实现智能实时决策系统实时确定最优决策动作的方法,包括以:步骤1,离散化决策过程:确定最小决策时刻间隔;步骤2,定义系统状态:根据系统状态建立蒙特卡洛树搜索模型;步骤3,训练状态转移模型:将智能实时决策系统的状态转移过程建模为状态转移模型,基于历史数据训练所述状态转移模型,测试模型精度并选择最优模型参数;步骤4,挂载状态转移模型:用状态转移模型,状态转移模型预测蒙特卡洛树搜索模型的下一时刻系统状态作为漂移后的根节点,在下一个决策时刻到达前完成搜索,根据决策结果确定智能实时决策系统的当前最优的决策动作。该方法实现了在智能实时决策系统中利用蒙特卡洛树搜索实时确定最优决策动作。

主权项:1.一种实现智能实时决策系统实时确定最优决策动作的方法,其特征在于,所述智能实时决策系统包括:智能电力调度系统、智慧交通控制系统、智能兵棋推演系统中的任一种,包括以下步骤:步骤1,离散化决策过程:根据智能实时决策系统的时序变化特征,确定出最小决策时刻间隔,通过所述最小决策时刻间隔对决策过程进行离散化,使所述智能实时决策系统在固定间隔的离散时间节点上进行决策;步骤2,定义系统状态:根据所述智能实时决策系统的动力特性,结合专家知识和特征工程方法,抽取关键的动力特征作为系统状态,建立蒙特卡洛树搜索模型,并根据所述系统状态的结构初始化蒙特卡洛树搜索模型的子节点数据结构,将该蒙特卡洛树搜索模型的最大搜索时间设置为所述步骤1中的最小决策时刻间隔;步骤3,训练状态转移模型:将所述智能实时决策系统的状态转移过程建模为状态转移模型,所述状态转移模型的输入为所述智能实时决策系统的当前时刻的系统状态和决策动作,输出为所述智能实时决策系统的下一时刻系统状态;基于历史数据训练所述状态转移模型,测试训练后所述状态转移模型的精度并选择最高精度的状态转移模型对应的最优模型参数;步骤4,挂载状态转移模型:用训练得出的最优模型参数对应的状态转移模型预测所述蒙特卡洛树搜索模型的子节点对应的系统状态,将所述状态转移模型预测的下一时刻系统状态作为漂移后的根节点,基于漂移后的根节点对所述蒙特卡洛树搜索模型进行蒙特卡洛树搜索,在蒙特卡洛树搜索的扩展步骤,用所述状态转移模型预测确定子节点初始化所需的系统状态,蒙特卡洛树搜索模型在下一个决策时刻到达前完成搜索并输出决策结果,根据决策结果找出的最大价值节点对应的边,以该边对应的动作作为所述智能实时决策系统的当前最优的决策动作。

全文数据:

权利要求:

百度查询: 中国科学技术大学 一种实现智能实时决策系统实时确定最优决策动作的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。