【发明授权】一种实现智能实时决策系统实时确定最优决策动作的方法_中国科学技术大学_202210180990.6

申请/专利权人：中国科学技术大学

申请日：2022-02-25

公开（公告）日：2024-04-30

公开（公告）号：CN114462566B

主分类号：G06Q10/0637

分类号：G06Q10/0637;G06N3/092;G06Q10/04;G06Q50/26;G06Q50/06

优先权：

专利状态码：有效-授权

法律状态：2024.04.30#授权;2022.05.27#实质审查的生效;2022.05.10#公开

摘要：本发明公开了一种实现智能实时决策系统实时确定最优决策动作的方法，包括以：步骤1，离散化决策过程：确定最小决策时刻间隔；步骤2，定义系统状态：根据系统状态建立蒙特卡洛树搜索模型；步骤3，训练状态转移模型：将智能实时决策系统的状态转移过程建模为状态转移模型，基于历史数据训练所述状态转移模型，测试模型精度并选择最优模型参数；步骤4，挂载状态转移模型：用状态转移模型，状态转移模型预测蒙特卡洛树搜索模型的下一时刻系统状态作为漂移后的根节点，在下一个决策时刻到达前完成搜索，根据决策结果确定智能实时决策系统的当前最优的决策动作。该方法实现了在智能实时决策系统中利用蒙特卡洛树搜索实时确定最优决策动作。

主权项：1.一种实现智能实时决策系统实时确定最优决策动作的方法，其特征在于，所述智能实时决策系统包括：智能电力调度系统、智慧交通控制系统、智能兵棋推演系统中的任一种，包括以下步骤：步骤1，离散化决策过程：根据智能实时决策系统的时序变化特征，确定出最小决策时刻间隔，通过所述最小决策时刻间隔对决策过程进行离散化，使所述智能实时决策系统在固定间隔的离散时间节点上进行决策；步骤2，定义系统状态：根据所述智能实时决策系统的动力特性，结合专家知识和特征工程方法，抽取关键的动力特征作为系统状态，建立蒙特卡洛树搜索模型，并根据所述系统状态的结构初始化蒙特卡洛树搜索模型的子节点数据结构，将该蒙特卡洛树搜索模型的最大搜索时间设置为所述步骤1中的最小决策时刻间隔；步骤3，训练状态转移模型：将所述智能实时决策系统的状态转移过程建模为状态转移模型，所述状态转移模型的输入为所述智能实时决策系统的当前时刻的系统状态和决策动作，输出为所述智能实时决策系统的下一时刻系统状态；基于历史数据训练所述状态转移模型，测试训练后所述状态转移模型的精度并选择最高精度的状态转移模型对应的最优模型参数；步骤4，挂载状态转移模型：用训练得出的最优模型参数对应的状态转移模型预测所述蒙特卡洛树搜索模型的子节点对应的系统状态，将所述状态转移模型预测的下一时刻系统状态作为漂移后的根节点，基于漂移后的根节点对所述蒙特卡洛树搜索模型进行蒙特卡洛树搜索，在蒙特卡洛树搜索的扩展步骤，用所述状态转移模型预测确定子节点初始化所需的系统状态，蒙特卡洛树搜索模型在下一个决策时刻到达前完成搜索并输出决策结果，根据决策结果找出的最大价值节点对应的边，以该边对应的动作作为所述智能实时决策系统的当前最优的决策动作。

全文数据：

权利要求：

百度查询：中国科学技术大学一种实现智能实时决策系统实时确定最优决策动作的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种沉香GC-MS指纹图谱的构建方法_莆田海关综合技术服务中心_202111293274.0

下一篇：微电网的控制方法及装置_北京天诚同创电气有限公司_202111653363.1

相关技术

一种沉香GC-MS指纹图谱的构建方法_莆田海关综合技术服务中心_202111293274.0

微电网的控制方法及装置_北京天诚同创电气有限公司_202111653363.1

刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

一种电石渣煅烧氧化钙粉体循环压球系统及工艺_江苏中圣园科技股份有限公司_202011333705.7

一种处理DMS红外光反射导致亮斑的系统_钧捷智能(深圳)有限公司_202310101483.3

一种新型的自动泊车系统车辆定位方法_英博超算(南京)科技有限公司_202111192951.X

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种全自动样品混合缩分装置及方法_青岛海关技术中心_201910859073.9

一种适用于热辅助治疗的硝酸2-(4-甲基噻唑-5-基)乙酯盐脑靶向脂质体_山东京卫制药有限公司_202311121383.3

一种基于水蓼的富磷生物炭及其制备方法与应用_四川农业大学_202211532429.6

RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

一种基于动网格模拟隧道列车运动的结构网格划分方法_天津大学_202111426137.X

龙图腾网&IPTOP

【发明授权】一种实现智能实时决策系统实时确定最优决策动作的方法_中国科学技术大学_202210180990.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务