基于深度强化学习的最短路阻断方法和装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军国防科技大学

摘要：本申请涉及一种基于深度强化学习的最短路阻断方法和装置。所述方法包括：获取网络图，采用编码器将网络图映射至低维向量空间，得到动作表示向量和图状态表示向量，将动作表示向量作为强化学习的动作，图状态表示向量作为强化学习的状态，输入至解码器中，通过解码器将动作和状态建模为深度Q网络，并对深度Q网络进行训练，在输入待阻断网络图后，输出待阻断网络图的最优阻断方案。采用本方法使得深度学习解决最短路阻断问题成为可能。

主权项：1.一种基于深度强化学习的最短路阻断方法，其特征在于，所述方法包括：获取网络图；所述网络图中的节点为具备通讯功能的网络设备，起始节点和目标节点直接包含多条连接链路，所述网络设备由于攻击方攻击通讯功能损坏时，选择其他最短路径进行通讯；所述网络图表示为GN,A，N表示节点集合，A表示链路集合，K＝{α1,α2,…,αk}表示攻击方的有序阻断集合，αi表示阻断网络图G中的第i个节点，LG为网络图G中所有链路的长度之和，LG\{α1,α2,…,αk}表示按照有序阻断集合K＝{α1,α2,…,αk}的排列顺序依次阻断网络图G中的节点之后，图中的最短路径长度；采用编码器将所述网络图映射至低维向量空间，得到动作表示向量和图状态表示向量；其中，所述动作表示向量是对节点的位置信息、属性信息以及与其他节点的连接关系编码得到的；所述图状态表示向量是通过虚拟节点进行编码得到的，所述虚拟节点与所述网络图中节点相连，并且汇集所述网络图中节点的信息；所述编码器为图神经网络，根据所述图神经网络采用信息汇集方式对所述网络图的图结构进行特征传播，得到图状态表示向量；其中，第n传播轮次时，节点汇集n跳邻居节点的信息；将所述动作表示向量作为强化学习的动作，所述图状态表示向量作为强化学习的状态，输入至解码器中，通过解码器将所述动作和状态建模为深度Q网络，并对所述深度Q网络进行训练，在输入待阻断网络图后，输出所述待阻断网络图的最优阻断方案；对所述最优阻断方案的评价为： ANPL值越小，最优阻断方案越优。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学基于深度强化学习的最短路阻断方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种超声波诊断检查防护装置

下一篇：一种基于固体废物的晶须增强免烧多孔陶瓷及其制备方法

相关技术

一种超声波诊断检查防护装置

一种基于固体废物的晶须增强免烧多孔陶瓷及其制备方法

一种基于Wollaston棱镜的同步移相干涉装置及方法

一种接地线缆开关状态检测装置和检测方法

一种鞘管弹簧丝绕制装置

一种基于三嗪共价有机框架材料的制备及用途

一种葡萄糖传感器及其制备方法

一种模块化储能柜充放电优化控制方法及系统

一种多自由度解耦的波浪能发电装置及其工作方法

一种大数据检索方法、装置以及可读存储介质

一种各向异性复合纤维水凝胶及其制备方法

一种观赏树木运输种植装置及运输车

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度强化学习的最短路阻断方法和装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务