首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于有效载荷的网络攻击检测方法、系统及介质 

申请/专利权人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

申请日:2024-02-28

公开(公告)日:2024-06-25

公开(公告)号:CN117792803B

主分类号:H04L9/40

分类号:H04L9/40;G06F18/2415;G06F18/2433;G06F18/214;G06F16/35;G06F40/284;G06N3/0455;G06N3/088;G06N3/09

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明提供了一种基于数据包有效载荷预训练模型的网络攻击检测方法、系统及介质,该方法包括:对数据集中的网络流量包进行切分,获得网络会话流粒度的网络数据包有效载荷序列;对数据集的正常流量和网络攻击流量进行均衡采样,使用滑动窗口对有效载荷进行切分;将有效载荷切分后获得的字节对序列经分词器处理后输入Bert模型进行预训练,在预训练Bert模型时将网络会话流类比于文档,将网络数据包有效载荷类比于句子:加载已预训练的Bert模型,结合分类器在新的数据上进行微调,采用微调后的网络攻击检测模型检测网络攻击。本发明能更好地捕获网络数据包有效载荷的信息,以便于通过网络数据包有效载荷预训练模型检测网络攻击。

主权项:1.一种基于数据包有效载荷预训练模型的网络攻击检测方法,其特征在于,所述方法包括以下步骤:步骤S10,提取有效载荷:使用Python3中的网络流量基本信息提取库flowcontainer对数据集中的网络流量包进行切分,获得网络会话流粒度的网络数据包有效载荷序列;步骤S20,有效载荷处理:对数据集的正常流量和网络攻击流量进行均衡采样,并依据Bert模型的输入长度限制,使用滑动窗口对有效载荷进行切分;步骤S30,预训练Bert模型:将有效载荷切分后获得的字节对序列经分词器处理后输入Bert模型进行预训练,在预训练Bert模型时将网络会话流类比于文档,将网络数据包有效载荷类比于句子;步骤S40,微调已预训练的Bert模型进行网络攻击检测:加载已预训练的Bert模型,结合分类器在新的数据上进行微调,采用微调后的网络攻击检测模型检测网络攻击;所述步骤S30采用基于掩盖的语言模型预测任务对Bert模型进行训练,输入形式为有效载荷字节对序列;所述步骤S30包括:使用分词器对字节对序列添加开始分隔符和结尾分隔符,并进行分词获得数字编码数组,将数字编码数组输入到Bert模型进行基于掩盖的语言模型预测任务的预训练;所述分词器是对步骤S20处理后获得的所有字节对序列构成的数据集训练得到,所述分词器用于对字节对序列进行分词,并将字节转换为Bert模型能识别的数字编码;所述步骤S40包括:使用步骤S20处理后的网络检测数据集微调网络攻击检测模型,使用分词器处理字节对序列集合X′=[x′1,x′2,...,x′m]获得数字编码数组集合Z′=[z′1,z′2,...,z′m],将数字编码数组集合Z′=[z′1,z′2,...,z′m]和标签序列Y′=[y′1,y′2,...,y′m]按照字节对序列和标签z′,y′格式输入到结合分类器的BERT模型中进行微调训练,更新模型参数:1已预训练完成的BERT模型将数字编码数组z′转换为高维表示,每个数字编码由一个768维的向量表示,这个768维的向量蕴含着数字编码对应字节对的信息;表示句子开头的分隔符[CLS]对应的向量表示可以表征整个句子,可以用作后面分类器的输入;2将分隔符[CLS]对应的768维向量输入到分类器中得到分类结果y″,计算y′与y″的损失值来更新BERT模型和分类器的参数。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于有效载荷的网络攻击检测方法、系统及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。