恭喜大连海事大学曹志英获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜大连海事大学申请的专利一种基于流外正则化的日志序列异常检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114416479B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210031701.6,技术领域涉及:G06F11/30;该发明授权一种基于流外正则化的日志序列异常检测方法是由曹志英;王雪洁;王乔正;张秀国;徐伟刚设计研发完成,并于2022-01-12向国家知识产权局提交的专利申请。
本一种基于流外正则化的日志序列异常检测方法在说明书摘要公布了:本发明提供一种基于流外正则化的日志序列异常检测方法,该方法对BERT模型进行优化并将其作为语义特征提取模型,优化方法是将MixUp数据增强作为流外正则化的一种形式,在数据流形之外的模型输入空间上施加线性约束,将生成器和鉴别器分别嵌入到BERT模型的不同Encoder层。通过训练鉴别器来检测输入嵌入是否位于流形外,优化生成器来生成流形外嵌入,使其易于被鉴别器识别为流形外嵌入,以便发现对日志序列分类任务有用但通过单词访问不到的嵌入,提高异常检测的准确性。此外,本发明分别从日志条目与日志序列两个粒度上提取日志语义特征,不仅可以提取日志序列的语义特征,还可以提取到日志条目本身包含的语义信息,从而增强异常检测的鲁棒性。
本发明授权一种基于流外正则化的日志序列异常检测方法在权利要求书中公布了:1.一种基于流外正则化的日志序列异常检测方法,其特征在于,包括:S1、对BERT模型进行优化,并将其作为语义特征提取模型;所述步骤S1中,对BERT模型进行优化的方法如下:S11、将MixUp数据增强作为流外正则化的一种形式,在数据流形之外的模型输入空间上施加线性约束,将生成器和鉴别器分别嵌入到BERT模型的不同生成层;S12、训练鉴别器,检测输入嵌入是否位于流形外;S13、通过生成层产生的流形外嵌入以及标签优化生成器,生成流形外嵌入;S2、给定一个日志集合χ,对所述语义特征提取模型进行训练;所述步骤S2的具体实现过程如下:S21、日志解析,将每个日志事件转换为与关键参数相关联的特定事件模板,选择提取日志模板性能好的Drain算法,基于日志数据构建一个固定深度的解析树,根据树中蕴含的模板提取规则进行日志解析,从非结构化的日志事件中提取结构化日志键;S22、根据日志数据集的特点人工选择日志序列的框定方式,若数据集中有Block_id,则按照会话id划分日志序列;若没有,则以固定大小的滑动窗口框定日志序列;S23、将日志序列中的日志条目输入到BERT模型提取句向量;S24、判断该日志序列中是否还有未被处理的日志条目,若有,则执行步骤S23,直到所有日志条目均被处理完;S25、将该序列中所有句向量进行线性拼接,将得到初始序列向量vseq输入到优化BERT模型的Encoder层中;S26、基于MixUp对序列向量及其标签进行线性插值;S27、基于流形内嵌入和标签计算日志序列的分类损失,通过优化BERT模型的预训练权重系数对日志序列进行二分类,将流形内序列标签作为输出目标,采用KL散度作为损失函数,日志序列分类的目标函数如下所示: 其中,ωf代表优化BERT模型预训练与分类器的可训练参数,表示KL散度,函数fseqbatch是将seqbatch进行分类的函数;S28、基于流形内与流形外嵌入和标签计算分类损失并优化鉴别器,将流形内标签与流形外标签作为输出目标,采用二元交叉熵函数作为损失函数来优化鉴别器,目标函数如下所示: 其中,ωg,ωd分别代表生成器和鉴别器的可训练参数,表示二元交叉熵损失,为经过优化BERT模型的第j层编码输出的向量,为seqbatch经过优化BERT模型的第j层编码输出的向量;S29、将流形外序列标签作为输出目标,采用KL散度作为损失函数优化生成器,目标函数如下所示: 其中,表示生成层及后续Encoder层的可训练参数,ωg表示生成器的可训练参数;通过步骤S28中的目标函数和步骤S29中的目标函数优化生成器,使生成器生成对日志序列分类任务有帮助的流形外嵌入,则最终的分类目标函数被定义为: 其中,表示日志序列的分类损失,与分别代表为了辨别流形外嵌入而训练生成器和鉴别器的损失,e负责调节优化生成器的两个目标;S3、给定一个日志集合,利用训练完成的语义特征提取模型对日志序列进行异常检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连海事大学,其通讯地址为:116026 辽宁省大连市高新园区凌海路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。