首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】针对web入侵检测的输出内容过滤方法及系统_北京六方云信息技术有限公司;北京六方云科技有限公司_202110267964.2 

申请/专利权人:北京六方云信息技术有限公司;北京六方云科技有限公司

申请日:2021-03-11

公开(公告)日:2024-06-21

公开(公告)号:CN113094703B

主分类号:G06F21/55

分类号:G06F21/55;G06F16/906;G06F16/951;G06F16/9535;G06F16/955;G06F40/126;G06F40/284

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2021.07.27#实质审查的生效;2021.07.09#公开

摘要:本发明提供一种针对web入侵检测的输出内容过滤方法及系统,属于网络信息安全领域。所述方法包括:对待告警数据进行分词,得到待告警数据对应的数据词条;使用训练好的TF‑IDF模型提取所述数据词条的TF‑IDF特征矩阵;计算数据词条的TF‑IDF特征矩阵与训练集的TF‑IDF特征矩阵的相似度;若相似度大于或等于相似度阈值,则降低告警分数,否则保持告警分数不变。使用训练好的TF‑IDF模型计算待告警数据的TF‑IDF特征矩阵与历史数据的TF‑IDT特征矩阵比较相似度,相似度越大是入侵行为的概率越小,需要被过滤,可以快速进行过滤,不影响整体程序的进程。

主权项:1.一种针对web入侵检测的输出内容过滤方法,其特征在于,所述方法包括:对待告警数据进行分词,得到待告警数据对应的数据词条;使用训练好的TF-IDF模型提取所述数据词条的TF-IDF特征矩阵;计算所述数据词条的TF-IDF特征矩阵与训练集的TF-IDF特征矩阵的相似度,包括:对第一训练集中的各URL数据进行分词,得到各URL数据对应的URL数据词条;将各URL数据的URL数据词条个数和首字母对应的ASCII码值保存为特征;将各URL数据的每个URL数据词条对应的ASCII码值相加,得到各URL数据对应的一维向量;通过所述特征建立字典,将特征相同的URL数据划分为一类;根据各URL数据对应的一维向量计算各类URL数据的相似度;将同一类URL数据的相似度组成该类URL数据对应的相似度矩阵;若相似度大于或等于相似度阈值,则降低告警分数,否则保持告警分数不变;所述告警分数表示所述待告警数据的告警等级;所述训练好的TF-IDF模型的训练步骤包括:计算第一训练集中的URL数据间的相似度,得到不同类URL的对应的相似度矩阵;逐一对各个所述相似度矩阵进行聚类,得到各个所述相似度矩阵对应的公共URL;将得到的各个公共URL合并为第二训练集;使用第二训练集训练基础TF-IDF模型,得到训练好的TF-IDF模型;所述训练集的TF-IDF特征矩阵通过以下方式得到:使用训练好的TF-IDF模型从所述第二训练集中提取得到训练集的TF-IDF特征矩阵。

全文数据:

权利要求:

百度查询: 北京六方云信息技术有限公司;北京六方云科技有限公司 针对web入侵检测的输出内容过滤方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。