恭喜中国人民解放军网络空间部队信息工程大学祝跃飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国人民解放军网络空间部队信息工程大学申请的专利基于数据挖掘的报文类型识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114417857B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111674303.8,技术领域涉及:G06F40/289;该发明授权基于数据挖掘的报文类型识别方法及装置是由祝跃飞;杨资集;吴魏;林伟;费金龙;何宇博;刘龙;董成城设计研发完成,并于2021-12-31向国家知识产权局提交的专利申请。
本基于数据挖掘的报文类型识别方法及装置在说明书摘要公布了:本发明属于报文类型识别技术领域,特别涉及一种基于数据挖掘的报文类型识别方法及装置,该方法包括首先对报文序列使用连续序列模式算法生成频繁连续子序列;然后通过关键连续序列模式算法在选出的频繁连续子序列上生成位置相关的候选关键字字段;其次基于因子图模型计算候选关键字字段成为关键字的概率;最后选取概率最大的候选关键字字段作为关键字确定报文类型。本发明使用数据挖掘快速确定候选关键字字段,并改进了概率约束关系,能够在耗时较短的情况下准确识别出关键字进而确定报文类型。
本发明授权基于数据挖掘的报文类型识别方法及装置在权利要求书中公布了:1.一种基于数据挖掘的报文类型识别方法,其特征在于,包含以下步骤:步骤1、对报文序列使用连续序列模式算法生成频繁连续子序列;所述连续序列模式算法具体包含以下步骤:首先从所有序列中提取长度为1个基本长度的子序列并将它们存储在子序列集中;然后在长度为l–1个基本长度的子序列中计算达到最小支持度的频繁连续子序列,其中支持度定义为包含目标子序列的序列数,并根据Apriori策略使用长度为l–1的频繁连续子序列来生成长度为l的连续子序列,迭代执行此步骤直到不能提取新的连续子序列为止;最后取所有频繁连续子序列的并集并将被集合内其它序列包含的子序列删除,按支持度降序排序后返回;步骤2、通过关键连续序列模式算法在选出的频繁连续子序列上生成位置相关的候选关键字字段,多个候选关键字字段组成候选关键字字段集合;所述通过关键连续序列模式算法在选出的频繁连续子序列上生成位置相关的候选关键字字段,具体包括:首先在频繁连续子序列集合中挑选满足以下三个条件的子序列:1子序列位置标准差小于预设值,表明该子序列的位置变动范围不大;2子序列的支持度不是1,表明该子序列没有出现在所有的报文中;3子序列不存在一个已有的候选关键字字段中,防止重复计算;然后创建一组不包含满足上述条件的子序列的报文序列集合并根据当前频繁连续子序列的最小起始位置和最大结束位置截断这些报文序列;最后在新创建的报文序列上运行连续序列模式算法,如果有获取新的频繁连续子序列则将连续序列模式算法得到的结果与当前频繁连续子序列共同组成一个候选关键字字段集合并按照候选关键字字段结构进行信息保存;步骤3、基于因子图模型计算候选关键字字段集合中的候选关键字字段成为关键字的概率;步骤4、选取概率最大的候选关键字字段作为关键字确定报文类型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军网络空间部队信息工程大学,其通讯地址为:450000 河南省郑州市高新区科学大道62号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。