首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种多日志源的日志泛化方法及装置 

申请/专利权人:北京长亭科技有限公司

申请日:2024-04-25

公开(公告)日:2024-06-25

公开(公告)号:CN118069898B

主分类号:G06F16/901

分类号:G06F16/901;G06F16/903

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.06.11#实质审查的生效;2024.05.24#公开

摘要:本发明公开了一种多日志源的日志泛化方法及装置,涉及数据处理技术领域。方法包括:获取日志源的原始日志;加载与日志源的设备ID对应的多个解析规则池,每个解析规则池中包含有标识所述原始日志的解析规则的关键特征;基于关键特征,按照优先级从高到低的顺序依次在多个解析规则池中筛选对应日志源的设备ID的解析规则,将筛选出的解析规则与原始日志进行匹配;若匹配不成功则进入下一优先级的解析规则池中继续对解析规则和原始日志进行匹配;若匹配成功则用匹配成功的解析规则对原始日志进行解析;在原始日志解析成功后,输出标准化日志。本发明提供更高效的日志匹配引擎,提升了对海量数据的处理能力以及处理的准确性。

主权项:1.一种多日志源的日志泛化方法,其特征在于,包括:预先获取日志样本,所述日志样本中绑定有日志源的设备ID;校验所述日志样本的类型,并将日志样本的类型与解析规则的类型匹配;其中,所述解析规则的类型包括独享关键字、正则解析、共享关键字和分隔符;提取日志样本中与解析规则的类型相关的内容作为关键内容,并将所述关键内容与解析规则名称、设备ID绑定后存储至相应类型的解析规则池中;获取日志源的原始日志,所述原始日志中绑定有该日志源的设备ID;加载与该日志源的设备ID对应的多个解析规则池,所述多个解析规则池包括优先级由高到低依次排列的独享关键字规则池、正则规则池、共享关键字规则池和分隔符规则池中的至少一个;其中,每个解析规则池中包含有标识所述原始日志的解析规则的关键特征;基于所述关键特征,按照优先级从高到低的顺序依次在多个解析规则池中筛选对应日志源的设备ID的解析规则,将筛选出的解析规则与所述原始日志进行匹配;若匹配不成功则进入下一优先级的解析规则池中继续对解析规则和原始日志进行匹配;若匹配成功则用匹配成功的解析规则对所述原始日志进行解析;其中,所述将筛选出的解析规则与所述原始日志进行匹配的步骤包括:将日志样本中的字段构成的多个关键字作为所述独享关键字规则池和共享关键字规则池中的解析规则的关键特征;将每个解析规则对应的关键字字符串分解为多叉树结构,多叉树结构中的每个节点表示字符串中的每个字符;用获取的原始日志中的关键字字符串中的每个字符与所述多叉树的节点进行匹配,若所述节点未匹配成功,则返回至该节点的父节点处继续尝试匹配该父节点的下一个子节点,直至所述关键字的每个字符均匹配成功,则表示解析规则的该关键字被命中;检测命中的解析规则的关键字的数量,将命中关键字最多的解析规则作为与原始日志匹配成功的解析规则;在原始日志解析成功后,输出标准化日志。

全文数据:

权利要求:

百度查询: 北京长亭科技有限公司 一种多日志源的日志泛化方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。