首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于时序数据的日志模糊检索系统及方法 

申请/专利权人:东北大学

申请日:2024-04-28

公开(公告)日:2024-06-28

公开(公告)号:CN118260346A

主分类号:G06F16/2458

分类号:G06F16/2458;G06F16/22;G06F16/21;G06F16/248;G06F40/284

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明提供一种基于时序数据的日志模糊检索系统及方法,涉及日志检索技术领域。该方法具体包括:收集日志数据,并对收集到的日志数据进行分域处理,将每一条日志数据都划分为时间戳域、日志数据属性域和日志数据文本域;对日志数据文本域进行分词处理;从收集的日志数据中选取若干条日志数据并结合分词后日志数据的文本构建前缀字典树;根据收集的日志数据和前缀字典树进行索引构建,生成含有倒排链表和跳转链表的前缀索引树;用户选择模糊检索方式,同时获取用户的查询语句和给定的最大编辑距离阈值;根据用户选择的模糊检索方式对获取的查询语句模糊检索,生成模糊检索结果并进行可视化展示,从而实现对模糊检索效率的提升。

主权项:1.一种基于时序数据的日志模糊检索系统,其特征在于,该系统包括依次连接的:数据分域模块、文本分词模块、字典构建模块、索引构建模块、模糊检索模块与结果输出模块;所述数据分域模块,用于为输入的日志数据划分数据域,得到每条日志数据的时间戳、属性和文本;所述文本分词模块,用于对日志数据的文本进行分词处理,对文本中的字符串进行分割得到若干个语汇单元token,并输出由若干个语汇单元token构成的语汇单元流tokenstream,得到分词后日志数据的文本;所述字典构建模块,用于根据输入的前n条日志数据和语汇单元流tokenstream构建前缀字典树,并将该前缀字典树作为划分日志数据的依据;其中所述前缀字典树中从根节点到叶子节点的一条路径上的token集合组成了一个字典项;所述索引构建模块,用于根据前缀字典树对分词后日志数据的文本进行前缀索引树构建,以加快模糊检索的查询速度;所述模糊检索模块,用于根据前缀索引树对用户提供的查询语句进行模糊检索,生成模糊检索结果;所述结果输出模块,用于将生成的模糊检索结果进行可视化展示。

全文数据:

权利要求:

百度查询: 东北大学 一种基于时序数据的日志模糊检索系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。