【发明公布】一种基于深度学习的工业软件故障报告判别方法_大连理工大学_202410537360.9

导航：龙图腾网> 最新专利技术> 一种基于深度学习的工业软件故障报告判别方法_大连理工大学_202410537360.9

申请/专利权人：大连理工大学

申请日：2024-04-30

公开（公告）日：2024-06-21

公开（公告）号：CN118228116A

主分类号：G06F18/241

分类号：G06F18/241;G06F18/10;G06N20/00

优先权：

专利状态码：在审-公开

法律状态：2024.06.21#公开

摘要：本发明属于软件测试技术领域，涉及一种用于提高软件故障报告处理效率的技术，具体为一种基于深度学习的工业软件故障报告判别方法，包括：按照关键词筛选收集GitHub上指定项目的故障报告、对导出的数据集进行预处理、数据扩充、数据清洗、模型训练和故障报告预测。本发明可用于不同工业软件项目的故障报告类型判别如开源项目Kratos、Dealii等；亦可根据特定软件项目的标准故障报告信息内容，对本发明的相关步骤进行适配，从而对该特定软件项目的故障报告进行判别分类。

主权项：1.一种基于深度学习的工业软件故障报告判别方法，其特征在于，包括如下步骤：步骤1：按照关键词筛选收集GitHub上指定项目的故障报告通过关键字筛选法，使用GitHub提供的项目仓库API收集状态为关闭的故障报告，这些故障报告在标题或是标签中出现需要检索的关键字；然后使用代码将提取的数据以结构化格式存储并导出至CSV文件；步骤2：对导出的数据集进行预处理首先对步骤1收集到的故障报告进行标记与分类，统一修改每条数据的标记名，标记名包括错误类别名、症状名和标签名；经过初步分类后判断是否为非程序错误并做出标记，继续提取故障报告内容中的日志信息，确定项目的标准日志输出格式；使用正则表达式并按照确定的标准日志格式进行数据清洗，最后获得每条故障报告中标准日志信息，并使用JSON文件操作模块将筛选后的数据输出为JSON文件；步骤3：数据扩充对步骤2中得到的JSON文件进行数据扩充，数据扩充目标：根据提取出的日志信息中的文件名以及提示的错误的函数名，获取对应函数的具体实现以及注释；将数据集中涉及的所有项目源文件从GitHub克隆到本地，通过编程获取文件路径和扩展名，然后遍历项目目录中的文件以查找指定源文件，判断查找的目标源文件是否存在，若不存在则跳过此条数据继续往下检索，若存在则使用正则表达式解析项目源代码，从中提取注释、函数名和函数实现扩充写入进JSON文件；步骤4：数据清洗对步骤3中获取的数据扩充文件进行数据清洗，输出为模型训练的输入数据集；预定义一个停用词表；使用正则表达式或其他字符串处理技术，去除文本中的特殊符号，包括标点符号、括号、引号；将经过清洗的数据输出为csv文件并分为两列，存储数据列和标签信息列；步骤5：模型训练a：选用预训练好的开源BERT-BASE-UNCASED模型进行微调，具体为：首先模型微调构建，在BERT的顶部添加两个线性层，用于分类目的，并设置dropout＝0.1和ReLU作为激活函数；使用步骤4中输出的数据集，通过与预训练模型对应的分词器，使用encode_plus方法将文本数据编码成模型能接受的输入格式，并将编码后的数据以字典形式返回，其中包括tokenIDs、attentionmask和tokentypeIDs以及对应判断标签；b：选用K折训练法，将数据集分成K个大小相等的子集；对于每个子集，将其作为验证集，其余K-1个子集作为训练集，训练模型并在验证集上评估性能，重复上述步骤K次并计算K次验证结果的平均值作为最终评估结果；进行模型微调训练并保存，同时输出模型训练日志；步骤6：故障报告预测使用步骤5中微调好的BERT-BASE-UNCASED模型进行故障报告的分类预测，输入新获取的故障报告中的信息，模型输出对该报告是否为一个真正的错误的预测，预测结果为Y或者N。

全文数据：

权利要求：

百度查询：大连理工大学一种基于深度学习的工业软件故障报告判别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：促进多面板用户设备的不连续接收_诺基亚技术有限公司_201880095028.4

下一篇：一种汽车排气管制作加工焊接装置_潍坊鸿洋机械科技有限公司_202410431304.7

相关技术

促进多面板用户设备的不连续接收_诺基亚技术有限公司_201880095028.4

一种汽车排气管制作加工焊接装置_潍坊鸿洋机械科技有限公司_202410431304.7

一种可变任意尺寸模具的挤吹机及其挤吹工艺_晋江里弗兰新材料有限公司_202410445743.3

一种露头岩层非均质性的模型构建方法_岭南师范学院_202310948270.4

轮胎磨损监测方法及系统_摩登汽车有限公司_202210397941.8

一种采棉机摘锭座管测量装置_浙江亚嘉采棉机配件有限公司_202410465107.7

一种镁合金阳极表面原位生成ZIF-8涂层的改性方法_桂林理工大学_202210904451.2

一种Invar合金焊丝及其制备、焊接方法_西安钢研功能材料股份有限公司_202311708375.9

股骨头坏死植入支架_中国人民解放军联勤保障部队第九二〇医院_202410475083.3

一种破碎硐室系统工程施工方法_湖南科技大学_202210657216.X

一种间隔条浇灌胶质的装置_河南金拇指防水工程有限公司_202210302950.4

一种发动机仿真模型的精度评估方法、装置以及电子设备_西安航天动力研究所_202410282665.X

软件相关技术

平台化软件架构系统_浙江吉利控股集团有限公司_202410367132.1

一种等离子体粒子模拟软件的软件设计框架_北京航空航天大学_202410338025.6

一种软件授权认证方法_北京比格大数据有限公司_202410658958.3

一种软件限位贴_广州市迪声音响有限公司_202410386505.X

软件自动测试方法及装置_中国工商银行股份有限公司_202110233769.8

软件安装方法、装置、电子设备及存储介质_重庆赛力斯凤凰智创科技有限公司_202410333563.6

EDA软件中电路板边缘自动圆角算法_三微电子科技(苏州)有限公司_202410376119.2

软件保护方法、装置、设备及存储介质_常熟理工学院_202011069555.3

一种具有多个接头的软件搭载装置_国网福建省电力有限公司_202421070213.7

车载软件执行方法、装置、车辆及存储介质_广州汽车集团股份有限公司_202211643229.8

故障相关技术

故障信号的诊断方法_清华大学_202410352549.0

减少轴承故障的设备_通用电气公司_202311357905.X

变电站故障仿真方法、装置和变电站实时故障仿真系统_中国能源建设集团广东省电力设计研究院有限公司_202410285542.1

一种电缆故障定点仪_淄博信易杰电气有限公司_202322937528.9

一种防滑的故障牌_唐山杰瑞科技有限公司_202323168907.2

远程设备故障报警装置_中科广通科技集团有限公司_202323160821.5

时钟故障修复方法和装置_中国移动通信集团山东有限公司_202211630334.8

干式电抗器的建模与故障预警方法、建模与故障预警系统_内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司_202210086030.3

一种飞机机轮故障应急牵移装置_江苏力洲汽车部件有限公司_202322829994.5

一种智能制造用故障警报装置_湖北晟泰智能工程有限公司_202323145530.9

报告相关技术

覆盖边缘中的功率余量报告_高通股份有限公司_201980024116.X

用于信道反馈报告的信道压缩_高通股份有限公司_202280075416.2

碳排放报告分析方法和系统_国义招标股份有限公司_202410424532.1

定位测量报告中的带宽指示_高通股份有限公司_202080057901.8

针对多个链路的增量信道状态信息报告_高通股份有限公司_202280075833.7

验机报告处理方法、装置、设备和存储介质_北京转转精神科技有限责任公司_202211649280.X

侧链路中的直接当前位置报告_高通股份有限公司_202280074802.X

UL同步的有效性状态的报告_上海诺基亚贝尔股份有限公司_202180103866.3

解释性结论报告生成方法、装置、设备及存储介质_深圳平安医疗健康科技服务有限公司_202111005629.1

一种空气质量检测采样装置及其评价报告生成管理系统_安徽标普环境检测技术有限公司_202111645739.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于深度学习的工业软件故障报告判别方法_大连理工大学_202410537360.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务