买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南通大学
摘要:本发明提供了一种基于描述关键词抽取的缺陷报告严重程度预测方法,选择相应软件项目在缺陷跟踪系统中的缺陷摘要、缺陷描述与严重程度;对缺陷摘要进行分词、去停用词、词形还原处理;对缺陷描述进行字符串替换、关键词抽取、分词、去停用词、词形还原处理;基于严重程度对缺陷摘要与缺陷描述分别进行词向量模型的训练与构建,从而获取相对应的向量;基于向量采用逻辑回归分类方法获取缺陷报告严重程度预测模型;采用该模型预测软件项目中缺陷报告的严重程度。本发明的有益效果为:本发明采用从缺陷描述中提取的关键词对缺陷摘要进行补充,能实现更好的模型预测性能。
主权项:1.一种基于描述关键词抽取的缺陷报告严重程度预测方法,其特征在于,所述预测方法包括以下步骤:S1、从项目所在的缺陷跟踪系统中选择状态为CLOSED与FIXED,严重程度为Blocker、Critical、Major、Minor和Trivial的缺陷报告,并对上述缺陷报告的数据进行下载,其中,下载的字段包括缺陷摘要、缺陷描述和缺陷报告严重程度,基于此构成数据集;S2、对数据集中缺陷摘要字段中的文本依次进行分词、去停用词、词形还原处理,得到相应的分词集Ts;S3、利用步骤S2中的分词集Ts与所述数据集中的缺陷报告严重程度,使用词嵌入方法FastText训练并获取摘要词向量模型Fs,使用该模型对缺陷摘要进行向量表示,具体为:基于摘要词向量模型Fs获取缺陷摘要中每个分词的向量,对所述缺陷摘要中每个分词的向量求和得到缺陷摘要向量Es;S4、对数据集中缺陷描述字段进行关键词提取与表示,得到缺陷描述向量Ed;S5、合并所述缺陷摘要向量Es与所述缺陷描述向量Ed作为输入向量Einput;S6、基于所述输入向量Einput和数据集中的缺陷报告严重程度,使用逻辑回归分类方法,训练并得到缺陷报告严重程度预测模型;S7、输入新的缺陷报告,对其缺陷摘要进行步骤S2的处理,对其缺陷描述进行步骤S4的处理,基于步骤S5合并两向量并输入步骤S6所得缺陷报告严重程度预测模型,得到最终预测结果。
全文数据:
权利要求:
百度查询: 南通大学 一种基于描述关键词抽取的缺陷报告严重程度预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。