一种基于大语言模型的完型填空式复杂测试输入生成方法

导航：龙图腾网> 最新专利技术> 一种基于大语言模型的完型填空式复杂测试输入生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京大学

摘要：本发明提出了一种基于大语言模型的完型填空式复杂测试输入生成方法。该方法利用大规模预训练的语言模型，将软件测试输入的构造问题转化为一个完型填空的任务。通过将复杂测试输入中的部分内容遮盖住，然后使用大语言模型填充缺失的输入单元，可以有效检测出潜在的缺陷。这种方法的优势在于不需要事先构建复杂的语法规则或模板，而是通过利用语言模型的强大语言理解和生成能力，能够生成合法且多样化的复杂测试输入。同时，由于语言模型可以对大量的文本数据进行预训练，因此可以较好地捕捉到不同软件测试输入的特性和行为，可以有效地辅助测试人员发现复杂软件系统中的潜在问题。

主权项：1.一种基于大语言模型的完型填空式复杂测试输入生成方法，其特征在于使用大语言模型来自动化地生成拥有触发复杂基础软件系统缺陷能力的测试用例，通过监测被测软件系统的状态、分析其输出结果进行验证，也可通过分析同一软件系统的不同实现所得到的输出来检测其中的缺陷。也就是说，该方法支持软件系统的自验证，也适用于差分测试的场景。该方法能够自动化地检测出复杂软件系统中的缺陷，有助于提高软件系统的正确性与可靠性。本方法主要包括下列步骤：1构建数据集：构建数据集时，可以直接利用已有数据集，也可以设计爬虫程序获取被测系统对应的软件开源仓库中的测试输入，并在此基础上进行数据清洗和数据扩增。软件开源仓库中的部分测试用例包含触发其缺陷的关键元素，可以帮助模型学习到如何生成能够有效触发被测系统缺陷的输入特点，有效检测其中的缺陷。2微调模型：为了使得大语言模型可以生成被测软件系统需要的代码，需要对原有的大语言模型进行微调。微调是一种迁移学习技术，即针对特定任务要求对预先训练好的模型进行进一步训练。需要注意的是，这一步的大语言模型可以是任何生成式的预训练大语言模型。将步骤1中的数据集作为训练样本，使用字节对编码BPE对数据集中的代码进行编码，从而进行微调。为了适应硬件资源受限的情况，可以仅对模型的部分层进行训练，可使用不同优化器加快模型收敛速度。3完型填空策略生成测试用例：通过完型填空的策略生成新的测试用例。从数据集中随机选择一个初始种子，对其进行轻量化的分析和处理，例如针对rust程序，可以提取其中的括号结构“”、“[]”、“{}”和“”等，将括号中的内容用“＜insert”标记进行替代，利用微调后的大语言模型根据代码上下文对“＜insert”标记所在的位置进行填充，生成新的测试用例。对于SMT测试输入，可以将公式中的部分子公式替换“＜insert”标记，再使用大模型进行填充补全。在该过程中，可以通过改变大语言模型的温度参数，或者构建不同的模型提示来生成多样化的测试用例。4通过编译输出来判断缺陷并通过堆栈信息进行重复缺陷的过滤：通过被测系统的输出来判断缺陷。这里，该方法能够检测的基础软件系统中的缺陷主要包括以下几类：1程序崩溃或内部错误：程序发生assertionviolation或者segmentationfault等错误导致求解器不正常地终止，以及编译器发生内部错误，即“InternalCompilerError”；2性能缺陷：当系统软件一直处于运行状态而始终无法输出结果，则说明是一个潜在的性能缺陷；3正确性缺陷：被测软件给出错误的输出结果。当被测系统具有两个或以上的不同实现时，可以通过检查不同实现所得输出是否一致来判断其中是否存在缺陷。例如针对编译器而言，如果编译器所产生的可执行文件在相同输入下的执行结果不一致，说明编译器中存在正确性缺陷。若发现任何一种可能的缺陷，则保存触发该缺陷的输入包含测试用例及对应命令以及相应的输出，以便后续审查。对于触发错误的测试用例，需要搜索错误数据集：如果堆栈跟踪信息或时间经过信息与错误数据集中的条目相匹配，放弃该测试用例；如果不匹配，将相应的堆栈跟踪信息或时间经过信息添加到错误数据集中，执行更新，并标记测试用例，以生成错误报告。最后将触发缺陷的测试用例存储到代码数据集中，以丰富后续迭代的代码数据集。通过这一过程，消除了重复缺陷对方法的影响，确保了新缺陷的检测。

全文数据：

权利要求：

百度查询：南京大学一种基于大语言模型的完型填空式复杂测试输入生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种大数据支持的交通碳排放监测方法及监测系统

下一篇：信息处理系统以及信息处理方法

相关技术

一种大数据支持的交通碳排放监测方法及监测系统

信息处理系统以及信息处理方法

一种电子设备、下载模式触发方法以及可读存储介质

一种电炉铁液随流孕育装置

一种智能型多功能机械伤害体验装置

一种电池耐火防护装置及可行驶设备

一种水力发电装置及清洁装置

一种静载试验接桩循环护筒

一种玉米栽培供水装置

一种焊接加热装置

一种市政道路铺砖装置

一种拉杆切割打孔集成设备及加工工艺

复杂相关技术

用于复杂电磁环境构设的相似度评价方法_中国人民解放军91404部队第340所_202210491436.X

一种复杂地形测绘系统及测绘方法_山东赢通瑞驰技术有限公司_202410719468.X

一种复杂环境叠落盾构隧道的施工方法_合肥大学_202410825047.5

一种耐复杂温度工况的激光刻痕取向硅钢方法_上海工程技术大学_202410784724.3

一种自适应复杂路况的搬运机器人_智捷智能科技香河有限公司_202410756805.2

一种银行类交易复杂对象的脱敏方法和装置_中国邮政储蓄银行股份有限公司_202410735825.1

复杂钢结构屋面大跨度悬挑异形构件安装组件及施工工法_中铁四局集团有限公司_202410901981.0

一种可适应复杂地形的林业防治用喷药车_定西市林业调查规划队_202410882352.8

一种基于Flowmaster的复杂风系统自适应调试方法_南京工业大学_202410911395.4

一种面向复杂产品工业设计的关键参数提取方法_西北工业大学_202411096177.6

式相关技术

埋入磁铁式转子以及埋入磁铁式旋转电机_株式会社东芝_202280090365.0

嵌入式插座和嵌入式插头_赫斯曼汽车有限公司_202380019620.7

让位式柜门锁_温州一卡锁具科技有限公司_201910334964.2

可穿戴式吸奶器_深圳市路特佳成供应链管理有限公司_202322410419.1

切换式压头_三航达机电科技(苏州)有限公司_202420154009.7

隐式划分_SAP欧洲公司_202010521710.4

卷收式车衣_王政杰_202310228541.9

循环式孵化盒_宠有家供应链管理(山东)有限公司_202323658895.1

多件式活塞_伍德沃德有限公司_202080048060.4

骑墙式吊篮支架_中建八局第四建设有限公司_202323276230.4

填空相关技术

一种煤矿综放采煤工艺条件下的采空区充填空间探测方法_陕西煤业化工技术研究院有限责任公司_202011125900.0

一种基于知识约束的MCT完形填空智能出题方法及系统_华侨大学_202210464130.5

基于语义完型填空测试自编码器的视频异常检测方法及装置_西南交通大学_202410458629.4

填空题解题模型的训练方法及装置_北京飞象星球科技有限公司_202210536486.5

一种煤矸石-自密实料浆-支柱协同自适应充填空区工艺_西安科技大学_202311772469.2

一种基于大语言模型的完型填空式复杂测试输入生成方法_南京大学_202410294742.3

填空字补齐系统_库比克设计工作室有限责任公司_202110350596.8

一种离线语音填空装置及方法_江苏星捷云网络服务有限公司_202410274456.0

一种基于孔隙率时空演化的胶结充填空间CO₂扩散模拟方法_中国矿业大学_202410002263.X

意图检测和语义槽填空方法、系统及模型训练方法和系统_及云香港科技有限公司_202211128455.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于大语言模型的完型填空式复杂测试输入生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务