微信扫码
与创始人交个朋友
我要投稿
随着人工智能技术的飞速发展,AI大语言模型逐渐成为软件测试领域的热点研究方向。软件测试是确保软件质量的重要手段,然而,手工编写测试用例耗费大量人力成本,尤其对于业务需求条目多的项目。
AI大语言模型的出现为软件测试带来了新的机遇。AI大语言模型具有强大的自然语言理解和生成能力,能够辅助测试人员在测试过程中自动生成测试相关资产,测试人员只需把控生成测试资产的质量,因而可以极大程度提高测试效率。
本文旨在探讨如何利用AI大语言模型来辅助软件测试,并通过实验验证其在测试文本效果、测试效率提升等方面的优势。通过综合应用AI大语言模型进行测试用例生成,本文提出了一种基于AI大语言模型的软件测试方法,并通过实验证明其在真实项目中的实际应用效果。
目前AI大语言模型在软件测试中的应用主要分为:
1. 测试用例生成:利用AI大语言模型,可以自动生成大量的测试用例,覆盖更多的测试场景,并减少人工编写测试用例的工作量。
2. 缺陷预测与修复:AI大语言模型通过学习已有的缺陷数据,能够预测软件中可能存在的新缺陷,并为测试人员提供修复建议和相关测试用例。
3. 测试范围预测:AI大语言模型可以分析大量的测试数据和项目历史经验,为测试人员提供测试范围预测。
4. 测试报告与文档生成:利用AI大语言模型,可以自动生成详细、准确的测试报告和文档,减轻人工编写文档的工作压力。
本文基于大量实践,探索了AI大语言模型在测试案例生成上的可行性:
首先:调研了大语言模型GPT4.0在测试案例生成上的能力。通过将需求文档中的业务规则作为输入,调用GPT4.0模型生成测试案例。
经过实测分析,优点包含:
1. 可以快速生成符合语法、逻辑合理的测试案例,从而提高测试工作效率;
2. 可以生成大量的测试案例,从而增加测试数据集的丰富程度;
3. 可以应用于各种测试场景,如冒烟测试、功能测试等,方便测试团队进行不同层次的测试;
4. 能够生成具有上下文的测试案例,能够更好地模拟实际测试环境和测试场景。
缺点包含:
1. 生成的测试案例不能完全代替测试人员的判断和思考,需要人工进行复核和修改;
2. 无法判断测试案例的覆盖率,测试人员需要进行补充和完善;
3.依赖于大规模的训练数据,如果数据质量较低或不充足,则生成的测试案例可能会出现问题;
4. 生成的测试案例往往比较抽象,可能需要进一步细化和明确,以便测试人员理解和实施。
综上所述,使用OGPT4.0生成测试案例具有一定的优点和缺点,对于提高测试效率和测试数据集的丰富程度方面具有显著的优势,但其生成的测试案例还需要人工进一步完善和精细化。因此,在进行测试自动化过程中需要权衡不同的因素,并根据具体需求进行选择。
其次:调研了基于Pytorch+LSTM的文本分析方法在测试需求分析的表现,使用了github上的预训练中文文本模型,通过LCSTS数据集训练调整超参数,计算Mle_Loss,之后进行强化学习,选择最合适的模型,再对测试需求进行了概况总结。
LSTM有以下优点:
1. 能够处理长文本,与传统的N-gram模型相比,不需要将整个文本划分为单词或短语,而是通过学习序列之间的关系,直接提取概括性信息,因此对文本压缩性能较好。
2. 可以处理比较抽象的概念,尤其在跨语言等场景下,通过学习语言之间的映射关系,能够将文本转换为普遍可读的最主要内容,实现了机器翻译等领域的突破。
3. 可以学习语义空间上的抽象概念,对于文本中的关系和含义有更好的理解力,并能够将这些抽象概念有机地联系到生成任务中去。但同时,LSTM在一些复杂的应用场景下,由于语义表现的抽象性(比如嵌套子子句的形式等),有时会出现不够自然、甚至不够准确的现象,需要进一步加强模型学习的能力。
最后:调研了基于word2vec+TextRank文本摘要技术,通过对于大篇幅测试需求的分析优化,实现测试点提取。
TextRank是一种基于图论的文本自动摘要算法,主要优点如下:
1. 快速高效,可以在较短时间内生成高质量的自动摘要。
2. 适用范围广,不受语言和领域限制,可以应用于各种类型的文本摘要和提取任务。
3. 结果可解释性较好,根据关键词的权重分配,可以清楚地了解摘要中包含的最重要的信息。
但是,TextRank也存在一些缺点:
1. TextRank基于词频(或TF-IDF值)对关键词进行排序,容易受到低频词和无关词的影响,在一些文本语料库中可能会产生误差。
2. TextRank只考虑了相邻的单词之间的共现关系,对于较复杂的语言结构、逻辑关系和语义关联等无法完全捕捉,这也导致了摘要结果的语法结构不够完整和准确。
3. TextRank并没有涉及到人类对文本的深入理解,因此,在处理涉及情感和复杂语境的文本时可能无法达到最佳的效果。
经过探索分析,大语言模型在测试案例生成上对比传统机器学习、深度学习算法在测试案例生成上有一定优势。
因此我提出一种根据测试需求文档生成测试案例的方法:
首先将业务需求文档进行解析,提取跟编写测试案例有关的信息;
其次开展提示词工程,优化输入大模型内容,从三个维度限制输出范围(测试方法,测试案例构成,测试范围);
最后对生成结果进行打分,不符合案例生成标准的重新迭代优化,流程为:
在金融行业尤其是银行系统的测试工作中,该实践方法可帮助测试人员编写测试案例,使测试人员可以将精力放在执行案例上。
目前金融业信息化、智能化正在逐步加深,该实践可以应对越来越多的针对银行系统的改造,通过辅助测试人员,提高测试效率,为银行业数字化提供有力支持。
结论:
本论文研究了AI大语言模型在软件测试中的应用,并验证了其在测试效果、测试覆盖率和测试效率等方面的优势。
基于AI大语言模型的软件测试方法能够有效辅助测试人员提高测试效率和质量,为软件开发和测试带来更多的价值。
未来的发展方向包括进一步研究和应用AI大语言模型在软件测试中的技术挑战,推进其在实际项目中的广泛应用。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-08-13
2024-03-30
2024-04-26
2024-05-10
2024-05-28
2024-04-12
2024-04-25
2024-07-25
2024-05-06
2024-07-18
2025-01-18
2025-01-18
2025-01-18
2025-01-18
2025-01-16
2025-01-15
2025-01-15
2025-01-14