我要投稿

大厂测试人亲测：大模型自动生成测试用例，效率飙升50%！

发布日期：2024-06-02 08:09:48 浏览次数： 2338

点击蓝字，立即关注

周五好呀米娜桑！今天迎来了双倍快乐，是周末，也是儿童节！愿你永葆童心，永远快乐！

今天我们一起学习讨论一个“老生常谈”但却值得不断去研究的话题，那就是“基于大模型如何生成测试用例，是否能真的提升测试效率”！据京东零售团队研究发现，基于Langchain生成测试用例，结果效率提升了50%！

我们今天就来从研究背景、实现的过程思路、实践效果以及大模型自动生成的优缺点方面来学习讨论，希望对你有所启发！

什么是Langchain

它是一个开源框架，用于构建基于大型语言模型（LLM）的应用程序。LLM 是基于大量数据预先训练的大型深度学习模型，可以生成对用户查询的响应，例如回答问题或根据基于文本的提示创建图像。

LangChain 提供各种工具和抽象，以提高模型生成的信息的定制性、准确性和相关性。例如，开发人员可以使用 LangChain 组件来构建新的提示链或自定义现有模板。LangChain 还包括一些组件，可让 LLM 无需重新训练即可访问新的数据集。

研究背景

在研究开源框架LangChain之前，公司最先普及的是JoyCoder，但是在把相关需求及设计文档信息拷贝到JoyCoder，让其生成测试用例时，却发现人工操作步骤较多（如：复制粘贴文档，编写提示词，拷贝结果，保存用例等）、响应时间久，而且当需求或设计文档内容较大时，提示词太长或超出 token 限制！

因此开展了基于LangChain的研究！

实现过程思路

整体流程图

技术解析

PDF内容解析：本次研究中选取的是PDF库中的PyMuPDF，主要是因为功能全面且处理速度快；

文件切割处理：这块相比JoyCoder，将文件分为各个小文本，就很好的解决了模型响应时间久或超出token 限制；

Memory 的使用：这个是大多数大模型都会有的一个功能，就像我们平常在使用的ChatGPT、Kimi等聊天，不需要把每次上面的内容都重复再输入一遍，大模型会自动记忆我们上述的对话内容。
本次我使用Langchain的ConversationBufferMemory与ConversationSummaryBufferMemory来实现，将需求文档和设计文档内容直接存入 Memory，可减少与大模型问答的次数（减少大模型网关调用次数），提高整体用例文件生成的速度。ConversationSummaryBufferMemory 主要是用在提取“摘要”信息的部分，它可以将将需求文档和设计文档内容进行归纳性总结后，再传给大模型。

向量数据库： 利用公司已有的向量数据库[测试环境 Vearch]，将文件存入。在创建数据表时，需要了解向量数据库的检索模型及其对应的参数，目前支持六种类型，IVFPQ，HNSW，GPU，IVFFLAT，BINARYIVF，FLAT（详细区别和参数可点此链接），目前我选择了较为基础的 IVFFLAT--基于量化的索引，后续如果数据量太大或者需要处理图数据时再优化。另外 Langchain 也有很方便的vearch存储和查询的方法可以使用。

实践效果

用例生成后是否真的能帮助我们节省用例设计的时间，是大家重点关注的，因此我随机在一个小型需求中进行了实验，此需求的 PRD 文档总字数 2000+，设计文档总字数 100+（因大部分是流程图），结果效率提升 50%。

优缺点

本次利用大模型自动生成用例的优缺点：

优势：

全面快速的进行了用例的逻辑点划分，协助测试分析理解需求及设计；
降低编写测试用例的时间，人工只需要进行内容确认和细节调整；
用例内容更加全面丰富，在用例评审时，待补充的点变少了，且可以有效防止漏测；
如测试人员仅负责一部分功能的测试，也可通过向量数据库搜索的形式，聚焦部分功能的生成。

劣势：

暂时没实现对流程图的理解，当文本描述较少时，生成内容有偏差；
对于有丰富经验的测试人员，自动生成用例的思路可能与自己习惯的思路不一致，需要自己再调整或适应。

相关文章推荐

AI如何辅助我们更加完整高效的保证测试工作，一直是我们我们测试人员关心的话题。而到目前为止，利用大模型生成测试用例是用户研究最多的，我们公众号也相继发表了很多用AI生成测试用例的工具介绍及文章介绍，如下：

文章1：《19个测试⽤例⽣成的AI⼯具！卷起来！》

文章2：《AI测试干货！实例讲解AI自动生成测试用例》

文章3：《好用！这个小工具轻松提升测试用例的编写效率！》（PS：这篇是作者自己写的一个测试用例小工具，用户反响很好，希望对你也有所帮助！）

那么：

#1.针对文章1中提到的19个AI工具你有详细研究过吗？欢迎评论区分享

#2.针对文章3作者自己写的小工具，你有使用吗？使用感受如何？觉得哪些地方还可以优化？

#3.AI生成测试用例免不了提示词，就工作中任何一个小的测试场景为例，你会提炼出哪些关键词？（例如：登录场景测试：关键词1，关键词2）

以上话题，任选其一，欢迎评论区留言，小编会在下周一（2024年6月3日）下午，选取1位幸运小伙伴，送出《测试工程师全栈技术进阶与实践》一本，快来评论区分享吧~

-End-

53AI，企业落地应用大模型首选服务商

产品：大模型应用平台+智能体定制开发+落地咨询服务

承诺：先做场景POC验证，看到效果再签署服务协议。零风险落地应用大模型，已交付160+中大型企业

160+中大型企业正在使用53AI

立即咨询预约演示

百度智能云邀53AI：共创AI新纪元，启航智能新时代

2024-05-27

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

2024-05-22

热点资讯

最强 GPT 免费使用！GPT4O 开启多模态新时代！

2024-05-14

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

【开源看AI】4.9K star！Khoj：完美融合本地文档和在线网页的AI第二大脑

2024-05-22

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示

2024-04-12

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

万字长文解析：大模型需要怎样的硬件算力

2024-03-30

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-05-10

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

更改ollama模型存储路径

2024-04-25

全面对比dify、coze、streamlit、chainlit

2024-04-26

大家都在问

疯狂星期四Qwen2.5开源，通义成了最Open的AI?

2024-09-20

在长上下文LLM的时代，RAG是否仍然必要？

2024-09-20

【AI赋能】揭秘大模型微调：如何让机器智能跃升一个台阶？

2024-09-19

从案例分析到客户沟通：AI提示词如何优化律师工作流程？

2024-09-19

o1 能带我们走进 AGI 吗？

2024-09-19

如何微调（Fine-tuning）大语言模型？

2024-09-18

AI软件必须用GPU么？

2024-09-18

ChatGPT有三个快捷指令和三个模式，你知道吗？

2024-09-17

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

最强 GPT 免费使用！GPT4O 开启多模态新时代！

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

【开源看AI】4.9K star！Khoj：完美融合本地文档和在线网页的AI第二大脑

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

万字长文解析：大模型需要怎样的硬件算力

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

开源项目Composio：突破 AI 智能体开发的边界

更改ollama模型存储路径

全面对比dify、coze、streamlit、chainlit

大家都在问

疯狂星期四Qwen2.5开源，通义成了最Open的AI?

在长上下文LLM的时代，RAG是否仍然必要？

【AI赋能】揭秘大模型微调：如何让机器智能跃升一个台阶？

从案例分析到客户沟通：AI提示词如何优化律师工作流程？

o1 能带我们走进 AGI 吗？

如何微调（Fine-tuning）大语言模型？

AI软件必须用GPU么？

ChatGPT有三个快捷指令和三个模式，你知道吗？

热门标签

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

最强 GPT 免费使用！GPT4O 开启多模态新时代！

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

【开源看AI】4.9K star！Khoj：完美融合本地文档和在线网页的AI第二大脑

OLLama详细的 api 介绍 不完全指南 python 直接调用 OLLama api 翻译助手演示

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

万字长文解析：大模型需要怎样的硬件算力

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

开源项目Composio：突破 AI 智能体开发的边界

更改ollama模型存储路径

全面对比dify、coze、streamlit、chainlit

大家都在问

疯狂星期四Qwen2.5开源，通义成了最Open的AI?

在长上下文LLM的时代，RAG是否仍然必要？

【AI赋能】揭秘大模型微调：如何让机器智能跃升一个台阶？

从案例分析到客户沟通：AI提示词如何优化律师工作流程？

o1 能带我们走进 AGI 吗？

如何微调（Fine-tuning）大语言模型？

AI软件必须用GPU么？

ChatGPT有三个快捷指令和三个模式，你知道吗？

热门标签

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示