我要投稿

如果老板让你基于大模型搭建一个系统，怎么选择一个适合自己任务的大模型？选择大模型需要考虑哪些问题？

发布日期：2024-08-03 05:19:08 浏览次数： 1991 作者：AI探索时代

“ 怎么选择和测试一款大模型，是一个需要思考的问题”

到今天为止，市面上的大模型没有一万也有三千；如果算上那些学习使用的大模型，可能几十万都不止。

但对企业来说，要想构建一个企业级的AI应用，最好的选择就是使用第三方大模型或者使用开源大模型，那么在如此多的模型中，怎么选择一个适合自己任务的大模型呢？‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

个人开发的人工智能聊天小程序，感兴趣的可以点击查看：‍‍

—

为什么要选择模型？

这两年市面上的模型如雨后春笋般不断涌现，而且模型的能力也在不断加强。但不论是对个人还是企业来说，东西多了反而不知道该怎么选了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

有句老话叫：“没有最好的，只有最合适的”；这句话放到大模型上也是一样，不论是对个人还是对企业，怎么选择一个好的模型，是一个值得思考的问题。‍‍

对个人来说，如果学的是自然语言处理，那么选择一个图片处理的模型就走偏了。

而对一家企业来说，选择模型需要考虑的问题就更多了，比如模型的功能是否满足需求，模型的响应速度，数据安全问题，更新频率以及是否有完善的文档，更重要的是使用模型的成本问题。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

‍

而目前由于大模型的应用还处于初级阶段，虽然搞了一年多的千模大战，但真正能把大模型贴合到具体的应用场景中，还处于探索的阶段。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

因此，市面上也很难见到完整的大模型企业级解决方案；而今天就来简单讨论一下怎么选择一个适合的大模型；也可以说是选择模型的一个简单方法论。‍‍‍‍‍‍‍

—

怎么选择模型？

无论做任何事，都会有固定的几个步骤，选择模型也不例外；而怎么选择模型，总结了以下几个步骤：‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

明确任务需求‍

选择大模型之前，第一步就是要确定任务需求，也就是说你想用大模型干什么？只有明确了任务需求，才能知道应该选择什么样的大模型。

举例来说，你想利用大模型做一个具有图像处理功能的大模型，那么你选择自然语言处理的模型就肯定不合适。

在明白需求的情况下，你才知道怎么想干嘛，以及能干嘛。

确定模型类型和架构

根据任务需求，筛选符合任务功能的模型；比如说，同样都能进行图片处理的大模型，是选择开源的，还是商业闭源；是选择AGI(通用人工智能)这种能够进行多模态处理的大模型，还是选择垂直领域内的模型。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

评估大模型和基础能力‍‍‍‍‍‍‍‍‍‍‍‍

在确定大模型的类型之后，就可以对模型进行简单的评估；不论是使用官方给出的评测结果，还是自身的评测手段，比如自己整理一部分业务数据做成测试集，然后丢到模型中进行交叉测试。‍‍‍‍‍‍‍‍‍‍‍‍

评估大模型不但要评估大模型的基础能力，同时还要看大模型的响应速度，是否支持大数据量处理，大模型是否会经常更新等。

选择模型

在确定了前面几个步骤之后，可能会有几个模型供我们选择；这时我们就需要对它们进行筛选了，如果说前面的步骤是硬性条件，那么现在就需要筛选一些软性条件。‍‍‍

比如说，这款大模型的文档是否完善，文档更新是否及时；以及，如果是第三方大模型，那么使用大模型的成本是否合适。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

还有就是，大模型是否能本地部署，本地部署需要的成本有多少，需要多少硬件设备，以及需要多少人力进行维护。还有就是数据安全问题，是否能够得到保障等。‍‍‍‍‍

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

总之，选择大模型是一个复杂的过程，特别是不使用第三方模型的情况，自己部署大模型的情况下。

使用第三方模型，如果觉得效果不好换一家就行了；但如果本地部署大模型，如果表现不好那么前期的人力和硬件资源的投入就无法收回了。‍‍‍‍‍‍

当然，这里只是记录一下自己认为的大模型选择方案，可能还有很多问题有待完善，对企业级大模型有了解或感兴趣的朋友可以来参与讨论。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-27

一文讲透 MCP 与 Function calling，你想看的都在这里

2025-04-27

混合专家 (MoE) 架构：现代大模型的“秘密武器”

2025-04-27

一文了解：大模型 Agent 开发框架有哪些？它们的区别是什么？

2025-04-27

大模型应用系列：两万字解读MCP

2025-04-27

一篇文章说清楚什么是生成式AI、决策式AI、判别式AI

2025-04-27

字节Trae 大更新，5分钟看懂AI生成的“神秘代码块”

2025-04-27

字节新出的MCP应用DeepSearch，有点意思。

2025-04-27

用百度网盘MCP在Cursor中构建私人网盘助手，太香了叭（附搭建教程）

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

一文了解：大模型 Agent 开发框架有哪些？它们的区别是什么？

2025-04-27

为什么一定要做Agent智能体？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB