我要投稿

经过 4000 个分类处理，360 把国内这 12 个顶尖大模型擅长点都说清楚了。

发布日期：2024-08-19 05:39:06 浏览次数： 2763 作者：AI探索者知白

那这样一个混合模型有什么好处呢？当用户输入一个问题时，会进行意图识别，优先匹配擅长这块领域的大模型进行回答。

目前来看并没有一个大模型敢说自己在各个领域全方面领先，哪怕强如 GPT-4O 和 Claude3.5 也不行。而这样集各家之所长的“大模型”，可以说基本全方面达到最优，集成了国内大部分头部模型。

这其中最关键的问题就是：怎么知道哪个大模型在哪块领域擅长？于是 360 用自己过去积累的用户真实数据，找了几千万条问题，划分成 4000 个类别，对这些模型进行测试。

包括写作、代码生成、翻译、比一比、诗词赏析、知识问答等，决策出各个分类下的最强大模型。

最终它得出了各个模型擅长的领域如下：

360 智脑：擅长搜索、总结、思维导图，生成速度超快；
豆包：擅长创意写作、逻辑推理、知识问答等方向;
DeepSeek：对代码和图表具有强大的理解能力;
MiniMax：适合沉浸式角色扮演体验，引入超多虚拟角色;
通义千问：以电商、法律垂类的知识库和翻译能力著称;
Kimi：20W字超长记忆，擅长各种专业领域知识;
零一万物：办公首选，适合会议纪要、周报等场景;
文心一言：适合内容创作、对比判断类知识问答领域;
讯飞星火：逻辑推理、翻译能力突出，擅长教育方向;
商量-商汤：擅长医疗、编程等专业的垂直方向;
智谱清言：擅长多模态场景，模型推理训练等；
百小应：通用医疗增强大模型，AI医疗向专家；

相当于普通人的测试结果来说，360 测量得出的结果肯定更加准确。

有一个场景，之前单问某个模型，回答一直很傻逼。就是让它生成一个笑话，看看单个模型回答的结果：

看看 Kimi、文心一言、通义千问生成的笑话，是真的不好笑啊，属实有点尬。

而通过混合模型生成的效果明显就好上不少，看生成结果里显示是调用的豆包模型。

这就是混合模型的强大，生成的结果起码在国内应该是最优的，而对于使用者来说可以将它只当做是单个模型使用。

当然如果你想自己指定某个模型回答也是可以的，在这个网页上你可以随意切换模型，不需要登录到各个模型的官网上。

现在体验比较不好的一点是：不支持文件上传。因为 CoE 混合模型本身不具备文件读取的能力，就无法识别要调用哪个模型，这个需要 360 进一步优化了。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-11

AI Agent 摩尔定律：每7个月能力翻倍，带来软件智能大爆炸

2025-04-11

教你解决GPT4o无法使用新版生图功能的教程

2025-04-11

阿里云业内首发MCP，用户可无代码5分钟创建智能体！AI应用最后一公里

2025-04-11

谁是MCP 的 AI 好搭档？

2025-04-11

从零开始的 MCP 开发

2025-04-11

OceanBase 现已支持 MCP：打破数据孤岛，加速 AI 创新

2025-04-11

大模型联网搜索在to B智能体的应用

2025-04-11

ChatGPT 记忆增强，AI 更懂我了！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

谁是MCP 的 AI 好搭档？

2025-04-11

大模型如何保证输出json格式？

2025-04-11

阿里百炼MCP一键部署简单到颠覆想象！字节Coze会否闪电跟进？

2025-04-10

All in 医疗，百川胜算几何？

2025-04-08

如何理解政务大模型？

2025-04-07

伯克利最新研究：为什么多 Agent 系统总是“高期待、低表现”？

2025-04-07

刚刚，DeepSeek公布推理时Scaling新论文，R2要来了？

2025-04-07

【AI知识点】什么是 Agentic Workflows？

2025-04-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB