我要投稿

剑指 Meta：Mistral Large2 凌晨开源，媲美 Llama3.1

发布日期：2024-07-25 08:38:26 浏览次数： 2596

要点如下

刚刚， Mistral AI 发布 Mistral Large 2，123B 大小，128k 上下文，与 Llama 3.1 不相上下。
支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在内的数十种语言
支持 Function Calling 和 Retrieval
开源地址: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
可用于研究和非商业用途，商用需获取许可
在线使用：https://chat.mistral.ai/chat
开发者平台：https://console.mistral.ai/
云服务：可在 Google Cloud 、Azure AI Studio、Amazon Bedrock 和 IBM watsonx.ai 上调用

简单使用

可在这里使用：https://chat.mistral.ai/chat

不够聪明啊，ahhhhhh

版本特色

多语言设计：支持多种语言，包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语、葡萄牙语、荷兰语和波兰语。
精通代码：熟练掌握 80 多种编程语言，如 Python、Java、C、C++、JavaScript 和 Bash 等。还熟悉一些更具体的语言，如 Swift 和 Fortran。
Agent 支持：原生支持 Function Calling 和 JSON 输出。
好的推理：数学和推理能力远超前代，与 GPT-4o、Claude 3 Opus 和 Llama 3.1 405B 不相上下
128k 上下文：，加之在 la Plateforme 实施的输出限制模式，大大促进了应用开发和技术栈的现代化。
开源许可：允许用于研究和非商业用途的使用和修改。

推理测试

表现远超之前的 Mistral Large，与 GPT-4o、Claude 3 Opus 和 Llama 3.1 405B 相媲美

代码生成测试

MultiPL-E 性能测试

GSM8K（8-shot）和 MATH（0-shot，无 CoT）测试

语言覆盖

官方给的图，剑指 Meta

语言性能测试

更多信息

按 Mistral 的说法，他们会围绕以下模型在 la Plateforme 上进行后续整合：

通用模型：Mistral Nemo 和 Mistral Large
专业模型：Codestral 和 Embed

其中 Mistral NeMo 是一款与 NVIDIA 合作开发的 12B 模型，一周前发布的，具体参见：https://mistral.ai/news/mistral-nemo/

同时，Mistral 的 Large2 模型已可在 Google Cloud 、Azure AI Studio、Amazon Bedrock 和 IBM watsonx.ai 上进行调用。更多的安排参考：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-06

Java团队Cursor最佳实践：3分钟构建「零泄漏」AI开发环境

2025-07-05

用友毕思建：客户成功AI落地模型HERO正式发布

2025-07-04

最全的Ollama使用详解

2025-07-04

Serverless JManus: 企业生产级通用智能体运行时

2025-07-04

Kimi深度研究 vs. OpenAI / Gemini Deep Research：文献综述哪家强？（实测对比）

2025-07-04

大模型开源，厂商靠什么盈利？

2025-07-04

构建AI Agents-你一定要知道的10大开源利器

2025-07-03

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o | 模型&数据开源

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

15个最佳开源 RAG 框架选型指南

2025-04-13

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

OpenAI学院：人工智能领头羊自己下场做课了

2025-04-12

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

Qwen3中性能最强MOE模型部署抛砖引玉 + 实测

2025-04-29

手搓Manus？MCP 原理解析与MCP Client实践

2025-04-15

阿里Qwen3正式发布：最小6亿参数，叫板Gemini-2.5Pro

2025-04-29

刚刚，DeepSeek开源新版R1，媲美OpenAI最高o3模型

2025-05-29

大家都在问

大模型开源，厂商靠什么盈利？

2025-07-04

OpenAI首席研究官没有博士学位，你的985还有用吗？

2025-07-03

卷疯了！这个清华系Agent框架开源后迅速斩获1.9k stars，还要“消灭”Prompt？

2025-06-28

从 MCP 谈起，到底什么才是 AI Native 产品？

2025-06-25

中国AI Agent市场最终会变成一地鸡毛吗？

2025-06-25

如何使用 Agno 构建一个基础的 AI 智能体？

2025-06-21

开源AI工具Magentic UI，凭什么让你的工作效率提升300%？

2025-06-16

如何用Gradio搭建一个完整的AI产品功能？

2025-06-15

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部