我要投稿

Meta Llama 3 是 Meta Inc. 开发的一系列最先进的模型，提供 8B 和 70B 参数大小（预训练或指令调整）

发布日期：2024-04-30 20:44:31 浏览次数： 2050 作者：Eric技术圈

欢迎关注我的公众号“Eric技术圈”，原创技术文章第一时间推送。

llama3介绍

Meta Llama 3 是 Meta Inc. 开发的一系列最先进的模型，提供 8B 和 70B 参数大小（预训练或指令调整）。

Llama 3 指令调整模型针对对话/聊天用例进行了微调和优化，并且在常见基准测试中优于许多可用的开源聊天模型。

让我们开始在本地电脑体验llama3，以及和 ChatGPT 3.5 Turbo 进行各项能力对比。

准备

可以阅读往期文章，依次了解Ollama工具、本地大模型能力对比、Gradio UI界面搭建。

快速搭建本地大语言模型和知识库

本地中文大语言模型搭建和对比

结合本地和闭源大语言模型快速搭建属于自己的UI界面

快速使用

使用ollama在终端快速使用。

ollama run llama3:8b

能力对比：Llama3-8B VS ChatGPT 3.5

我这里直接使用本地中文大语言模型搭建和对比文章中的问题和gpt-3.5-turbo模型进行对比测试。

01 实体提取

prompt:

请帮我分析一下这段话”张三今年30岁，生活在四川成都，截止2024年3月31日，他就职于一家叫 Eric AI 的公司，他喜欢阅读书籍，打篮球。“

如果包含人名，请帮我列出“人名：xxx”；如果包含地点，请帮我列出“地点：xxx”；如果包含时间，请帮我列出”时间:xxxx年xx月“；，如果包含公司或机构，请帮我列出”机构：xxx“，如果包含其他实体，请帮我列出”实体：xxx“。

gpt-3.5-turbo:

llama3-8b:

可以看到llama3-8b，其他实体未识别出来。

02 文本总结

prompt:

请帮我将分析一下文字的含义，然后使用不超过30个字进行归纳：

LLM 是一项关键的人工智能（AI）技术，为智能聊天机器人和其他自然语言处理（NLP）应用程序提供支持。目标是通过交叉引用权威知识来源，创建能够在各种环境中回答用户问题的机器人。不幸的是，LLM 技术的本质在 LLM 响应中引入了不可预测性。此外，LLM 训练数据是静态的，并引入了其所掌握知识的截止日期。

LLM 面临的已知挑战包括：

在没有答案的情况下提供虚假信息。
当用户需要特定的当前响应时，提供过时或通用的信息。
从非权威来源创建响应。
由于术语混淆，不同的培训来源使用相同的术语来谈论不同的事情，因此会产生不准确的响应。
您可以将大型语言模型看作是一个过于热情的新员工，他拒绝随时了解时事，但总是会绝对自信地回答每一个问题。不幸的是，这种态度会对用户的信任产生负面影响，这是您不希望聊天机器人效仿的！

RAG 是解决其中一些挑战的一种方法。它会重定向 LLM，从权威的、预先确定的知识来源中检索相关信息。组织可以更好地控制生成的文本输出，并且用户可以深入了解 LLM 如何生成响应。

gpt-3.5-turbo:

llama3-8b:

两个都归纳得不错，但是llama3超出30个字有点多。

03 逻辑推理

prompt:

树上有9只鸟，猎人开枪打死一只，树上还剩多少只鸟？

gpt-3.5-turbo:

llama3-8b:

都回答错误！

04 翻译

prompt:

你是一位专业翻译人员，请将以下英文内容翻译成中文：”LangChain enables building application that connect external sources of data and computation to LLMs. In this quickstart, we will walk through a few different ways of doing that. We will start with a simple LLM chain, which just relies on information in the prompt template to respond. Next, we will build a retrieval chain, which fetches data from a separate database and passes that into the prompt template. We will then add in chat history, to create a conversation retrieval chain. This allows you to interact in a chat manner with this LLM, so it remembers previous questions. Finally, we will build an agent - which utilizes an LLM to determine whether or not it needs to fetch data to answer questions. We will cover these at a high level, but there are lot of details to all of these! We will link to relevant docs.”

gpt-3.5-turbo:

llama3-8b:

llama3翻译差点意思，中间还夹杂了英文。

05 扩大补充

prompt:

您是客户服务AI助手。您的任务是向尊贵的客户发送电子邮件回复。

以下面以 ''' 分隔的是客户发来的电子邮件，请生成回复以感谢客户的评论。

如果情绪是积极的或中立的，感谢他们的评论。如果情绪是负面的，请道歉并建议他们可以联系客户服务。

确保使用评论中的具体细节。用简洁和专业的语气写。

将电子邮件签名为 “AI客户代理”。

客户评论: '''

在 11 月份仍然以 49 美元左右的价格季节性销售 17 件套系统，大约有一半的折扣，但由于某种原因（称之为价格欺诈），在 12 月的第二周左右，价格全部上涨到大约 同一系统的价格在 70-89 美元之间。11 件系统的价格也较之前的 29 美元上涨了约 10 美元左右。所以它看起来还不错，但如果你看一下底座，刀片锁定到位的部分看起来不像几年前的以前版本那么好，我对它非常温和（例如，我首先在搅拌机中压碎非常坚硬的物品，如豆子、冰、大米等，然后在搅拌机中将它们粉碎成我想要的份量，然后切换到搅打刀片以获得更细的面粉，并在制作冰沙时首先使用十字切割刀片，如果我需要更细/更少的果肉，则使用平刀片）。制作冰沙时的特别提示，将水果和蔬菜切碎并冷冻（如果使用菠菜 - 稍微炖软菠菜，然后冷冻直至准备使用 - 如果制作果汁冰糕，请使用中小型食品加工机） 如果你打算用这种方式，你可以避免在制作冰沙时添加太多的冰（如果有的话）。大约一年后，电机发出奇怪的声音。我打电话给客服，但保修已经过期了，所以我不得不再买一个。'''

评论情绪：负面

gpt-3.5-turbo:

llama3-8b:

ollama3还是回答得很详尽，提到了客户提到的每个问题细节。

06 生成SQL

prompt:

已知有两个mysql表，一个是代表销售人员的表:Persons，另一个是代表订单的表:Orders。具体的表定义如下：表Persons：CREATE TABLE Persons (PersonID int, LastName varchar(255), FirstName varchar(255), Address varchar(255), City varchar(255), PRIMARY KEY (PersonID) ); 表Orders：CREATE TABLE Orders (O_Id int NOT NULL, OrderNo int NOT NULL, P_Id int, PRIMARY KEY (O_Id), FOREIGN KEY (P_Id) REFERENCES Persons(PersonID) )；请帮我生成一个SQL语句，查询销售人员”Zhang san“的所有订单数据。请用中文回答。

gpt-3.5-turbo:

llama3-8b:

都OK。但是llama3当销售人员名称重复时使用IN不会报错。

07 生成代码

prompt：

某公司2021年3月至7月（含）的自研产品销售数据依次为118万元、671万元、446万元、902万元和1011万元，请帮我用python的pyplot制作一个可查看趋势的柱状图表，注意月份等标签请使用中文且计量单位使用"万元"。

gpt-3.5-turbo:

llama3-8b:

都没有语法问题，也可以顺利执行。

总结

llama3-8b使用GGUF量化后的模型大小只有4.7GB，在一些编码以及扩充方面相较于ChatGPT 3.5 Turbo 输出的结果更加详细，友好。

但也同时对于中文的支持不是特别的好，例如：翻译；如果prompt不提示使用中文回答，尽管你是使用中文问它，也只会使用英文进行回复。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

为什么全参数微调能让大模型从“通才”变“专才”？

2025-04-23

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB