我要投稿

微软发布Phi-3 Mini：探索轻量级大模型的端侧应用

发布日期：2024-04-24 20:20:39 浏览次数： 2390 作者：大卫THINK

昨天，微软发布了最新的轻量级大模型Phi-3 Mini，继Meta刚刚发布的Llama 3之后，为开源大模型的发展注入新的活力。

目前，Ollama已经可以下载Phi-3 Mini。下载完成后，可以运行和体验。

ollama pull phi3ollama run phi3

Phi-3 Mini的参数量为38亿，下载大约2.3GB，是Llama3 7B的一半。

技术特点与优势

Phi-3 Mini是微软Phi系列的新一代模型，采用高达3.3T tokens的训练数据，支持4K和128K上下文窗口，使其在处理长文本时更加得心应手。

在各大基准测试平台中，即便对比参数规模更大的Mixtral 8x7b和GPT-3.5，Phi-3 Mini在语言理解、编码、数学等方面的测试中展现了出色的整体性能。

实测与问题

我通过Ollama实际测试了一下，提了一个问题：“How to learn English for a grade 10 student in China”，并对比了Phi-3 Mini，Gemma 2B和Gemma 7B各自生成的答案。

Phi-3 Mini的回答质量与Gemma 7B相当，生成速度略快。

当前，Phi-3 Mini的主要问题是语言单一，主要针对美式英语进行训练。所以如果用在中文环境中，需要通过Prompt，让Phi-3 Mini用英文推理，并对问题和答案进行相应翻译。

微软还计划在未来几周内发布70亿参数的Phi-3 Small、140亿参数的Phi-3 Medium。

让我们期待Phi-3的7B和14B版本，在多语言支持上将会有更好表现。

探索应用场景

Phi-3 Mini的4bit量化版本，能够在iPhone 14手机上运行，每秒生成12个tokens数据，展现出轻量级大模型的巨大潜力。

我非常看好轻量级大模型，在手机和个人电脑上的应用前景。

基于本地轻量级大模型开发各种智能助手、原生AI应用，在终端上提供个性化的用户体验和高效的语言处理能力。
集成到办公、教育等应用软件中，提高文本编辑、数据分析和编程辅助的智能化水平，帮助用户学习语言和提供更好的互动体验。
结合个人电脑上的知识文档，通过轻量级大模型和检索增强生成技术，实现离线的本地知识库问答。

未来，轻量级大模型的性能一定会越来越好，将足以满足在手机等终端设备上运行和应用的需求！轻量级大模型不仅能为终端应用，提供本地化支持，也会成为终端设备上的基础组件。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

RAG开发框架LangChain与LlamaIndex对比解析：谁更适合你的AI应用？

2025-04-29

我们有必要使用 Qwen3 吗？

2025-04-29

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

做好 AI Agent 最重要的是什么？

2025-04-29

大模型是否有必要本地化部署？

2025-04-28

给 AI 小白的说明书：什么是 Manus？AI Agent为什么重要？

2025-04-28

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB