我要投稿

OpenAI 推出GPT-4o Mini免费微调服务，跨境电商可以薅羊毛了！

发布日期：2024-07-24 11:55:59 浏览次数： 2301

昨天晚上 11 点多，Meta 发布了他们的 Llama-3.1。

今天一大早，就看到 OpenAI 耐不住寂寞，搞了一个大动作：他们把 GPT-4o mini 的微调功能给放出来了。

难怪有网友在 OpenAI 开发者账号下面的评论区调侃他们。

有意思的是，昨天晚上很多在等 Meta 发布 Llama-3.1 的用户也在闲暇之余调侃，不知道 OpenAI 会不会搞事狙击 Meta。没想到果然不出所料，OpenAI 在 2、3 点就放出 GPT-4O mini 支持微调。

可能有些朋友会说，这有啥用吗？这跟现在线上用的 GPT 有啥区别？

那我可以告诉你，这玩意可有大用处了。可以这么跟你说，这玩意就是专门为企业或者有独特需求的人准备的接口。

其实逻辑很简单，之前大家都能用的 ChatGPT 像一个百事通，啥都懂一点，但要它专精某个领域，可能有一点难度了。

前几天跟我一个很好的朋友在探讨，怎么用 ChatGPT 作为大模型为终端，然后做一个 AI 客服系统。我记得当时我还画了一张图跟他聊这个事情。

我当时还说，现在目前最为麻烦的事情就是知识库的搭建和微调。当时我们想的是，用开源的模型，比如下面这些模型，然后针对特定的企业拿他们的资料来微调这些大模型。

这样，这些大模型就可以专精于这个领域，解决用户的问题。现在回想了下这个过程，确实是费时费力，效果还不一定好。

现在好了，GPT-4O mini 的微调功能出来后，我们就可以让 ChatGPT 为我所用。但是如果你要在国内使用，还是得用国产的大模型，毕竟国内要用大模型还是得合规。

有了 GPT-4O mini 的微调功能，我们自己的开发人员就可以直接提供训练数据，让它变身成为企业的专属 AI 助手。

在 AI 越来越走向个性化的今天，这种可定制性简直就是企业的福音。

像一些在线 AI 平台，虽然功能齐全，但是对于有些企业来说还是太过通用。选项一堆，我到底该怎么用？怎么才能让它完美契合我的业务？

所以我们需要的，其实就是 GPT-40 mini 这样的大模型，通过微调，一站式解决企业的特定需求，不用东拼西凑，简单高效。

而且，现在这个微调功能对 4 级、5 级用户开放，每天还能免费使用 200 万Tokens。最爽的是，9月23 日之前，这个微调功能居然还是免费的。当然，OpenAI 也说了，后面会逐步开放给所有用户使用。

对于真心想把 AI 融入自己公司业务的企业来说，说真的这简直就是及时雨啊。

因为有了这个微调功能，你就可以：

打造专属客服 AI，精通你的产品知识
开发行业特定的 AI 助手，比如法律顾问、财务分析师
创建符合企业调性的文案生成器
设计针对特定编程语言或框架的代码助手

总之，只要你有数据，GPT-4o mini 就能为你所用。

说到这儿，不少开发者已经开始摩拳擦掌了。有人希望能对整个代码库进行微调，而不仅仅是 JSON 文件。

还有人已经开始实际测试了，发现 GPT-4o mini 版本的微调速度快，虽然效果可能不如 GPT-4o，但考虑到成本和速度，已经很不错了。

当然，也有不少人对微调还不太了解，问了些基本问题。比如能不能直接上传文档让模型记住并回答问题，以及是否会创建一个新的可通过 API 访问的实例。看来官方还得多做做科普啊。

有意思的是，已经有人在问能不能对图像进行微调了。虽然官方指南没提到，但是这种需求确实存在。看来用户对这个功能的期待值挺高啊。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-02-18

DeepSeek R1 671B 完整版本地部署教程来了！！！

2025-02-18

昇腾 910B 部署满血 DeepSeek-R1

2025-02-18

如何训练LLMs像DeepSeek-R1“思考”

2025-02-17

7G显存，训练你自己的DeepSeek-R1

2025-02-17

DeepSeek-R1 如何通过知识蒸馏将推理能力传递给 Qwen

2025-02-16

飞书多维表格+Deepseek王炸组合，最强AI agent工具

2025-02-16

谷歌 AI Agent 白皮书 3/3

2025-02-16

如何在通义灵码里用上 DeepSeek-V3 和 DeepSeek-R1 满血版 671B 模型？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

DeepSeek R1 671B 完整版本地部署教程来了！！！

2025-02-04

太爽了！o1 现在可以天天享用了

2024-09-18

万字综述 10+ 种 LLM 投机采样推理加速方案

2024-07-11

FP8 低精度训练：Transformer Engine 简析

2024-07-11

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-07-09

彻底理解系列之：FP32、FP16、TF32、BF16、混合精度

2024-07-26

ollama 部署 deepseek-r1 70B 模型完整指南

2025-01-27

o3-mini 完全指南：一个被 DeepSeek 破大防的模型

2025-02-01

谈谈DeepSeek-v3在算力约束下的出色工作

2024-12-29

大家都在问

如何在通义灵码里用上 DeepSeek-V3 和 DeepSeek-R1 满血版 671B 模型？

2025-02-16

2025·人人都该懂一点的AI基础技术-ChatGPT、DeepSeekR1是如何被训练出来的？

2025-02-10

运行 70B的LLM，需要多大GPU显存 ?

2025-02-10

一场技术突围战：DeepSeek如何让我扔掉百度飞桨和阿里OCR？

2025-02-09

别被Deepseek低成本冲昏头！本地化部署后续的“甜蜜陷阱”，你真能扛住吗？

2025-02-05

AI大模型那么强，它是吃什么长大的？

2025-01-24

怎么学习设计和训练一个大模型——也就是神经网络？

2025-01-22

如何本地部署AI模型？

2025-01-14

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB