微信扫码
与创始人交个朋友
我要投稿
昨天晚上 11 点多,Meta 发布了他们的 Llama-3.1。
今天一大早,就看到 OpenAI 耐不住寂寞,搞了一个大动作:他们把 GPT-4o mini 的微调功能给放出来了。
难怪有网友在 OpenAI 开发者账号下面的评论区调侃他们。
有意思的是,昨天晚上很多在等 Meta 发布 Llama-3.1 的用户也在闲暇之余调侃,不知道 OpenAI 会不会搞事狙击 Meta。没想到果然不出所料,OpenAI 在 2、3 点就放出 GPT-4O mini 支持微调。
可能有些朋友会说,这有啥用吗?这跟现在线上用的 GPT 有啥区别?
那我可以告诉你,这玩意可有大用处了。可以这么跟你说,这玩意就是专门为企业或者有独特需求的人准备的接口。
其实逻辑很简单,之前大家都能用的 ChatGPT 像一个百事通,啥都懂一点,但要它专精某个领域,可能有一点难度了。
前几天跟我一个很好的朋友在探讨,怎么用 ChatGPT 作为大模型为终端,然后做一个 AI 客服系统。我记得当时我还画了一张图跟他聊这个事情。
我当时还说,现在目前最为麻烦的事情就是知识库的搭建和微调。当时我们想的是,用开源的模型,比如下面这些模型,然后针对特定的企业拿他们的资料来微调这些大模型。
这样,这些大模型就可以专精于这个领域,解决用户的问题。现在回想了下这个过程,确实是费时费力,效果还不一定好。
现在好了,GPT-4O mini 的微调功能出来后,我们就可以让 ChatGPT 为我所用。但是如果你要在国内使用,还是得用国产的大模型,毕竟国内要用大模型还是得合规。
有了 GPT-4O mini 的微调功能,我们自己的开发人员就可以直接提供训练数据,让它变身成为企业的专属 AI 助手。
在 AI 越来越走向个性化的今天,这种可定制性简直就是企业的福音。
像一些在线 AI 平台,虽然功能齐全,但是对于有些企业来说还是太过通用。选项一堆,我到底该怎么用?怎么才能让它完美契合我的业务?
所以我们需要的,其实就是 GPT-40 mini 这样的大模型,通过微调,一站式解决企业的特定需求,不用东拼西凑,简单高效。
而且,现在这个微调功能对 4 级、5 级用户开放,每天还能免费使用 200 万Tokens。最爽的是,9月23 日之前,这个微调功能居然还是免费的。当然,OpenAI 也说了,后面会逐步开放给所有用户使用。
对于真心想把 AI 融入自己公司业务的企业来说,说真的这简直就是及时雨啊。
因为有了这个微调功能,你就可以:
总之,只要你有数据,GPT-4o mini 就能为你所用。
说到这儿,不少开发者已经开始摩拳擦掌了。有人希望能对整个代码库进行微调,而不仅仅是 JSON 文件。
还有人已经开始实际测试了,发现 GPT-4o mini 版本的微调速度快,虽然效果可能不如 GPT-4o,但考虑到成本和速度,已经很不错了。
当然,也有不少人对微调还不太了解,问了些基本问题。比如能不能直接上传文档让模型记住并回答问题,以及是否会创建一个新的可通过 API 访问的实例。看来官方还得多做做科普啊。
有意思的是,已经有人在问能不能对图像进行微调了。虽然官方指南没提到,但是这种需求确实存在。看来用户对这个功能的期待值挺高啊。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-16
深入理解预训练与微调,为什么需要预训练,什么是微调?
2024-11-16
GenAI部署:成功率与ROI为何双下滑?
2024-11-13
无需网络,轻松在手机上离线布署本地大模型
2024-11-13
DataOps for LLM 的数据工程技术架构实践
2024-11-13
LLM性能优化中的一些概念扫盲
2024-11-13
蚂蚁集团 | 提出多任务大模型微调方法:CoBa,LLM最高性能提升13%!
2024-11-12
Scaling Law提出者Ilya发声:大模型预训练效果趋于平缓,扩展正确的东西变得更重要
2024-11-08
Ollama 更新!手把手教你用Ollama轻松搭建Llama 3.2 Vision + 视觉RAG系统(本地安装)
2024-07-11
2024-07-11
2024-07-09
2024-09-18
2024-06-11
2024-07-23
2024-07-20
2024-07-12
2024-07-26
2024-07-23