微信扫码
与创始人交个朋友
我要投稿
1、OpenAI 在 9 月 13 日发布了 o1 的预览版。
2、o1 全称叫 OpenAI o1, 没有延续之前 GPT 系列,可见足够强大,当然也有一种说法是 o1 作为一个垂直基础模型为未来 GPT-5 赋能。
3、o1 在推理方面变得更加强大了,特别擅长做数学题和写代码。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,o1 的得分为 83%。
4、o1 分为两个版本:o1-preview 和 o1-mini,可能因为训练成本巨大或是其他原因(比如收集更高质量的问题),发布时 o1-preview 每周只能使用 30 次查询,o1-mini 是 50 次。GPT Plus 的付费用户才能使用。
5、9 月 17 号,OpenAI 发布消息,放宽了限额,o1-preview 现在为每周 50 次查询,o1-mini 改为每天 50 次查询(够用了)。
6、o1 最特别的地方是能「思考」了,之前的版本都强调能快速给出结果,对 o1 来说「慢」是一种特点,当我们对 o1 提出问题时,内部会生成一个思维链来逐步推理问题,类似于人类解题时的思考过程,尝试不同的策略,并能认识到自己的错误进行调整。所以时间花的更长,通常几秒到几十秒不等。
7、o1 的慢和之前系列的快,就像丹尼尔·卡尼曼的《思考,快与慢》中写的快思考和慢思考:
8、正是因为 o1 能对问题进行推敲,就大大降低使用者的难度了,以前想要一个好的答案,需要写出好的提示词,现在 o1 经过推敲,更能理解提问者背后的意思。提升了易用性和效率。AI 发展太快,提示词工程师是不是刚要上岗就面临失业了呢?
9、和 GPT-4o 相比较,虽然推理能力强大很多,但功能还不算完善,比如不支持图像、不支持联网查询等,期待后续的版本。
10、对于编码来说,我们使用 o1-mini 就够了,因为 o1-mini 比 o1-preview 便宜 80%,每周有更多的查询次数,而且,编码仅需要推理不需要广泛的世界知识,非常适合 o1-mini。
11、我用 o1-mini,写了一个 License 生成工具,前端用 vue3、后端使用 .NET8,慢慢引导,从基本的功能到加上登录、加上鉴权等,周末一个上午时间就搞定了,基本没有出错,确实很强大。
12、AI 这么强大了,我们应该做更重要的事情。我觉得技术学习分为三层:
重要的事情就是指架构层和原理层的学习。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-12
TableGPT2-7B:浙大推出专注于分析和处理表格数据的大模型
2024-11-12
AI大模型多轮对话的五个挑战与应对方法
2024-11-12
Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI
2024-11-12
真假◎智能原生(AI Native)应用极其挑战
2024-11-12
微软最新的多AI 代理框架:Magnetic-One
2024-11-12
大模型时代的软件研发:正确的打开方式
2024-11-11
百模大战中的网络:科大讯飞万卡级智算集群
2024-11-11
Scaling Law撞墙,AI圈炸锅了!OpenAI旗舰Orion被曝遭遇瓶颈,大改技术路线
2024-05-28
2024-04-26
2024-04-11
2024-08-21
2024-07-09
2024-07-18
2024-10-25
2024-08-13
2024-06-17
2024-07-01