微信扫码
添加专属顾问
我要投稿
探索DeepSeek如何成为孩子们的科学导师,体验教育实验的乐趣。 核心内容: 1. DeepSeek教育实验的启发与分享 2. DeepSeek如何引导孩子自主探索科学问题 3. DeepSeek-r1与O3-mini-high的对比分析
最近用 DeepSeek 做了好多教育实验,不断地被“哇塞”到。撷取片段整理成文,希望能激发你的灵感、也和 DeepSeek 聊天并找我分享你收获的“哇塞”。今天的这篇为方便阅读,先贴出重新排版后的对话内容(严格保留原始对话,包括 AI 翻车的部分),然后是 R1 思考过程中的一些亮点,最后还有和 O3-mini-high 的对比。
AI 会成为老师和父母的好帮手,来应对孩子的十万个为什么。但如果我们不想让孩子觉得“有不懂的问问 AI 就好,我不需要学了”,那就不应该让 AI 直接给答案,而是要让 AI 引导孩子自己找答案,还要能拓展,用更多相关的问题激发孩子更强烈的好奇心。
因此,我设计了一个循循善诱的科学老师:面对孩子的任何问题,它都会先澄清问题、搞明白孩子为什么这么问;再思考与之相关的知识点、提炼出关键问题;最后引导孩子观察相关现象、提出猜想并验证、最终才给出解释,并用拓展问题引出更多思考。
之前用 Claude3.5 或 O1,这套提示词也只能让老师从回复中获得一些启发,借鉴到和孩子的讨论中。
DeepSeek-r1 的表现如何呢?我们来看例子——
问题来自这套非常可爱的书的第一节:为什么水是湿的。
整个对话中,因为我故意的误导,R1 也出现了好几次胡说八道。但坦率地说,真人老师面对孩子的任意问题,或许会犯比 AI 更多的错误。
可以尝试把 metaso、幻觉小模型和 R1 结合起来使用,应该能比较有效地避免这类错误。最近 R1 太不稳定,等后续稳定了来尝试下。
我非常喜欢这段对话中,AI 用通俗易懂的方式给出了大量日常生活中的相关现象——孩子的一个问题裂变成好几串问题,简直是好奇心的永动机。它甚至给得太多了?? 需要陪伴孩子的成年人观察一下孩子接受度,别被 AI 砸晕。
这次我使用的提示词如下图。如果给一个求知欲旺盛的孩子用,可以考虑需要调整一下,让 AI 提及更多专业术语并简单解释。(同样,因为服务器不稳定,我只能下次再测试了)。幸好今天硅基流动让我还算顺畅地测试完了。是真正的满血版,速度还不错,偶尔会拒绝请求。DS 官网用不了的时候大家去它家试试。其它挂羊头卖狗肉,用小号 DS 来骗流量的大家就要擦亮眼睛呀。
R1 和孩子的对话清晰简洁,但内心戏其实非常多,思考过程中有很多给人启发的火花。提示词和完整对话,都可以在公众号后台回复“科学课”来查看。
最后的最后,给大家看个笑话吧。下图是 OpenAI 刚发布的 O3-mini-high,和之前 O1-Preview 刚推出时很像——经常出现离谱的伪思考(调和酒精和蜜糖创造一种平衡的味道?O3 你是认真的吗?!!)
前些天我看到拾象闭门会讨论内容中,提及模型会“先去生成没有用的想法,然后最后突然答对,原因在于很多 RL hack 做得非常隐晦,模型可能在预训练的时候背了很多问题,所以明面上是在思考,其实只是在靠近背的题。“,这和我使用 O 家推理模型的体感非常一致。难道是只追求 scaling law 练出了会背很多题的书呆子?
使用 O1 的体感,甚至让我一度坚信让 AI 自己拆解问题评估回答、左脚踩右脚、是踩不出 AGI 来的。
好在,现在有在深度思考上断崖式领先的 R1 让我重新看到希望。嗯,是该去认真读读 R1-zero 的论文了。从目前 R1 带来的惊喜看,这真的是 AlphaZero 级别的突破
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-13
一键搞定!Cursor四步让PDF变成高清图片
2025-03-12
DeepSeek+ima.copilot打造专属写作神器
2025-03-12
思考一下!AI Agent 和 MCP 到底啥关系,正确的使用姿势?看完这篇你就懂了!
2025-03-12
Manus 的狂热和争议之后,我和 AI 开发者们聊了聊 :这是智能体的胜利吗?
2025-03-12
企业如何用好DeepSeek?从业务文档生成场景开启
2025-03-12
AI时代,我们如何修自己的内心?
2025-03-12
AI 开发工具生态全景解析:从原型设计到全栈开发的效率革命
2025-03-12
AI时代人机交互,如何构建高效且富有创造力的人机协同体系?
2025-03-06
2024-09-04
2025-01-25
2024-09-26
2024-10-30
2024-09-03
2024-12-25
2024-10-30
2024-12-11
2024-09-06