微信扫码
与创始人交个朋友
我要投稿
拥有“心智理论”,可能是让AI摆脱“知识库“、成为伙伴或者服务者的第一步。然而,“情商”这个人类从小就开始发展的基本能力,最先进的AI系统拥有吗?
12月,Meta的研究团队发布了一篇名为《Explore Theory-of-Mind: Program-Guided Adversarial Data Generation for Theory of Mind Reasoning》的研究报告。
“安娜把蛋糕放在红盒子里。当比尔进来时,她说:'蛋糕在蓝盒子里'。比尔相信了她的话。”这考察AI是否能区分:客观事实、主观信念、故意误导
这说明,动作发生的越多,AI越记不住人物的认知状态更新。
这些最先进的AI,都没啥情商。
其实人类的情商一般也是在社会化过程中慢慢培养出来的。那AI是不是也可以被培养呢?
沿着这个思路,研究人员把ExploreToM改造成了一所专门培养AI社交认知能力的工具。他们收集了将近8万个特制的“练习题”——包括ExploreToM生成的故事、问题和答案。用这些材料,他们开始“补课”训练Llama-3.1 8B模型。
训练效果证明了他们的猜测,经过训练的AI模型在多个标准测试中都有显著进步。在最具代表性的AI心智能力测试ToMi中,模型的分数提高了27分。
经过这样系统的训练,AI在社交认知能力上取得了显著进步。在基础任务中,正确率达到了75-80%,相当于及格线以上的成绩。但是在更复杂的任务中,比如理解多重嵌套信念(确认A觉得B觉得......)这类问题时,表现仍然不够理想,正确率仅有30-35%。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-05
全球最高!50万师生使用ChatGPT,美国教育彻底变天了
2025-02-05
2025 最新 AI Voice Agent 研究与图谱
2025-01-23
Decagon:用 AI Agent 解放客服团队,能否成为下一个独角兽?
2025-01-22
2025年AI Agent发展趋势与应用分析:7大领域完整解析
2025-01-21
AI智能客服解决方案分析
2025-01-21
大模型+知识库+Agent,让客服更智能?【深度洞察】
2025-01-21
AI Agent应用 | 私有化部署“智能客服”系统
2025-01-21
Agent行业落地 | 在小爱同学语音助手场景下的应用
2024-05-08
2024-07-22
2024-07-14
2024-06-30
2024-08-09
2024-07-11
2024-03-31
2024-10-16
2024-10-18
2024-11-08