我要投稿

一项发表在《科学》杂志上的研究通过分析婴儿的视频数据，训练了一套AI系统，模拟婴儿学习语言的过程。

发布日期：2024-06-03 20:12:38 浏览次数： 2117

作者：活水智能

微信搜一搜，关注“活水智能”

语言是人类沟通的基石。一个婴儿如何从简单的咿呀声发展到流畅的语言表达，这一过程一直是心理学、语言学和人工智能领域研究的焦点。

过去，研究者主要依靠观察和假设来探索婴儿是如何学习语言的。

一项发表在《科学》杂志上的研究通过分析婴儿的视频数据，训练了一套AI系统，模拟婴儿学习语言的过程。

这一研究不仅为我们理解语言的习得提供了新的视角，也为研究AI的自然语言处理能力提供了新的方法。

从婴儿的视角看世界

在这项研究中，科学家采取了一种创新的方法收集数据——记录一个婴儿从六个月大到两岁半的日常活动视频。

研究团队让婴儿每周佩戴头戴式摄像头约2小时，总计获得了61小时的视频资料。

佩戴摄像头的婴儿

（图来源：纽约时报）

这些视频不仅捕捉到了婴儿的视觉体验，还记录了父母与婴儿之间的互动。

为了构建这个特殊的数据集，研究助理做了大量繁琐工作，他们对视频中的每一帧进行了细致的标注。

视频共有60万帧，这些标注涵盖了37500个发音，例如父母在婴儿玩耍时说的话：“你看到那个三角形的积木了吗？”

这为注释AI系统提供了丰富的学习材料，使其能够模拟婴儿如何通过视觉和听觉信息学习语言。

AI学习语言的过程

研究团队采用了一种先进的机器学习技术——对比学习，以及模拟人脑结构和功能的神经网络，来训练AI系统。

这种训练方式模仿了婴儿学习语言的过程，即通过不断试错，学习将声音与视觉信息相匹配。通过训练，AI学会了将视频中的图像与对应的单词关联起来。

婴儿视角的视频帧及其附带的转录话语（Wai Keen Vong 供图）

对比学习是一种强有力的学习技术，它通过比较不同数据点之间的关系来训练模型。在这项研究中，AI系统必须识别出哪些图像与相应的单词匹配，哪些不匹配。

这种学习方式与婴儿学习语言的过程非常相似。

AI的超预期表现

研究结果显示，AI系统在将图像与其正确的单词匹配方面的成功率达到了62%，远超科学家们预期的25%的随机成功率。

这一发现挑战了传统观念，即语言习得必须依赖于复杂的内在机制。

研究表明，即使是一个相对简单的AI系统，也能通过关联日常生活中的视觉和听觉信息来学习语言。

AI系统在识别高频出现的物体时表现更佳，如苹果和婴儿床，这可能是因为这些物体在婴儿的日常生活中出现频率较高。

然而，AI在识别刀子等物体时表现不佳，这可能是因为这些物体在婴儿的日常生活中出现得较少，或者是因为它们的图像在视频中不够清晰。

小结

尽管当前的AI系统仍被视为“脆弱且缺乏常识”，但这项研究无疑为我们向未来迈出了一大步。

这项研究向我们展示了，AI可以通过类似婴儿的日常经验来学习单词，而不必依赖于庞大的数据集。未来或许AI能够更自然地习得语言。

研究团队计划将更多的头戴式相机视频数据纳入他们的模型中，以观察AI系统在接收到更多数据时的学习成果。

他们还希望测试模型是否能够学习更复杂的单词和语言行为，这些行为往往在年龄更大时出现。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-03

智能重塑攻防：人工智能在网络安全领域的深度应用与未来范式

2025-07-03

大模型在软件工程中的真实能力边界

2025-07-03

vec2text 技术已开源！一定条件下，文本嵌入向量可“近乎完美地”还原

2025-07-03

临界知识：大语言模型时代的人机认知边界

2025-07-03

用点线面体理论聊AI项目落地的困境

2025-07-03

基于大语言模型（LLM）的应用分块策略

2025-07-03

AI 商业化，Salesforce 做对了什么？

2025-07-02

AI文档智能体上线！AutoHub v0.7.0 全面升级，重构知识工作流

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek R1-0528 小版本升级

2025-05-29

教你解决GPT4o无法使用新版生图功能的教程

2025-04-11

AI法规-《生成式人工智能服务管理暂行办法》（中国）（2023.7）

2025-04-12

比 R1 快 8 倍、价格仅 3%，智谱新推理模型来袭，能让免费智能体自己赚钱！张鹏：Agent 也有 Scaling Law

2025-04-06

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

豆包，让有独立显卡的电脑都能部署本地大模型，语料库就是电脑里的文件

2025-04-17

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

大家都在问

AI 商业化，Salesforce 做对了什么？

2025-07-03

AI 编程如何在团队中真正落地？

2025-07-02

AI 如何成为认知导航仪？

2025-07-02

巨头混战Agent，押注背后是真未来还是新泡沫？

2025-07-01

什么才是AI时代最大的创业机会？

2025-07-01

大模型+Agent智能体：新一代全息立体防控体系如何重塑智慧公安？

2025-07-01

OpenAI、Anthropic集体踩坑！上下文越大，AI越蠢？

2025-07-01

Llama Factory 是什么？

2025-06-30

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

一项发表在《科学》杂志上的研究通过分析婴儿的视频数据，训练了一套AI系统，模拟婴儿学习语言的过程。

从婴儿的视角看世界

AI学习语言的过程

AI的超预期表现

小 结

小结