AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Meta AI 首席科学家:LLM 无法达到人类智能水平 !
发布日期:2024-05-25 07:57:32 浏览次数: 1825


Meta 人工智能负责人表示,像 ChatGPT 这样的大型语言模型永远无法像人类一样推理和计划,他正专注于一种激进的替代方法,旨在为机器创造“超级智能”。
Yann LeCun 是这家拥有 Facebook 和 Instagram 的社交媒体巨头的首席人工智能科学家,他表示大型语言模型“对逻辑的理解非常有限...... 不理解物理世界,没有持久记忆,无法按照任何合理的定义进行推理,也无法...... 进行分层计划”。
在接受《金融时报》采访时,LeCun 主张不要依赖大型语言模型 (LLM) 的进步来实现人类智能,因为他认为这些模型只有在被灌输正确训练数据的情况下才能准确回答问题,因此从本质上来说是“不安全的”。
相反,他正致力于开发新一代人工智能系统,希望赋予机器人类水平的智能,但他表示这个愿景可能需要 10 年才能实现。
随着生成式人工智能的爆发,Meta 斥资数十亿美元开发自己的大型语言模型,旨在追赶微软支持的 OpenAI 和谷歌母公司 Alphabet 等科技巨头。
LeCun 领导着 Meta 基础人工智能研究 (Fair) 实验室的约 500 名员工团队。他们正在努力创造能够像人类一样发展常识并学习世界运行方式的人工智能,这种方法被称为“世界建模”。
Meta 人工智能主管的实验性愿景对社交媒体集团来说是一场潜在的冒险和代价高昂的赌博,因为此时投资者正渴望看到人工智能投资的快速回报。
上个月,Meta 首席执行官马克·扎克伯格 (Mark Zuckerberg) 誓言增加支出并将社交媒体集团打造成“世界领先的人工智能公司”时,Meta 的市值损失了近 2000 亿美元,这让华尔街投资者感到恐慌,他们担心成本上升但短期收入潜力有限。
“我们认为我们正处于即将迎来下一代人工智能系统顶峰的关头,”LeCun 说。
他的言论正值 Meta 及其竞争对手大力推进性能更强的 LLM 之际。OpenAI 首席执行官萨姆·阿尔特曼 (Sam Altman) 等人物认为,这些模型是创造人工通用智能 (AGI) 的重要一步 - 这意味着机器将拥有比人类更强的认知能力。
OpenAI 上周发布了其新型更快的 GPT-4o 模型,谷歌则推出了一款名为 Project Astra 的新型“多模态”人工智能代理,该代理可以跨视频、音频和文本回答实时查询,由升级版“双子星”模型提供支持。
Meta 上个月也推出了其新型 Llama 3 模型。该公司全球事务负责人克莱格爵士 (Sir Nick Clegg) 表示,其最新款 LLM 拥有“大大改善的推理能力(例如将逻辑应用于查询)”。例如,该系统会推断出患有头痛、喉咙痛和流鼻涕的人患了感冒,但也可能会识别出过敏反应可能导致这些症状。
然而,LeCun 表示这种 LLM 的演进是肤浅和有限的,模型只有在人类工程师干预并对其进行训练时才能学习,而不是像人类一样有机地得出结论。
LeCun 说:“对于大多数人来说,这肯定看起来像是推理,但主要还是利用了大量训练数据积累的知识。” 但他也补充道:“尽管存在局限性,[LLM] 仍然非常有用。”
谷歌 DeepMind 也花了数年时间研究构建 AGI 的替代方法,包括强化学习等方法,在这种方法中,人工智能代理通过类似游戏的虚拟环境从周围环境中学习。
DeepMind 首席执行官德米斯·哈萨比斯爵士 (Sir Demis Hassabis) 周二在伦敦的一次活动中表示,语言模型缺少的是“它们无法理解你所处的空间环境......这最终限制了它们的效用”。
Meta 于 2013 年设立了 Fair 实验室,以率先进行人工智能研究,并聘请了该领域的领先学者。
然而,在 2023 年初,Meta 创建了一个新的 GenAI 团队,由首席产品官克里斯·考克斯 (Chris Cox) 领导。它从 Fair 挖走了许多人工智能研究人员和工程师,并领导了 Llama 3 的开发工作,并将其集成到产品中,例如其新的 AI 助手和图像生成工具。
GenAI 团队的成立是因为一些内部人士认为,Fair 实验室内的学术文化部分应为 Meta 姗姗来迟加入生成式人工智能热潮负责。在投资者压力下,扎克伯格一直在推动人工智能的更多商业应用。
然而,据接近该公司的人士透露,LeCun 仍然是扎克伯格的核心顾问之一,这得益于他作为人工智能创始元老之一的记录和声誉,他因在神经网络方面的工作而获得了图灵奖。
“我们将 Fair 重新聚焦于人类级人工智能的长期目标,本质上是因为 GenAI 现在专注于我们可以清晰看到路径的东西,”LeCun 说。
“(实现 AGI)这不是一个产品设计问题,甚至不是一个技术开发问题,而是一个科学问题,” 他补充道。
LeCun 在 2022 年首次发表了关于其世界建模愿景的论文,此后 Meta 发布了两个基于该方法的研究模型。
LeCun 今天表示,Fair 正在测试各种想法以实现人类级智能,因为“其中存在着许多不确定性和探索,因此我们无法判断哪种方法会成功或最终被采纳”。
LeCun 的团队正在尝试的一种方法是向系统提供数小时的视频,并故意省略一些帧,然后让 AI 预测接下来会发生什么。这模仿了孩子们如何被动观察周围世界来学习的方式。
他还表示,Fair 正在探索构建“通用文本编码系统”,该系统将允许系统处理文本中知识的抽象表示,然后将其应用于视频和音频。
一些专家对 LeCun 的愿景是否可行表示怀疑。
图兰大学计算机科学副教授 Aron Culotta 表示,常识一直是“人工智能的一大难关”,教授模型因果关系非常具有挑战性,这使得它们“容易出现意外的失败”。
一位前 Meta AI 员工将世界建模的推进描述为“模糊不清的宣传”,并补充道:“这感觉像是很多抢占地盘的行为。”
另一位现任员工表示,Fair 尚未证明自己能真正与 DeepMind 等研究团队竞争。
从长远来看,LeCun 认为这项技术将为人工智能代理提供支持,用户可以通过可穿戴技术(包括增强现实或“智能”眼镜)和肌电图 (EMG) “手镯” 与之互动。
他说:“[对于人工智能Agent来说],要想真正有用,它们需要拥有类似人类水平的智能。”
https://www.ft.com/content/23fab126-f1d3-4add-a457-207a25730ad9


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询