支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


扣子空间火了,是国产通用 agent 一个好的开始,比 manus 还差不少

发布日期:2025-04-20 06:22:00 浏览次数: 1550 作者:真知浩见
推荐语

国产多agent工具扣子空间内测体验,虽有亮点但与国际先进水平仍有差距。

核心内容:
1. 扣子空间内测体验及与Manus的对比
2. 扣子空间在用户研究领域的应用及不足
3. 国产大模型与国际先进水平的差距及未来展望

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

昨天晚上,扣子空间开始公开内测。一时间冲入好多人,服务器也被干爆了。

在即刻上搞到了一个邀请码,试用了一下,整体感觉是,这是国内首个多 Agent 的类 Manus 工具,是个好的开始,但生成质量还差不少。

进入首页,一眼看到了“用户研究专家”的 agent。想必这个产品还有字节的用研们的参与。

Pasted image 20250419102242.png

点开,里边有四个功能:

  • 问卷数据分析
  • 访谈纪要总结
  • 调研问卷生成
  • 访谈提纲生成
Pasted image 20250419102421.png
Pasted image 20250419102445.png

确实是用研的主要工作内容,让他就“抖音用户的社交需求”生成一个访谈提纲。

只进行了「思考」,没有其他工具参与,一眼看上去,生成的访谈提纲中规中矩,比不上 Gemini 2.5 pro 的结果。

Pasted image 20250419102715.png

再拿我最近用 ChatGPT、Gemini、Manus 的 deep research 功能都测过的一个问题来考考他:大模型时代,用户研究岗位的未来发展

Pasted image 20250419102931.png
Pasted image 20250419103120.png

跟这几个的搜索广度和产出质量都还差得远。Gemini 能搜索 400+个网页,这里只有十几个网页就结束了。

产出结果中也没有给出引用源,体现不出搜索的作用。

看出来,这是扣子对 manus 的魔方,都是通过多 agent 协作、模拟用户点击来获取信息。但因为 manus 是面向国外的,可以采用 claude 3.7 sonnet 作为基座模型,其调用工具的能力非常强。

而字节的扣子,应该就是用的自己的基座模型,无论从其思考能力还是调用工具的能力上,在国内的众多模型中,都没有什么突出的。

这两天阿里飞猪的旅行规划助理也火了,预计是基于其自己的 qwen 大模型,再基于其现有的平台数据,效果不错。

期待扣子空间的后续进化。有兴趣的同学,也可以测测这个”用户研究专家“的其他功能。

扣子空间采用了病毒营销的模式,拿到邀请码注册之后,创建一个任务,就会生成新的 5 个邀请码。

邀请码放在评论区了,先到先得。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询