AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI Agent大爆发!智谱AI神器GLM-PC上线,让你的电脑自己干活?
发布日期:2025-01-24 06:59:57 浏览次数: 1546 来源:AI智能探长
推荐语

**内容简介**:智谱 AI 神器 GLM-PC 上线,能让电脑自己干活,带来未来人机交互新体验!
**内容大纲**:
1. 从语言模型到全面管电脑,GLM-PC 的核心魅力
2. 技术从工具到伙伴的迈进
3. GLM-PC 带来的未来人机交互展望

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

年前 AI 圈混战,真是太热闹了!前有OpenAI放出“烟雾弹”,暗示成功研发GPT-5,甚至ASI超级智能或已诞生,后有DeepSeek-R1-Preview抢占公众视线,甚至媲美OpenAI o1模型。

今天呢,智谱的Agent又搞了个大动作!OpenAI 那边的 Operator 搞得半遮半掩,结果还没亮相呢,智谱就扔出了电脑智能体——GLM-PC 1.1 版,小名“牛牛”。

名字听着萌,但干的活可真猛:能一键帮你网上冲浪、发微信拜年、摘取文件内容、编辑文档……好家伙,电脑简直被它玩得服服帖帖

你可能会问:“不就是个能操作电脑的AI吗,有啥大不了?”

别急,咱们先聊聊为什么这一切跟科幻片似的,甚至可以说是未来人机交互的下一站。

1. 从“大语言模型”到“全面管电脑”:牛牛的核心魅力

回想这两年,AI 不断在文本层面秀神操作:什么 ChatGPT、文心一言、AI自动写稿……

但它们大多停留在“生成文本”的层面。而智谱这款 GLM-PC,不光会写,还会‘干’——它能看见你的屏幕,就像你家电脑面前坐着个小助手,鼠标移哪点哪,给你办各种事儿。

举例子吧:过年了,家里亲戚朋友一大堆,你想着给每个人都发一句定制的新春祝福,再加张福字海报,还想做个拜年视频——你只需跟“牛牛”说一声,这小家伙就自动打开素材网站、搞定图片和短片,然后切到微信挨个发过去。

这操作,看得你自己都想问:我家电脑啥时候变成了人工秘书?

在我看来,这意味着AI走出了“只能输出文字”的时代,开始直接把电脑当“工具箱”来用。

说来了,过去AI只能告诉你怎么做,现在它会“自己动手”做。

2. 技术从工具到伙伴的一大迈进

技术像生命,会自我生长。GLM-PC 让我真切看到这个苗头:它不再是冷冰冰的指令执行器,而是像一个拥有自我意志的小帮手——能观察界面、做逻辑分析、再动手处理任务,让我们的“电脑劳力活儿”变得几乎全自动。

凯文·凯利说过一句很有名的话:“技术会不断地自动化我们最初以为只有人类能做的事,直到那件事再也不稀奇。”

GLM-PC 就是在自动化“点击电脑、挨个切软件、搜索、复制粘贴、发信息”这些操作。

换言之,你以前得手动搞半天的事,现在一句话就打发了。

3. 它怎么做到“点电脑”这种事?

有些人可能好奇:AI 要发朋友圈,得点微信界面,那它是怎么找到按钮?别担心,这玩意儿可不靠蒙,背后是一整套“视觉+逻辑”双引擎。

右脑(GUI感知):就像你自己看电脑界面,知道哪里是图标、哪里是输入框;牛牛靠多模态技术理解屏幕画面,好比人眼看到“这是搜索框,我该在这儿打字”。

左脑(逻辑推理+代码思维):它的思维链会像写脚本一样,先想好第1步干啥、第2步干啥,最后执行。失败了还会自我反思,再试一次。

简单点说,它的“大脑”里既能看见屏幕,也能做条理分明的操作安排。

就像一位双商在线的朋友,既能懂你的话,也懂如何在电脑世界里扭转乾坤。

4. 这不就是科幻里“全能助手”的雏形吗?

没错。想想你在手机上有个Siri或啥AI助手,可它顶多说说天气、帮你设闹钟。

而GLM-PC这类Agent,不仅会唠嗑,还能“动手”,那场面就很赛博:你给它一个终极目标,比如:“把淘宝购物车里添加的新年零食、再复制进Excel表保存一下”,它就真能大包大揽地完成任务。你不需要再折腾鼠标键盘,AI自动干了。

为什么说这事重大? 因为过去AI解决的多是“认知层面”的事情,如回答问题、翻译文本。

现在它切入“操作层面”,实际上打开了所有GUI应用的世界——剪辑视频、做PPT、上传文档、写邮件……潜力让人膛目结舌。

想想以后你随口一说“帮我做一段5分钟的家庭Vlog放微博”,它能自己打开剪辑软件、挑选片头、加特效、写文案,然后上传完再告诉你:“活干好了,您瞅瞅?”

5. AI将来要彻底改写我们的工作模式

我们要看到,这类Agent不只是省力气这么简单,而是对我们的工作甚至生活模式带来重塑。

个人效率:你在电脑上80%的琐事都能外包给Agent,自己只做创造性的20%。想想上班8小时,可能有半天是在扯繁琐的操作呀。将来你只要当“监工”就行。

软件生态:传统软件靠人点来点去维持用户黏性,可是如果大部分操作都由AI完成,软件之间的交互逻辑也许要重新设计。

产业格局:谁先把Agent技术做成熟,谁就在下一波操作系统革命中占得先机。可能就像当年手机从键盘到触屏那样,这次是从手动点击到Agent自动干活的飞跃。

6. 跟PC厂商合作?这就是AIPC的雏形

智谱说他们还想跟联想、华硕等厂商一起推动“AI Personal Computer”,让Agent直接写进系统底层。

这意味着啥? 未来买电脑时自带“AI分身”!夸张点儿想,如果PC硬件也为AI做了深度适配,处理指令、识别GUI都能更快更稳。那时,电脑可真变成24小时贴身的小队友,无论你想干什么,动动嘴就OK。抑或让它自己看你日历和邮件,然后帮你排出最优的工作计划。

换言之,这不是在跟桌面系统抢地盘吗?要是谁家 Agent 做得体验最好、最安全,用户就可能死心塌地用那家的AIPC,其他对手统统靠边。

7.  2025:Agent元年的真正冒尖?

今年OpenAI和谷歌都在放风说自己要做Agent,智谱也在手机端、PC端双双落子。难道2025真是Agent的“集中爆发年”吗?

我个人认为,这种情况相当可能。一来,各巨头都盯紧了这个大蛋糕;二来,用户对“自动化+AI助手”的需求非常旺盛;三来,硬件性能和网络带宽足以支撑更复杂的GUI操作;四来,行业已经从单纯对话式AI,逐渐转向对“操作层”更有突破野心的Agent产品。

如果 2023 是大模型元年,2024 是多人AI竞速,那 2025 也许就是 Agent 的绽放之年。

到时我们回头看,也许如今智谱的 GLM-PC 1.1 只是一个小小的引线,后面会诞生一大票“AI超级管家”,然后大家彻底摆脱了重复劳动,专注在更有价值或更有创造性的事上。

哎,想想都激动!

8、新的交互浪潮在即,我们能抓住什么?

总归一句话,智谱在GLM-PC身上让我们看到AI对电脑的操控能力,这不只是一项炫技的科技秀,而是一块极具想象力的未来版图。

技术真正的力量在于“解放我们的想象力”,而Agent正好处于这个释放过程的开端——让我们既摆脱繁琐又可能拥有无尽创造力。

在这场变革里,你我可能既是受益者,也是见证者。多少年前,我们对“手机能做什么”都没概念,结果App时代改变一切;现在,“AI能点电脑”的想象力同样会在未来几年迸发出更多“杀手级场景”。

也许有一天,我们朝电脑吼一声:‘帮我剪辑下孩子的舞台表演,发给亲友群,顺便在B站上挂个链接……’就全搞定,那时你会不会感慨:

好在我紧跟这个浪潮,没有落下?

反正,我是挺看好这股Agent风潮的。GLM-PC仅仅是开始,我们早晚会迎来一个真正的“AI超级管家”——从手机到平板,从电视到汽车,统统被AI代理管控,人类只管保持创意和梦想。

乍一听激动人心,但也希望别忘了安全和合规,大伙一起把路铺扎实,才能走得久、走得远。

所以,下一步你或许可以试玩一下GLM-PC,体验一下什么叫“我干啥,你别动——不对,恰恰相反,我啥都不干,让AI来动”。

记得关注@AI智能探长 也许一不小心,你就会成为见证下一个操作系统革命的人。

点个关注不迷路,一起跟上AI时代

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询