支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


LUI必然崛起,GUI终将淘汰?先别急着下结论!

发布日期:2025-03-21 21:08:32 浏览次数: 1576 来源:自视界
推荐语

探索AI时代下用户交互方式的变革,LUI与GUI的较量。

核心内容:
1. LUI在AI驱动产品中的流行现象
2. 从CUI到GUI再到LUI的演变历程
3. 2024年大模型时代下的LUI发展展望

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

在持续关注AI-Driven的新产品过程中,我发现一个现象:无论场景特点如何,很多产品都选择了LUI的交互方式。似乎只有坚守LUI,才算是坚守了AI时代的原教旨主义。

但见新人笑,那闻旧人哭,难倒GUI真的要被时代淘汰了么?


1

从CUI到GUI再到LUI,交互60年演变史

想要回答这个问题,我们不妨先回溯下用户交互界面的发展历史,就从上世纪70年代的CUI开始讲起。


彼时的计算机交互界面是CUI 命令行用户界面(Command Line Interface),CUI通过文本命令和用户进行交互的界面,用户需要输入特定的指令来执行操作,在系统管理、编程等领域被广泛应用。在今天的windows电脑上,桌面上按下Win+R键,输入cmd并回车,就能够打开这个界面。


显然,CUI更接近编程Geek的使用体验,只有特定的命令才能够触发对应的系统响应。这样高的使用门槛,使得CUI很难普及。

微软、苹果两家公司通过给CUI配上图形交互,让各种繁琐命令隐藏在鼠标的拖拽、点选动作之下,才让电脑真的成了普罗大众可以使用的设备。


1979年,当乔布斯拜访施乐PARC研究中心时,就被团队图形界面的展示所深深吸引。援引《乔布斯传》,在看到GUI的那一刹那,乔布斯感慨到“那一刻就好像我眼前的面纱被解开了,我看到了电脑的未来。” 

无独有偶,比尔盖茨也同样认为图形界面是电脑的未来趋势,当时的微软和苹果一样,都有权使用施乐PARC研究中心的图形界面成果。盖茨亦称“没错,我们相信图形界面就是未来,我们也看到了PARC研究中心的成果。”

两位大佬的相爱相杀,却也成就了今天个人计算机GUI 图形用户界面(Graphical User Interface)的普及。

GUI是一种通过图形元素(如窗口、按钮)和用户进行交互的界面,用户通过点选、输入、滑动等操作来与系统交互。我们日常使用的电脑Windows、Mac操作系统,手机iOS、Android系统,和运行其上的各种App、软件大都是GUI界面。


时光一晃来到了2011年,在iPhone 4S面世当天,苹果Siri也以智能语音助手的身份首次亮相。随后,亚马逊的Alexa,国内的小爱同学、小度小度等基于语音交互驱动的音箱产品、手机语音助手等逐步普及化。我们也慢慢开始习惯通过纯语音的方式进行信息的获取和沟通。

这就是LUI 语言用户界面(Language User Interface),通过自然语言和用户进行交互的界面,用户通过文本输入和语音来表达需求,系统通过自然语言理解和生成技术来响应用户的需求。

只是当时的云端服务还远远谈不到智能,无论是对用户表达理解(听懂用户在说什么)还是系统服务的满足(能够满足用户需求)都差强人意,这些语音助手也多半只能提供基础的服务。


再度按下时间加速键:经过了13年的发展,当2024年大模型的能力能够充分理解人类的自然语言表达的时候,以聊天驱动的服务才真正达到了可用状态。这也让我们开始重新关注LUI界面的可能性。


2

LUI挺好,可是人类不行

尽管大模型能够读懂(听懂)我们在说什么了,可以通过MCP完成服务承载了,但LUI可能仍然是一个看起来门槛很低,实际门槛很高的方案。


事实上,LUI的门槛并不在于交互,而在于用交互的人,其症结在于“用户难以精简、精准的表达全部需求”。

首先,用户的表达范围没有办法超过其认知的边界;

其次,用户的表达很难做到精准和完备。

最后,如果做到了精准和完备,用户的表达很难同时保持精简。


让我们以AI绘图为例进行阐述。

在MidJourney横空出世后,很多教程都在告诉大家如何写出一个效果甚佳的提示词。一个经典的模版是:


① 你想要的是照片还是画作?

② 照片的主题是什么?人?动物?还是风景?

③ 你想要补充哪些细节?布光方式:柔光、环境光、环形光、霓虹灯光环境:室内、室外、水下、太空色彩方案:鲜艳、深色、粉色视角:正面、顶视、侧面背景:纯色、星云、森林

④ 采用特定的艺术风格?3D 风格?吉卜力工作室风格?电影海报风格?

⑤ 特定的照片类型?微距?远摄?


1、用户的表达范围没有办法超过认知的边界

在上述prompt中的艺术风格部分为例,普通用户真的知道那么多的艺术风格名称么?我曾在好奇心的驱动下搜索过,仅以动漫风格的细分,就有:迪士尼风格、皮克斯风格、梦工厂风格、DC动漫风格、日式动漫风格、Chibi动漫风格等等。(如下,就是同一张图片在不同风格下的输出效果)如果用户都不知道有这么多的细分,自然也就不可能告诉AI要按照这个风格来创作。

2、用户的表达很难做到精准和完备

想要得到一张符合自己预期的图片,用户的prompt就至少需要覆盖上述5个方面。如果没有覆盖完全,就难免会出现抽卡的情况,需要用户费时费力的一遍遍尝试不说,也会对平台算力造成浪费。

而我们开始做产品经理的第一天就知道:用户是懒的,让用户精准完备的表达自己的需求,几乎是不可能完成的任务。


3、如果做到了精准和完备,用户的表达很难同时保持精简

退一步讲,如果用户真的可以全知全能实现了精准和完备,他的输入就一定变得完备而冗长,其想要完成一项任务的输入成本就会变高。比如,下图的生成prompt是:

1girl,,dress,blunt_bangs, blurry, blurry_foreground, bug, butterfly, butterfly_on_head, crown, cup, day, dress, drinking_glass, eyebrows_visible_through_hair, flower,  detail_eyes, head_tilt, instrument, light_particles, light_rays, green_dress,blue hair,


“LUI是填空题,GUI是选择题”。

正是因为完全使用LUI有这样那样的问题,我们才需要将大模型的能力用GUI包装起来,给用户提供低成本的交互方案。


在生图的场景下,一些常见的GUI解决方案:

  • 给出热门方案参考,解决用户不知道画什么的问题;

  • 将prompt的生成过程拆解为多个步骤,确保用户能够依次提供风格、描述、视角、光照等不同角度的信息,使得信息不遗漏。

  • 支持prompt润色,用AI来帮用户改prompt。

  • 直接提供一键同款的功能,将复杂繁琐的图片生成prompt打包提供。




3

GUI为主、LUI为辅

沿着这个路径继续推论:

LUI更适合的是早期的、开放的、长尾的需求。因为市面上没有成型的解决方案,所以需要通过文字描述将问题抛给大模型,并通过多轮对话来找到一个用户满意的解决方案。

而当一个有收益规模的场景相对明确之后,其流程化的部分、高频出现的选项就可以通过GUI的方式固定下来,从而提升更广泛用户的使用效率,只将LUI的输入当做高级功能予以保留。


以豆包的“帮我写作”功能为例,就罗列了几十种写作目的帮助用户快速选择,在选择了“宣传文案”的方式后,将固定的Pattern在输入框中以预填,让用户完成更少的信息输入。


在线设计平台蓝湖的CEO任洋辉在接受访谈时这样谈论LUI 和 GUI:

“不管是现在的 APP,还是生产软件,我觉得它一定会是 LUI 和 GUI 的混合态。其实大家进入到一个应用之前,本身就带有一个诉求。这个诉求就是这个 APP 解决的场景,不管是打车、餐厅什么的,只要把这个诉求讲出来。这是相对清晰的,会更高效一些。input 如果有太多的选择、有太多分岔的东西,可能通过 GUI 选择。你说你帮我把周边的餐馆推荐一下,但是有 7 个选择,你通过文字展示还是读给我,都很麻烦,形成一个界面点击一下是最高效的。”


用户使用某一个服务的诉求始终是解决问题,他并不关心是LUI 还是 GUI。

产品经理对于交互方案的选择还是要回归到“用户、场景、任务”三元素,以阻力最小】产出最高的方式来实现产品的设计。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询