我要投稿

LUI必然崛起，GUI终将淘汰？先别急着下结论！

发布日期：2025-03-21 21:08:32 浏览次数： 1643 作者：自视界

在持续关注AI-Driven的新产品过程中，我发现一个现象：无论场景特点如何，很多产品都选择了LUI的交互方式。似乎只有坚守LUI，才算是坚守了AI时代的原教旨主义。

但见新人笑，那闻旧人哭，难倒GUI真的要被时代淘汰了么？

从CUI到GUI再到LUI，交互60年演变史

想要回答这个问题，我们不妨先回溯下用户交互界面的发展历史，就从上世纪70年代的CUI开始讲起。

彼时的计算机交互界面是CUI 命令行用户界面（Command Line Interface），CUI通过文本命令和用户进行交互的界面，用户需要输入特定的指令来执行操作，在系统管理、编程等领域被广泛应用。在今天的windows电脑上，桌面上按下Win+R键，输入cmd并回车，就能够打开这个界面。

显然，CUI更接近编程Geek的使用体验，只有特定的命令才能够触发对应的系统响应。这样高的使用门槛，使得CUI很难普及。

微软、苹果两家公司通过给CUI配上图形交互，让各种繁琐命令隐藏在鼠标的拖拽、点选动作之下，才让电脑真的成了普罗大众可以使用的设备。

1979年，当乔布斯拜访施乐PARC研究中心时，就被团队图形界面的展示所深深吸引。援引《乔布斯传》，在看到GUI的那一刹那，乔布斯感慨到“那一刻就好像我眼前的面纱被解开了，我看到了电脑的未来。”

无独有偶，比尔盖茨也同样认为图形界面是电脑的未来趋势，当时的微软和苹果一样，都有权使用施乐PARC研究中心的图形界面成果。盖茨亦称“没错，我们相信图形界面就是未来，我们也看到了PARC研究中心的成果。”

两位大佬的相爱相杀，却也成就了今天个人计算机GUI 图形用户界面（Graphical User Interface）的普及。

GUI是一种通过图形元素（如窗口、按钮）和用户进行交互的界面，用户通过点选、输入、滑动等操作来与系统交互。我们日常使用的电脑Windows、Mac操作系统，手机iOS、Android系统，和运行其上的各种App、软件大都是GUI界面。

时光一晃来到了2011年，在iPhone 4S面世当天，苹果Siri也以智能语音助手的身份首次亮相。随后，亚马逊的Alexa，国内的小爱同学、小度小度等基于语音交互驱动的音箱产品、手机语音助手等逐步普及化。我们也慢慢开始习惯通过纯语音的方式进行信息的获取和沟通。

这就是LUI 语言用户界面(Language User Interface)，通过自然语言和用户进行交互的界面，用户通过文本输入和语音来表达需求，系统通过自然语言理解和生成技术来响应用户的需求。

只是当时的云端服务还远远谈不到智能，无论是对用户表达理解（听懂用户在说什么）还是系统服务的满足（能够满足用户需求）都差强人意，这些语音助手也多半只能提供基础的服务。

再度按下时间加速键：经过了13年的发展，当2024年大模型的能力能够充分理解人类的自然语言表达的时候，以聊天驱动的服务才真正达到了可用状态。这也让我们开始重新关注LUI界面的可能性。

LUI挺好，可是人类不行

尽管大模型能够读懂（听懂）我们在说什么了，可以通过MCP完成服务承载了，但LUI可能仍然是一个看起来门槛很低，实际门槛很高的方案。

事实上，LUI的门槛并不在于交互，而在于用交互的人，其症结在于“用户难以精简、精准的表达全部需求”。

首先，用户的表达范围没有办法超过其认知的边界；

其次，用户的表达很难做到精准和完备。

最后，如果做到了精准和完备，用户的表达很难同时保持精简。

让我们以AI绘图为例进行阐述。

在MidJourney横空出世后，很多教程都在告诉大家如何写出一个效果甚佳的提示词。一个经典的模版是：

① 你想要的是照片还是画作？

② 照片的主题是什么？人？动物？还是风景？

③ 你想要补充哪些细节？布光方式：柔光、环境光、环形光、霓虹灯光环境：室内、室外、水下、太空色彩方案：鲜艳、深色、粉色视角：正面、顶视、侧面背景：纯色、星云、森林

④ 采用特定的艺术风格？3D 风格？吉卜力工作室风格？电影海报风格？

⑤ 特定的照片类型？微距？远摄？

1、用户的表达范围没有办法超过认知的边界

在上述prompt中的艺术风格部分为例，普通用户真的知道那么多的艺术风格名称么？我曾在好奇心的驱动下搜索过，仅以动漫风格的细分，就有：迪士尼风格、皮克斯风格、梦工厂风格、DC动漫风格、日式动漫风格、Chibi动漫风格等等。（如下，就是同一张图片在不同风格下的输出效果）如果用户都不知道有这么多的细分，自然也就不可能告诉AI要按照这个风格来创作。

2、用户的表达很难做到精准和完备

想要得到一张符合自己预期的图片，用户的prompt就至少需要覆盖上述5个方面。如果没有覆盖完全，就难免会出现抽卡的情况，需要用户费时费力的一遍遍尝试不说，也会对平台算力造成浪费。

而我们开始做产品经理的第一天就知道：用户是懒的，让用户精准完备的表达自己的需求，几乎是不可能完成的任务。

3、如果做到了精准和完备，用户的表达很难同时保持精简

退一步讲，如果用户真的可以全知全能实现了精准和完备，他的输入就一定变得完备而冗长，其想要完成一项任务的输入成本就会变高。比如，下图的生成prompt是：

1girl,,dress,blunt_bangs, blurry, blurry_foreground, bug, butterfly, butterfly_on_head, crown, cup, day, dress, drinking_glass, eyebrows_visible_through_hair, flower, detail_eyes, head_tilt, instrument, light_particles, light_rays, green_dress,blue hair,

“LUI是填空题，GUI是选择题”。

正是因为完全使用LUI有这样那样的问题，我们才需要将大模型的能力用GUI包装起来，给用户提供低成本的交互方案。

在生图的场景下，一些常见的GUI解决方案：

给出热门方案参考，解决用户不知道画什么的问题；
将prompt的生成过程拆解为多个步骤，确保用户能够依次提供风格、描述、视角、光照等不同角度的信息，使得信息不遗漏。
支持prompt润色，用AI来帮用户改prompt。
直接提供一键同款的功能，将复杂繁琐的图片生成prompt打包提供。

GUI为主、LUI为辅

沿着这个路径继续推论：

LUI更适合的是早期的、开放的、长尾的需求。因为市面上没有成型的解决方案，所以需要通过文字描述将问题抛给大模型，并通过多轮对话来找到一个用户满意的解决方案。

而当一个有收益规模的场景相对明确之后，其流程化的部分、高频出现的选项就可以通过GUI的方式固定下来，从而提升更广泛用户的使用效率，只将LUI的输入当做高级功能予以保留。

以豆包的“帮我写作”功能为例，就罗列了几十种写作目的帮助用户快速选择，在选择了“宣传文案”的方式后，将固定的Pattern在输入框中以预填，让用户完成更少的信息输入。

在线设计平台蓝湖的CEO任洋辉在接受访谈时这样谈论LUI 和 GUI：

“不管是现在的 APP，还是生产软件，我觉得它一定会是 LUI 和 GUI 的混合态。其实大家进入到一个应用之前，本身就带有一个诉求。这个诉求就是这个 APP 解决的场景，不管是打车、餐厅什么的，只要把这个诉求讲出来。这是相对清晰的，会更高效一些。input 如果有太多的选择、有太多分岔的东西，可能通过 GUI 选择。你说你帮我把周边的餐馆推荐一下，但是有 7 个选择，你通过文字展示还是读给我，都很麻烦，形成一个界面点击一下是最高效的。”

用户使用某一个服务的诉求始终是解决问题，他并不关心是LUI 还是 GUI。

产品经理对于交互方案的选择还是要回归到“用户、场景、任务”三元素，以阻力最小】产出最高的方式来实现产品的设计。