微信扫码
添加专属顾问
我要投稿
探索AI时代下用户交互方式的变革,LUI与GUI的较量。 核心内容: 1. LUI在AI驱动产品中的流行现象 2. 从CUI到GUI再到LUI的演变历程 3. 2024年大模型时代下的LUI发展展望
在持续关注AI-Driven的新产品过程中,我发现一个现象:无论场景特点如何,很多产品都选择了LUI的交互方式。似乎只有坚守LUI,才算是坚守了AI时代的原教旨主义。
但见新人笑,那闻旧人哭,难倒GUI真的要被时代淘汰了么?
从CUI到GUI再到LUI,交互60年演变史
想要回答这个问题,我们不妨先回溯下用户交互界面的发展历史,就从上世纪70年代的CUI开始讲起。
彼时的计算机交互界面是CUI 命令行用户界面(Command Line Interface),CUI通过文本命令和用户进行交互的界面,用户需要输入特定的指令来执行操作,在系统管理、编程等领域被广泛应用。在今天的windows电脑上,桌面上按下Win+R键,输入cmd并回车,就能够打开这个界面。
显然,CUI更接近编程Geek的使用体验,只有特定的命令才能够触发对应的系统响应。这样高的使用门槛,使得CUI很难普及。
微软、苹果两家公司通过给CUI配上图形交互,让各种繁琐命令隐藏在鼠标的拖拽、点选动作之下,才让电脑真的成了普罗大众可以使用的设备。
1979年,当乔布斯拜访施乐PARC研究中心时,就被团队图形界面的展示所深深吸引。援引《乔布斯传》,在看到GUI的那一刹那,乔布斯感慨到“那一刻就好像我眼前的面纱被解开了,我看到了电脑的未来。”
无独有偶,比尔盖茨也同样认为图形界面是电脑的未来趋势,当时的微软和苹果一样,都有权使用施乐PARC研究中心的图形界面成果。盖茨亦称“没错,我们相信图形界面就是未来,我们也看到了PARC研究中心的成果。”
两位大佬的相爱相杀,却也成就了今天个人计算机GUI 图形用户界面(Graphical User Interface)的普及。
GUI是一种通过图形元素(如窗口、按钮)和用户进行交互的界面,用户通过点选、输入、滑动等操作来与系统交互。我们日常使用的电脑Windows、Mac操作系统,手机iOS、Android系统,和运行其上的各种App、软件大都是GUI界面。
时光一晃来到了2011年,在iPhone 4S面世当天,苹果Siri也以智能语音助手的身份首次亮相。随后,亚马逊的Alexa,国内的小爱同学、小度小度等基于语音交互驱动的音箱产品、手机语音助手等逐步普及化。我们也慢慢开始习惯通过纯语音的方式进行信息的获取和沟通。
这就是LUI 语言用户界面(Language User Interface),通过自然语言和用户进行交互的界面,用户通过文本输入和语音来表达需求,系统通过自然语言理解和生成技术来响应用户的需求。
只是当时的云端服务还远远谈不到智能,无论是对用户表达理解(听懂用户在说什么)还是系统服务的满足(能够满足用户需求)都差强人意,这些语音助手也多半只能提供基础的服务。
再度按下时间加速键:经过了13年的发展,当2024年大模型的能力能够充分理解人类的自然语言表达的时候,以聊天驱动的服务才真正达到了可用状态。这也让我们开始重新关注LUI界面的可能性。
LUI挺好,可是人类不行
尽管大模型能够读懂(听懂)我们在说什么了,可以通过MCP完成服务承载了,但LUI可能仍然是一个看起来门槛很低,实际门槛很高的方案。
事实上,LUI的门槛并不在于交互,而在于用交互的人,其症结在于“用户难以精简、精准的表达全部需求”。
首先,用户的表达范围没有办法超过其认知的边界;
其次,用户的表达很难做到精准和完备。
最后,如果做到了精准和完备,用户的表达很难同时保持精简。
让我们以AI绘图为例进行阐述。
在MidJourney横空出世后,很多教程都在告诉大家如何写出一个效果甚佳的提示词。一个经典的模版是:
① 你想要的是照片还是画作?
② 照片的主题是什么?人?动物?还是风景?
③ 你想要补充哪些细节?布光方式:柔光、环境光、环形光、霓虹灯光环境:室内、室外、水下、太空色彩方案:鲜艳、深色、粉色视角:正面、顶视、侧面背景:纯色、星云、森林
④ 采用特定的艺术风格?3D 风格?吉卜力工作室风格?电影海报风格?
⑤ 特定的照片类型?微距?远摄?
1、用户的表达范围没有办法超过认知的边界
在上述prompt中的艺术风格部分为例,普通用户真的知道那么多的艺术风格名称么?我曾在好奇心的驱动下搜索过,仅以动漫风格的细分,就有:迪士尼风格、皮克斯风格、梦工厂风格、DC动漫风格、日式动漫风格、Chibi动漫风格等等。(如下,就是同一张图片在不同风格下的输出效果)如果用户都不知道有这么多的细分,自然也就不可能告诉AI要按照这个风格来创作。
2、用户的表达很难做到精准和完备
想要得到一张符合自己预期的图片,用户的prompt就至少需要覆盖上述5个方面。如果没有覆盖完全,就难免会出现抽卡的情况,需要用户费时费力的一遍遍尝试不说,也会对平台算力造成浪费。
而我们开始做产品经理的第一天就知道:用户是懒的,让用户精准完备的表达自己的需求,几乎是不可能完成的任务。
3、如果做到了精准和完备,用户的表达很难同时保持精简
退一步讲,如果用户真的可以全知全能实现了精准和完备,他的输入就一定变得完备而冗长,其想要完成一项任务的输入成本就会变高。比如,下图的生成prompt是:
1girl,,dress,blunt_bangs, blurry, blurry_foreground, bug, butterfly, butterfly_on_head, crown, cup, day, dress, drinking_glass, eyebrows_visible_through_hair, flower, detail_eyes, head_tilt, instrument, light_particles, light_rays, green_dress,blue hair,
“LUI是填空题,GUI是选择题”。
正是因为完全使用LUI有这样那样的问题,我们才需要将大模型的能力用GUI包装起来,给用户提供低成本的交互方案。
在生图的场景下,一些常见的GUI解决方案:
给出热门方案参考,解决用户不知道画什么的问题;
将prompt的生成过程拆解为多个步骤,确保用户能够依次提供风格、描述、视角、光照等不同角度的信息,使得信息不遗漏。
支持prompt润色,用AI来帮用户改prompt。
直接提供一键同款的功能,将复杂繁琐的图片生成prompt打包提供。
GUI为主、LUI为辅
沿着这个路径继续推论:
LUI更适合的是早期的、开放的、长尾的需求。因为市面上没有成型的解决方案,所以需要通过文字描述将问题抛给大模型,并通过多轮对话来找到一个用户满意的解决方案。
而当一个有收益规模的场景相对明确之后,其流程化的部分、高频出现的选项就可以通过GUI的方式固定下来,从而提升更广泛用户的使用效率,只将LUI的输入当做高级功能予以保留。
以豆包的“帮我写作”功能为例,就罗列了几十种写作目的帮助用户快速选择,在选择了“宣传文案”的方式后,将固定的Pattern在输入框中以预填,让用户完成更少的信息输入。
在线设计平台蓝湖的CEO任洋辉在接受访谈时这样谈论LUI 和 GUI:
“不管是现在的 APP,还是生产软件,我觉得它一定会是 LUI 和 GUI 的混合态。其实大家进入到一个应用之前,本身就带有一个诉求。这个诉求就是这个 APP 解决的场景,不管是打车、餐厅什么的,只要把这个诉求讲出来。这是相对清晰的,会更高效一些。input 如果有太多的选择、有太多分岔的东西,可能通过 GUI 选择。你说你帮我把周边的餐馆推荐一下,但是有 7 个选择,你通过文字展示还是读给我,都很麻烦,形成一个界面点击一下是最高效的。”
用户使用某一个服务的诉求始终是解决问题,他并不关心是LUI 还是 GUI。
产品经理对于交互方案的选择还是要回归到“用户、场景、任务”三元素,以阻力最小】产出最高的方式来实现产品的设计。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-25
微信聊天框内置元宝,超级 App 又一轮进化开始
2025-03-25
万字长文,聊聊下一代AI Agent的新范式
2025-03-25
从FP8到安全张量,DeepSeek‑V3‑0324 重塑大模型生态的秘密武器
2025-03-25
体验实在Agent,这才是当前形成生产力的企业级通用智能体
2025-03-25
Tokens与大语言模型:你真的懂它们的关系吗?
2025-03-25
法律助手:LexisNexis助力法律AI
2025-03-25
Cherry Studio 入门 MCP:为你的大模型插上翅膀
2025-03-25
【AIOps】Prometheus/夜莺接入DeepSeek大模型
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-03-25
2025-03-23
2025-03-22
2025-03-22
2025-03-22
2025-03-22
2025-03-22
2025-03-21