微信扫码
与创始人交个朋友
我要投稿
原文引自 Justin Weisz 的文章《Design Principles for Generative AI Applications》,译文内容已做部份删减和调整。
从聊天机器人到图像生成,再到编码助手,生成式 AI 技术正在开启一种新的交互方式。随着技术的快速发展,需要新的设计原则来指导如何安全有效地设计 AI 系统。
AI 技术的出现带来了新的思考和挑战,例如:
• 新的交互模式:用户不单是传统的点击方式而是可以通过自然语言与 AI 交互。
• 生成信息的差异性:AI 每次生成的内容都可能不同,这与传统的一致性设计原则相悖。
• 新风险:包括虚假信息、版权侵犯和个人信息泄露等。
原则 1:为责任感设计
策略 1:以人为中心。设计时需要以用户为中心,理解他们的需求和遇到的问题,而不是围绕技术或其功能。
——例如:通过观察用户的实际使用情况,设计出真正符合其需求的生成式AI应用。
策略 2:发现并平衡不同价值观的分歧。在开发、接受和使用 AI 系统的人群中,每个人的价值观可能都不同,需要我们认真考虑并找到一个大家都能接受的平衡点。
策略 3:非预期行为的处理策略。需要判断让用户能够探索 AI 的所有潜在功能,还是让用户只体验部分功能。
——例如:如果让 AI 像聊天一样自由地与人对话,它可能会展现出一些我们之前没教过它的新技能。例如,你可能会意外地发现,ChatGPT 这个聊天机器人不仅能聊天,还能分析人的情绪。而有些界面设计得比较有限制,它们只让用户看到 AI 的一部分能力。比如 AIVA 这个软件,它只让用户用到 AI 的一些特定功能。
原则 2:为心智模型设计
心智模型是我们对事物如何运作的看法。设计师要帮助用户理解 AI 系统,同时也要考虑用户的特点,让 AI 能更好地适应用户需求。
策略 1:让用户清楚 AI 的多变性。帮助用户理解 AI 系统的特点,即系统可能会对相同的输入信息产生多个不同的输出结果。
——例如:Google Gemini 面对用户的提问,会给出多个答案供用户参考。
策略 2:教育和引导。通过上下文关联或文字等引导的方式,辅助用户有效的学习和使用 AI 的各项功能。
——例如:Adobe Photoshop 通过弹出窗口和工具提示,向用户介绍其“生成式填充”功能。
策略 3:有同理心。在用户已有认知的基础上去构建系统,并通过用户了解当前功能的局限性,以便进一步提升体验。
——例如:Github Copilot 基于许多开发者熟悉的代码补全功能的认知,运用相似的交互方式,减少了开发者使用时的学习成本。
策略 4:让 AI 学习并了解用户。捕捉用户的期望、行为和偏好,以提升 AI 系统与他们的互动。
——例如:ChatGPT 提供了一个“自定义说明”表单,用户可以在其中回答诸如“你在哪里?”、“你的工作是什么?”以及“你可以谈论哪些主题”等问题。通过这种方式,用户可以向 ChatGPT 介绍自己,以便收到更加个性化的回复。
原则 3:为可信赖感设计
好的 AI 应用应该给出质量好又真实有用的结果。重要的是让用户学会判断 AI 给出的信息是否可靠,是否存在错误或偏见,并据此决定是否接受 AI 的结果或需要进行改进。
策略 1:告知用户功能的局限性。通过告知用户 AI 的能力与局限性,使用户可以更好的利用 AI 系统,并理解其功能的边界。
——例如:ChatGPT 在它的介绍界面上直接说明了它的能力(比如“回答问题、助你学习、编写代码、共同进行头脑风暴”)以及它的局限性(比如“ChatGPT 可能会提供不准确的信息”)。
策略 2:为结果提供解释。AI 系统在使用数据生成输出时,应该向用户清晰地展示其过程和信息来源,以此提升用户对 AI 系统的信任和理解。
——例如:Google Gemini 提供了它用来生成问题答案的来源列表。Adobe 披露了“生成式填充”功能是在使用“库存图像、公开许可的作品和版权已过期的公共领域内容”上训练的。
策略 3:增加适当阻力,避免过度依赖 AI。通过在关键决策点减缓用户速度的设计方式,促使用户判断和思考输出的结果。
——例如:Google Gemini 展示多个草稿供用户审阅,这可以鼓励他们放慢速度并甄别草稿质量的好坏。
策略 4:明确 AI 的角色。明确 AI 在用户工作流程中的角色。
——例如:GitHub Copilot 的口号“您的 AI 程序员伙伴”突显了它作为合作伙伴的角色。当用户编写代码时,Copilot 会以伙伴的角色主动提出建议。
原则 4:为 AI 生成的多样性设计
生成式 AI 系统具备一个显著的特点:即便面对相同的用户输入,也能够产生多样化的结果。这一特点要求设计师考虑如何控制展示结果的数量,并帮助用户在众多结果中进行有效的组织和筛选。
策略 1:合理运用生成结果的多样性。通过生成多个输出,来增加满足用户需求的可能性。
——例如:DreamStudio、DALL-E 和 Midjourney 都能根据单一提示生成多样化的图像;DreamStudio 默认生成四张图片,并允许用户根据需求增加至十张。
策略 2:用户体验路径可视化。向用户展示已经创建的所有成果,并引导他们去探索更多可能性。
——例如:DreamStudio、DALL-E 和 Midjourney 都展示了用户输入的历史记录以及由此产生的图像输出。
策略 3:用户可编辑。提供用户驱动或自动的功能,以便用户组织、标记和筛选最终结果。
——例如:在 DALL-E 中,用户不仅可以将图像标记为收藏,还能创建和命名多个公共或私有的收藏集,以整理自己的作品。
原则 5:为共同创造设计
生成式 AI 促进了共同创造的能力。通过提供控制的能力,让用户能够影响 AI 的生成过程,并与 AI 协作,从而帮助他们创造出满足自己需求的内容。
策略 1:帮助用户制定明确有效的目标和规则。协助用户有效的提出需求,以产生符合他们需求的输出成果。
——例如:IBM watsonx.ai Prompt Lab 的文档包含了一组提示和示例,来帮助用户清楚如何改进调整。
策略 2:提供通用的输入参数。让用户控制生成过程中的通用设置,如输出的数量或随机属性。
——例如:在 DreamStudio 中,用户可以通过滑块来指定生成图片的数量
策略 3:提供用例和技术相关的控制选项。让用户控制与其用例、领域或 AI 模型架构相关的参数。
——例如:AIVA 允许用户自定义其生成的音乐作品的特定领域特征,例如合奏类型和情感。
策略 4:让用户和 AI 系统共同编辑。
——例如:Adobe Photoshop 在其图像编辑工具的设计界面中整合了生成式 AI 的功能,使用户和 AI 模型能够共同编辑同一张图片。
原则 6:为不完美设计
需让用户理解客观指标(例如不真实或误导性的答案,违反提示规范)或主观指标(例如用户不喜欢输出结果)都存在不完美,设计师要明确指出这些缺陷,并帮助用户理解和合理运用不完美。
策略 1:告知不确定性。提示用户输出结果可能与他们的预期不符。
——例如:Google Gemini 的界面上写着:“Gemini 可能会展示不准确的信息,包括关于人的,因此请仔细检查它给出的回答。”这个声明提醒用户,其输出可能存在不确定性或不完美。一个原型源代码翻译界面通过突出显示源代码标记,根据底层模型对它们是否正确翻译的置信程度,向用户展示了生成模型的不确定性。
策略 2:使用专业领域的指标做生成依据。帮助用户识别达标的输出结果。
——例如:由 CogMol 生成的分子候选物,这是一个用于药物设计的原型生成应用程序,通过分子模拟器进行评估,以计算特定领域的属性,如分子量、水溶性和毒性。
策略 3:为用户提供优化和调整的方案。例如提供编辑、重新生成或替代方案的功能。
——例如:DALL-E 和 DreamStudio 允许用户通过擦除和重新生成图像的部分区域(内部绘制)或在图像边界之外生成新的部分(外部绘制)的方式来完善输出。
策略 4:提供反馈机制。收集用户反馈以改进人工智能系统的训练。
——例如:ChatGPT 为用户提供了一个选项,可以对其响应提供赞成或反对评级。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-14
2024-04-26
2024-03-30
2024-04-12
2024-05-10
2024-07-18
2024-05-22
2024-05-28
2024-04-25
2024-04-26