生成式人工智能通过关注基于意图的结果规范,为人类与系统交互提供了一种新的方式。GenAI 带来了新的挑战,因为它的输出是概率性的,需要理解变异性、记忆、错误、幻觉和恶意使用,这就带来了构建原则和设计模式的必要性,正如 IBM 所描述的那样。
此外,任何AI 产品都是一个分层系统,其中 LLM 只是其中一种成分,而内存、编排、工具扩展、UX 和代理用户流才是真正的魔力!
本文是我对 GenAI 设计模式演变的研究和记录,这些模式为产品经理、数据科学家和交互设计师提供了一种通用语言 ,帮助他们打造以人为本、值得信赖且安全的产品。通过应用这些模式,我们可以弥合用户需求、技术能力和产品开发流程之间的差距。
评估 GenAI 是否改善了用户体验或增加了复杂性。通常,基于启发式 (IF/Else) 的解决方案更易于构建和维护。
这种模式确保 GenAI 开发始于用户意图以及实现该意图所需的数据模型。GenAI
系统的优劣取决于其训练数据。但真正的用户并非以行列的方式表达,他们表达的是目标、挫折和行为。如果团队未能将用户需求转化为结构化的、模型可用的输入,最终的系统或产品可能会优化到错误的结果,从而导致用户流失。
GenAI 应用中的一个关键决策是完全自动化任务还是增强人类能力。使用此模式可以使技术与用户意图和控制偏好保持一致。
自动化最适合用户倾向于委派的任务,尤其是在繁琐、耗时或不安全的情况下。例如,Intercom FinAI 会自动将冗长的电子邮件线索汇总为内部笔记,从而节省重复性、低价值任务的时间。
增强功能能够提升效率、创造力和控制力,从而增强用户想要持续参与的任务。例如, Abelton 的Magenta Studio支持创造性的控制,方便用户操控和创作新音乐。
在人工智能系统中,自动化指的是将多少控制权委托给人工智能而不是用户。这是一种战略性的用户体验模式,它根据用户的痛点、情境场景和对产品的期望来决定自动化程度。
当用户第一次接触基于新技术的产品时,他们常常想知道系统能做什么和不能做什么,它如何工作以及他们应该如何与它交互。
该模式提供了多维策略来帮助用户使用 AI 产品或功能、减少错误、与用户准备情况保持一致,以提供明智且以人为本的用户体验。
这种模式是许多其他模式的顶峰
心智模型帮助用户预测系统(网页、应用程序或其他类型的产品)的运作方式,从而影响他们与界面的交互方式。当产品与用户现有的心智模型相符时,用户会感觉直观且易于上手。当两者发生冲突时,可能会导致用户沮丧、困惑,甚至放弃。
例如,Github Copilot 建立在开发人员从传统代码自动完成的思维模型之上,从而简化了向 AI 驱动的代码建议的过渡
例如,Adobe Photoshop 建立在使用矩形控件扩展图像的熟悉方法的基础上,通过集成其生成填充功能,智能地填充新创建的空间。
通过提问来识别并建立现有的心智模型
这种模式涉及清楚地传达人工智能模型能做什么和不能做什么,包括其知识边界、能力和局限性。
它有助于建立用户信任、设定适当的期望、防止误用,并在模型出现故障或异常行为时减少挫败感。
在人工智能系统中,思路链(CoT) 提示 技术 通过模仿人类更结构化、循序渐进的思维过程,增强了模型解决复杂问题的能力。
CoT 展示是一种用户体验模式,它通过揭示 AI 是如何得出结论的来提高透明度。这可以增强用户信任,提高可解释性,并为用户反馈提供空间,尤其是在高风险或模糊场景下。
例如,Perplexity通过显示处理步骤来增强透明度,帮助用户理解答案背后的深思熟虑的过程。
例如,Khanmigo是一种人工智能辅导系统,它通过模仿人类推理来逐步指导学生解决问题,以增强理解和学习。
GenAI 凭借其概率特性,能够对同一输入产生不同的响应。这种模式通过并排呈现多个输出来利用可变性。展示多样化的选项有助于用户创造性地探索、比较、改进或做出更符合其意图的决策。例如, Google Gemini提供了多种选项,帮助用户探索、改进并做出更明智的决策。
在 GenAI 应用程序中,清晰地阐明数据源对于透明度、可信度和用户信任至关重要。清晰地表明 AI 的知识来源有助于用户评估响应的可靠性并避免错误信息。
这在医疗保健、金融或法律指导等高风险事实领域尤其重要,因为决策必须基于经过验证的数据。
AI 生成的输出具有概率性,准确度可能存在差异。显示置信度分数可以传达模型对其输出的确定性。这有助于用户评估可靠性并做出更明智的决策。
记忆和回忆是一个重要的概念和设计模式,它使人工智能产品能够存储和重用过去交互中的信息,例如用户偏好、反馈、目标或任务历史,以提高连续性和情境感知。
用于访问信息的记忆可能是短暂的(会话内的短期)或持久的(跨会话的长期),并且可能包括对话上下文、行为信号或明确的输入。
情境输入参数通过简化用户交互来提升用户体验,并更快地实现用户目标。通过利用用户特定数据、用户偏好、过往交互,甚至来自其他具有相似偏好的用户的数据,GenAI 系统可以定制输入和功能,以更好地满足用户意图和决策。
副驾驶是一种增强模式,AI 充当协作助手,在用户掌控全局的同时,提供情境化和数据驱动的洞察。这种设计模式在战略制定、构思、写作、设计或编码等领域至关重要,因为这些领域的结果具有主观性,用户拥有独特的偏好,或者用户的创意输入至关重要。
副驾驶 加快工作流程,增强创造力并减少认知负荷,但人类仍保留创作权和最终决策权。
构建 UI 级机制,让用户根据用户目标、上下文场景或系统故障状态管理或覆盖自动化。
没有系统能够预测所有用户情境。控制赋予用户自主权,即使人工智能出错,也能保持信任。
GenAI 系统通常依赖于对人类输入的解读。当用户提供模糊、不完整或错误的信息时,AI 可能会误解其意图或产生低质量的输出。
输入错误通常反映的是用户期望与系统理解之间的不匹配。妥善处理这些问题对于维护信任和确保顺畅的交互至关重要。
GenAI 输出本质上是概率性的,容易出现幻觉、偏见和上下文错位等错误。
与传统系统不同,GenAI 的错误状态难以预测。针对这些状态进行设计需要透明度、恢复机制和用户自主性。精心设计的错误状态可以帮助用户了解 AI 系统的边界并重新获得控制权。
混淆矩阵有助于分析人工智能系统错误,并通过显示以下计数来深入了解模型的执行情况
-真阳性(正确识别阳性案例)
-假阳性(错误识别阳性案例)
-真阴性(正确识别阴性案例)
-假阴性(未能识别阴性案例)
现实世界的一致性需要直接的用户反馈来改进模型,从而改进产品。当人们与人工智能系统互动时,他们的行为会塑造并影响他们未来收到的输出。从而形成一个持续的反馈循环,系统和用户的行为都会随着时间的推移而不断调整。例如,ChatGPT使用“反应”按钮和“评论”框来收集用户反馈。
强大的 GenAI 模型需要在训练期间以及部署后持续进行评估。评估旨在确保模型按预期运行,识别错误和幻觉,并与用户目标保持一致,尤其是在高风险领域。
有三种关键的评估方法可以改进机器学习系统。
人工智能护栏的设计意味着在GenAI模型中建立实践和原则,以最大限度地减少伤害、错误信息、不良行为和偏见。至关重要的是
这种模式确保 GenAI 应用程序清楚地传达如何收集、存储、处理和保护用户数据。
GenAI 系统通常依赖于敏感数据、情境数据或行为数据。处理不当可能会导致用户不信任、法律风险或意外滥用。清晰地传达隐私保护措施有助于用户感到安全、受到尊重并掌控全局。例如,Slack AI 明确表示,客户数据仍归客户所有并控制,不会用于训练 Slack 或任何第三方 AI 模型。
兰亭妙微(www.lanlanwork.com )是一家专注而深入的界面设计公司,为期望卓越的国内外企业提供卓越的大数据可视化界面设计、B端界面设计、桌面端界面设计、APP界面设计、图标定制、用户体验设计、交互设计、UI咨询、高端网站设计、平面设计,以及相关的软件开发服务,咨询电话:01063334945。我们建立了一个微信群,每天分享国内外优秀的设计,有兴趣请加入一起学习成长,咨询及进群请加蓝小助微信ben_lanlan。