如今,合成用户在用户体验研究中被广泛使用已是司空见惯。毕竟,随着人工智能的兴起,合成数据生成正在成为获取洞察的新常态。
具体来说,合成数据生成市场规模预计将以31.1% 的复合年增长率增长[1]。这意味着它不仅在增长,而且每年都在加速增长。到 2030 年,这个市场的价值可能达到惊人的 23.4 亿美元。简而言之,合成数据正变得如此庞大,企业无法忽视。
当然,合成用户,或 AI 生成的人物角色,只是合成数据生成的一种应用。合成数据的范畴要广泛得多。它涵盖了从虚假用户到虚假行为、交互,甚至是 AI 模型训练所用的虚假数据集等各种内容。具体来说,在用户体验研究中,合成用户是为了模仿真实用户的行为而创建的,这是利用合成数据进行设计和测试的一种方式。
这是企业无法忽视的。例如,一家大型电商公司如果过度依赖与人工智能生成的人物角色的互动,很容易就会将其用户体验研究预算削减 30%。
是的,他们或许会因在经济意义上彻底革新行业而获得赞誉[2]。但代价是什么呢?有些人甚至走得更远——马克·里森称赞合成数据改变了研究领域的格局。他强调,一些新的研究表明,人工智能生成的消费者数据与真实调查的结果“相似度高达90%左右” 。[3]
即使取得了这样的成功,公司最终仍会遭遇客户投诉,投诉内容包括设计不佳和需求未得到满足。这是因为合成数据有其局限性和风险。
是的——AI驱动的用户是基于真实用户数据的合成角色,它们模拟用户与功能的交互,提供初步洞察。然而,在AI角色中表现良好的功能在真实用户中仍可能失败,因为AI驱动的反馈缺乏情感深度和不可预测性,因此现实世界的验证至关重要。因此,如果仅仅依赖AI生成的洞察,用户参与度下降,并需要进行成本高昂的重新设计,也就不足为奇了。
这就引出了一个关键问题:人工智能生成的角色真的能在用户体验研究中取代人类的直觉吗?或者我们是否会因为过度依赖合成数据而危及创新?
本文将深入探讨这些问题,探讨在用户体验设计和研究中使用合成用户的机会和局限性。
此外,设计师将更清楚地了解何时以及如何在用户体验研究中有效地整合合成用户。
根据Neilsen/Norman Group 的说法,他们将合成用户定义为“试图模仿用户群的人工智能生成的资料,提供未研究真实用户而产生的人工研究结果”。
UX 研究使用模拟用户来获取用户洞察,测试界面、工作流程和设计元素,而无需依赖人类参与者。正如我们所见,人工智能正在持续革新各行各业,UX 研究也不例外。
目前,67% 的科技企业在其开发工作流程中使用合成数据,而 2019 年这一比例仅为 23% [4]。许多此类公司越来越多地使用合成用户来加速测试并研究全球市场的用户行为,从而节省时间和成本。然而,这种对人工智能生成人物角色的日益依赖,引发了关于合成用户研究的准确性、伦理道德和有效性的关键问题(本文稍后将对此进行探讨)。
但首先,让我们更多地了解合成用户。
它们究竟是如何被创造出来的?这些虚拟用户通常是使用人工智能模型构建的,这些模型基于大量真实用户交互、行为模式和决策过程的数据集进行训练。基本上,这些数据来自整个互联网!
传统的 UX 角色基于对真实用户群的定性和定量研究,而合成用户则完全由数据驱动,并通过 AI 或训练有素的 LLM 生成。
我们深知,传统用户画像需要基于市场调研手动创建和验证。而合成用户则可以根据人工智能生成的洞察动态调整其设置。因此,企业对使用合成用户的前景充满兴趣,因为它被视为一种可扩展且经济高效的替代方案。
无论如何,合成用户确实缺乏人类参与者在用户体验研究中所能展现的真实人类情感的深度和不可预测的行为。但了解合成用户的优势,挖掘其潜力,终将是一个明智的选择。
模拟用户可能会在设计领域引发负面情绪,但不可否认的是,它有时在用户体验研究中是一个有价值的工具。将模拟用户纳入用户体验研究可以带来以下一些好处:
这是我们最需要的优势。根据项目的性质,与真实人类用户进行用户体验研究通常既耗时又费钱,有时甚至会遇到尴尬的对话。然而,模拟用户消除了这些障碍,让我们能够以更低的成本进行快速测试。
站在一家金融科技初创公司的角度,他们正在开发一款新的移动银行应用。与其花费数周时间进行用户访谈,不如在数小时内生成数千名模拟用户。
在这种情况下,拥有合成用户可以帮助他们在时间和预算限制至关重要的竞争激烈的市场中快速迭代。
如果您想立即获取广泛的用户群体信息,那么合成用户数据将助您一臂之力。对于那些渴望探索各种文化和可访问性考量因素的用户体验团队来说,将合成用户纳入研究范围将大有裨益。
想象一下一家全球电子商务公司,当他们可以生成合成用户来在不同国家测试他们的网站,从而深入了解语言偏好和浏览习惯时,他们会拥有多大的优势。
合成用户无需访问现实世界的用户池即可模拟不同的背景。
我们必须面对现实——有些用户体验挑战会涉及罕见、极端甚至危险的情况,这些情况很难在真实用户身上复制。正因如此,AI 生成的用户数据可以帮助用户体验研究人员识别标准用户测试中可能无法发现的痛点。
假设一家网络安全公司想测试用户如何应对网络钓鱼攻击。这种情况通常比较敏感,也比较极端。不过,公司可以创建不同技术水平的用户,了解他们如何应对此类情况。
在收集真实用户数据时,用户体验团队可能会担心隐私问题。然而,一旦消除了对真实用户数据的需求,合成用户数据可以帮助遵守隐私法规,同时仍然能够获得宝贵的用户洞察。
站在医疗保健公司的角度来理解这一点,他们希望优化患者门户网站,但又不想处理敏感的医疗记录。通过使用合成用户,他们可以测试门户网站中的不同功能,同时避免隐私问题。
简而言之,合成用户可以帮助绕过与真实用户数据收集相关的监管问题。
尽管我想分享合成用户所提供的积极因素并让它们听起来像是唯一的答案,但我也想提出有关其局限性的关键问题。
合成用户可能有其优点,但他们也常常伴随着某些缺点,这会影响用户体验研究的质量和可靠性。
假设一家公司想要通过模拟治疗对话与合成用户测试他们的心理健康应用程序,那么他们这样做真的能获得可靠的见解吗?
在某种程度上,人工智能生成的个人资料只能提供概括性的意见。但它们往往缺乏更深层次的含义,无法真正帮助设计师对真实用户产生影响。
合成对话无法捕捉人类所拥有的情感深度和不可预测性。由于无法展现人类的全部情感,合成用户的发现往往具有误导性。
AI 生成的角色可能缺乏洞察力的一个关键领域并非态度研究,而是行为研究。AI 根本无法体验真实的情绪,例如喜悦、沮丧、疲惫等等。然而,我们知道,通过观察真实用户的行为,我们可以找出这些线索,并针对他们的痛点制定解决方案。
更有趣的是,合成用户甚至难以复制研究人员在人类行为中自然观察到的某些非理性决策或自发行为。因此,合成用户只能提供表面层面的洞察。
还记得我之前在文章中说过,人工智能模型依赖于现有数据集(也就是互联网)吗?这意味着它们会引入某些偏见,强化刻板印象,而不是挑战它们。
例如,人工智能模型从其训练数据中继承了性别偏见和普遍刻板印象等偏见,这可能会导致错误的假设和发现。
这基本上意味着,一个主要根据西方互联网习惯训练的人工智能模型,肯定难以模拟不同新兴市场的精准用户体验行为。因此,真实用户在处理文化和其他具有深层含义的问题时,往往更有洞察力。
假设一家专注于智能家居自动化的公司想要了解灯光调节和用户偏好。如果他们使用模拟用户而非真实用户,就很容易忽略与家居舒适度相关的文化和心理差异。
这从应用的角度描述了这个问题。众所周知,人工智能生成的反馈无法刻画情感和不可预测性因素,这也意味着它缺乏现实世界的经验。
AI 模型缺乏对现实世界的直觉,这常常导致用户体验洞察不完整。如果实体过度依赖 AI 生成的反馈,这可能会很危险。
另外,你可能已经注意到了这一点,但合成用户或人工智能通常只想“取悦”研究人员——这种现象被称为谄媚——这并不能很好地代表人类的行为。好好想想吧!
使用合成人物角色并将结果标记为用户测试,或将基于这些数据集的用户体验发现作为研究呈现,可能会引发伦理担忧。这些做法可能会误导利益相关者,使其对洞察的真实性和可靠性产生误解。最重要的是,应该披露这些洞察的使用情况,尤其是在做出广泛的用户体验决策时,以确保透明度并避免误导性陈述。
Delve AI 就是一个很好的例子。他们公开讨论了合成人物角色在其研究中的创建和应用,阐明了他们的方法论以及 AI 生成的数据在其过程中的作用。[5]
这表明,通过采用这种透明的做法,组织可以在坚持道德标准的同时,解决将合成数据集成到用户体验研究中的复杂性。
所以事情是这样的:我不会争论合成用户是否比使用真实用户更好或更差,而是扮演魔鬼代言人并为两者辩护。
根据我的研究和测试,我发现有趣的是,两者都在用户体验设计中占有一席之地,以下是一些您会感兴趣的用例和场景:
场景:
从上表可以看出,没有明显的赢家。事实上,两者各有利弊,这使得讨论变得有趣。
在用户体验设计和研究中,有一个地方可以让合成用户和真实用户共同努力,实现更优化的解决方案。
我建议使用合成用户主要是为了早期构思和假设检验,因为这既经济又不费时。
为了验证,在任何重大产品发布之前,都要使用真实用户进行验证。最后,为了获得真实世界的洞察,真实用户是关键,但这并不妨碍您使用改进的 AI 生成模型来提供更好的真实世界洞察。事实上,关键在于始终掌握最新的 AI 模型。
在结束本文之前,我将介绍一些将合成用户融入用户体验工作流程的实践。我将提供一些可操作的步骤,供您日后用作未来项目的核对清单。
需要明确的是——在研究和测试中,合成用户绝不会取代真实用户。相反,这些角色应该增强你的真实用户研究。务必将人工智能生成的洞察与真实世界的测试相结合,才能取得显著的效果。
绝不能将 AI 生成的洞察仅应用于整个 UX 流程。但你不应忽视,它对 UX 工作流程中的特定任务也有其优势。例如,使用合成人物角色进行早期原型的 A/B 测试,可以帮助提供宝贵的洞察,并帮助做出高效的决策。
我之前提到过这一点,但请记住,您做出的任何“重大”用户体验决策都应在实施前通过人工测试进行验证。
永远不要完全相信人工智能生成的洞察,因为这可能会在未来给你带来麻烦。务必使用真实的用户反馈进行交叉验证。
请记住,人工智能可能存在某些偏见,这可能会影响我们研究和测试的质量。因此,请持续关注基于实际用户行为数据的改进型人工智能模型,这有助于提高准确性。
不要依赖 ChatGPT 等通用工具,而是探索专门用于生成用于 UX 研究和测试的合成角色的工具,例如Synthetic Users、UXtweak、Tonic.ai和MOSTLY AI。
这通常很容易被忽略,但务必保持透明,说明在研究中何时以及如何使用合成用户。我建议在必要时披露此类信息。这有助于你在实施重大用户体验决策之前,坚守道德立场并解决问题。
兰亭妙微(蓝蓝设计)www.lanlanwork.com 是一家专注而深入的界面设计公司,为期望卓越的国内外企业提供卓越的大数据可视化界面设计、B端界面设计、桌面端界面设计、APP界面设计、图标定制、用户体验设计、交互设计、UI咨询、高端网站设计、平面设计,以及相关的软件开发服务,咨询电话:01063334945。
