Chatbot Mystery Shopping: After All the Rage in AI and GenAI, Has Anything Changed in CX?

博客

2 March 2025

作者：Lianne Dehaye (TDCX 人工智能高级总监)
及Ashley Yue (人工智能客户解决方案助理经理)

更智能的自动化。无缝的自助服务。大规模的个性化互动。人工智能（AI）和生成式人工智能（GenAI）可不只是对客户体验（CX）的升级，它们本应重新定义客户体验。

这些承诺极具吸引力。它们更快、更直观、更具人性，且拥有无限的可扩展性。企业纷纷为之买单。到 2028 年，仅银行业就将向人工智能驱动的客户支持和自助服务功能投入 184 亿美元。与此同时，92% 的电信行业领导者以及 65% 的旅游和酒店业高管都寄望于生成式人工智能来驱动他们的聊天机器人和虚拟助手。

这并非个别企业的行为。预计明年，超过 80% 的企业将部署支持生成式人工智能的应用程序，而 2023 年这一比例仅为 5%；全球 90% 的公司预计将把生成式人工智能作为员工的工作伙伴。事实上，由人工智能驱动的聊天机器人处理的零售交易数量已比去年多出 42%。在美国，63% 的旅行者会借助人工智能聊天机器人来规划行程。

这些数据让人觉得变革似乎不可避免。然而，事实并非如此。在以人工智能为先的愿景与客户互动的现实之间，出现了另一番景象。

幻灭期低谷：客户体验领域的 AI 是否面临过度承诺与准备不足的双重困境？

一年前，分析师曾预测，今年 85% 的客户服务交互将由人工智能驱动。然而事实上，同样是这些专家，近期却发现，在最近一次寻求客户支持的经历中，仅有 8% 的客户真正使用过聊天机器人。只有 14% 的客户问题通过自助服务得以解决，64% 的客户更希望企业完全停止使用人工智能。

我们所目睹的，是典型的技术炒作周期。企业对人工智能驱动的客户体验这一愿景深信不疑，这一创新理念承诺带来全新的体验。然而，在初次应用时，这项技术虽展现出潜力，但也暴露出成长中的种种问题。用户发现，聊天机器人会产生幻觉（编造虚假信息），虚拟助手一旦超出预设流程就会失灵，而且人工智能系统仍然无法理解上下文、情感或细微差别。

甚至有一款由生成式人工智能驱动的虚拟助手，其推出成本在 500 万至 650 万美元之间。对于这样一个常常仍需将客户转接给人工客服来解决问题的解决方案而言，这是个高昂的代价。因此，分析师和专家们下调了他们的预测，也就不足为奇了。预计到 2025 年底，当前 30% 的生成式人工智能项目将被放弃。

即便面临这些障碍，企业高管们并未放弃对人工智能的探索。在全球排名前 2000 的公司中，近 60% 仍将人工智能和生成式人工智能列为客户体验方面的首要技术重点。

尽管乐观情绪和热情依旧高涨，但预期正在发生变化：66% 的高管表示，他们对项目进展持矛盾态度。甚至有一半的高管承认，他们没有明确的投资重点。在人工智能基础设施上的投入已翻倍，但许多企业仍在等待切实的突破。

问题不在于人工智能能否实现预期成效，而在于何时以及如何实现。那些匆忙采用人工智能的企业如今意识到，它并非万灵药。人工智能的实施需要更明智的规划，合理的人机协同，以及对现实情况的考量。例如，在接受调查的公司中，他们目前的人工智能和生成式人工智能试验，只有不到 30% 会全面推广。与此同时，那些将人力因素纳入考量的公司，已开始看到切实且可持续的收益。

如今，智能代理人工智能甚至 DeepSeek 正成为关注焦点。随着人工智能超越预设脚本的自动化进一步发展，新的问题又随之而来。客户将如何与人工智能驱动的自助服务进行互动？它会提升服务质量并减少客户精力投入，还是会带来新的痛点？

这些就是我们通过神秘购物调研试图探究的问题。我们对多个行业的不同品牌中由人工智能驱动的聊天机器人进行了测试。我们的发现更清晰地描绘出当下人工智能在客户体验方面的实际应用情况。人工智能聊天机器人确实比以前有所改进，但对大多数情况而言，“有所改进” 并不意味着足够好。一些行业取得了显著进展，但许多聊天机器人在客户交互的最基本方面仍存在不足。它们未来能否成功，取决于能否很好地利用这项技术，弥合客户需求与实际商业价值之间的差距。

对话能力：人工智能聊天机器人说得多，但它们真的在倾听吗？

聊天机器人能回复，但它真的能进行一场对话吗？我们评估的三个关键领域之一就是对话能力 —— 不仅要看聊天机器人能否生成回应，还要看它是否能倾听、理解并做出调整：

聊天机器人是否以个性化的问候迎接用户，并主动提供帮助？
它能否处理自然语言查询，还是只能识别特定的关键词？
它是否理解拼写变体、同义词和首字母缩略词？
开启一段对话是否轻松，还是用户在互动时困难重重？

在所有行业中，聊天机器人的得分是 73%。这是进步的标志，让我们在缩小期望与实际表现之间的差距上更进一步。虽然客户并不期望聊天机器人能给出精妙如诗的回应，但他们需要人工智能理解常见请求的基本变体。

它们在哪些方面有所改进？

对自然语言查询的处理更佳：从基于规则的聊天机器人转向更具动态性、能进行对话的人工智能，让互动感觉更加顺畅。
对话更易开启：现在大多数聊天机器人能接受简单的 “嗨” 这样的消息，或者提供预设提示来帮助客户与它们互动。

它们仍在哪些方面存在困难？

理解语言细微差别：许多聊天机器人仍需客户多次重新措辞查询，才能得到相关回应。
在较长对话中保持上下文连贯：聊天机器人经常重置对话，导致交流内容重复。

图 1. 一些聊天机器人让交流少了些机械感，但在理解同义词、拼写变体和首字母缩略词方面存在困难。

教育行业的聊天机器人在对话能力方面排名最高。虽然它们可能并非特别先进，但其优势在于可预测性。诸如学生咨询、课程相关问题以及常见问题解答式的支持等应用场景，都遵循结构化、明确界定的格式。这是一个相对较窄且意外情况较少的领域，使得它们相对更容易进行训练。

银行、政府和科技领域的聊天机器人表现时好时坏 —— 有时表现出色，有时却不尽人意。它们可能在金融术语或合规性要求高的回复方面存在困难，而官僚流程的特性可能导致聊天机器人难以处理更为复杂的信息。解决技术问题通常还要求这些聊天机器人在多次交互中记住上下文信息。

电信、旅游、电子商务和零售行业的聊天机器人得分较低。这些公司可能仍在使用尚未发展到能够处理动态对话的模型。发起关于账单争议、套餐变更和网络故障排查等问题的对话，往往需要付出很大努力，而它们的人工智能聊天机器人可能还没有做好应对准备。

聊天机器人的效能：它们能否解决问题，还是仅能开启对话？

如今，聊天机器人开口交流变得更为容易，但它们能解决问题吗？为衡量这一点，我们依据五项标准评估聊天机器人的效能：

通过聊天机器人查找产品或服务细节是否容易？

聊天机器人的回答是否直接回应了客户的疑问？
聊天机器人能否执行预期的任务？
回复内容是否包含拼写或语法错误？
问题是否得到全面解决，让客户满意？

从各行业整体来看，效能得分仅为 60%，这无疑是一个有待成长与完善的明显空间。人工智能驱动的交互或许听起来更好，但不一定能更好地解决问题。似乎那些将人工智能的优势与明确界定、结构化的问题相匹配的行业，取得的成效最为显著。而在客户问题涉及多个步骤、带有强烈情绪，或需要高度精准度的行业中，聊天机器人可能仍面临挑战。

它们在哪些方面表现出色？

信息获取更便捷：浏览产品细节和品牌常见问题解答变得更加轻松，点击次数减少，所需精力也更少。

语法和拼写准确性提升：聊天机器人的回复中语言错误减少，这表明文本生成的精准度更高。

它们在哪些方面存在不足？

任务执行：许多聊天机器人在执行交易或特定请求时困难重重。
解决率：由于解决方案不完整或不准确，交互过程中仍需转接人工客服。

图 2. 对于聊天机器人中由人工智能驱动的自动化而言，更具可预测性的交互似乎更为理想，因为这种交互几乎不存在模糊不清的情况。

电子商务和零售领域的聊天机器人在效能方面表现最为突出。这可能是因为诸如订单跟踪、退款以及产品推荐等客户交互往往遵循可预测的流程。顾客不太可能期望进行深入的、关乎存在意义的对话，而是会优先考虑速度、准确性和完成度。教育、银行、金融、政府以及科技领域的聊天机器人表现也较为不错，这可能得益于它们能够快速检索预定义的回复。

聊天机器人在处理复杂性和情感细微差别方面存在困难。在教育领域，人工智能聊天机器人可能在处理复杂的行政或学术问题时表现不佳。在银行和政府服务领域，聊天机器人似乎在处理合规要求高或对安全敏感的请求时遇到难题，而在这些领域，从法律层面也要求做到精准。在旅游和酒店行业也出现了类似的好坏参半的情况，因为诸如行程变更、取消以及退款纠纷等一些请求需要更多的个性化处理。

在效能排名中垫底的是电信行业的聊天机器人。账单争议、合同修改以及故障排查等问题需要更深入的理解，而无法记住上下文信息并处理多步骤解决方案，很可能是导致其表现不佳的原因。

客户交互的特性决定了人工智能聊天机器人在哪些方面能发挥最大作用。一旦涉及复杂性、模糊性或更深入的推理，问题就开始显现。尽管人工智能在自动化方面取得了进展，但多步骤问题解决、情境感知以及带有情感的交互仍然是重大障碍。

用户体验：客户与人工智能聊天机器人互动时能否做到毫无障碍？

聊天机器人能进行对话，甚至解决问题，但要是使用体验令人沮丧、困惑或低效，客户就不会长时间停留，去了解它究竟有何能耐。用户体验（UX）往往是决定用户接纳或避开它的关键因素。一个难以使用的聊天机器人 —— 更糟的是，一个制造的问题比解决的问题还多的聊天机器人 —— 不只是个糟糕的工具，更是企业的负担。我们基于五个关键因素评估聊天机器人的用户体验：

聊天机器人提供的引导是否清晰简洁，还是导航过程令人懊恼？
是否存在故障、会话超时或其他干扰，破坏了使用体验？
聊天机器人是否容易找到、访问并与之互动？
当聊天机器人无法解决问题时，是否能无缝转接给人工客服？
聊天机器人在不同平台和系统上能否流畅运行？

聊天机器人的用户体验总体得分 66%—— 比效能得分要好，但离毫无障碍还差得远。

它们有哪些进步迹象？

便捷的可访问性：许多聊天机器人很容易被发现，常常以屏幕弹窗或常驻聊天窗口的形式出现。
会话记忆：有些聊天机器人能记住多个浏览器窗口中的聊天记录，避免客户不得不重新开启对话。

它们还有哪些改进空间？

缺乏转接机制：当聊天机器人无法解决问题时，常常无法转接至人工客服。
整合不佳：许多聊天机器人无法与电子邮件、会议日程安排程序或客户关系管理（CRM）系统连接，导致客户不得不手动重新输入信息。

图 3. 电信行业的人工智能聊天机器人表明，糟糕的对话能力和薄弱的问题解决能力，会直接影响客户对体验的感受。

电子商务和零售领域的聊天机器人获得了最高的用户体验评分，这很可能是因为它们专为提高效率而设计。客户希望交易快速、顺畅。许多聊天机器人采用快速选择按钮而非文本输入方式，减少了开放式输入，将错误降至最低。

在银行、金融、教育、政府和科技领域，用户体验则更不稳定。导航步骤繁多且冗余，降低了聊天机器人的易用性，使交互变成一件乏味的苦差事。

在旅游、酒店和电信行业，出现了最令人沮丧的用户体验问题。这些行业依赖后端整合，这些整合有时会实时提取客户数据、交易历史和服务记录。当聊天机器人难以从多个孤立的数据库中检索信息时，客户就会面临延迟、回复不完整，甚至会话突然中断的情况。

数据孤岛、跨平台不一致以及技术债务，让聊天机器人变得笨拙，甚至完全无法使用。如果没有无缝的基础设施，即便最先进的人工智能，也无法弥补充满障碍的客户体验旅程，毕竟与最 “智能” 的聊天机器人互动时，客户感受并非如此。

客户体验中人工智能的未来：智能代理人工智能即将登场，接下来会怎样？

企业正在追逐人工智能领域的最新热门 —— 智能代理人工智能。它被设计为能够自行思考、规划并执行任务。这种人工智能不仅能回答问题，还能预测问题、解决问题，并自主协调客户体验。

科技巨头宣称其产品中已具备这一技术。专家甚至预测，到 2028 年，人工智能代理将处理专为人类设计的数字商店中 20% 的交互，并嵌入 33% 的企业应用程序。三分之一的企业高管已将其列为即将开展的数据与人工智能计划中的首要技术趋势。

这一愿景极具吸引力。但如果这个雄心勃勃的宣传听起来似曾相识，那是因为上一波人工智能创新也是如此被大肆炒作的。

智能代理人工智能并非简单的升级。它要求企业从根本上重新思考其实施方式。从预定义脚本转向能够独立决策的人工智能代理，意味着企业需要在基础设施、数据集成和人工智能工程方面进行投资并具备专业知识。这就是为什么预计四分之三的企业尝试会失败。即使在一项正在进行的针对大语言模型（LLM）代理的基准测试研究中，表现最佳的代理在实际任务中的成功率也仅为 45%。

大多数人工智能代理仍在开发中。尽管营销宣传可能暗示它们无所不能，但实际上，它们还无法在无人干预的情况下为你预订假期、解决账单纠纷或处理产品退货 —— 至少目前还不行。即便它们能够做到，在无人监督的情况下运行的人工智能系统也会引发关于偏见、问责制和法规遵从性等关键问题。

那么，如果不是现在，何时才会实现呢？

我们的神秘顾客调查表明，由人工智能驱动的客户体验不仅仅是让聊天机器人更先进。投资人工智能解决方案的企业不应只关注如何让聊天机器人显得酷炫和复杂。他们应该追求一种人工智能解决方案，既能帮助客户，又不会让客户体验变得更糟糕。客户不只是希望人工智能听起来更智能，他们希望它实际能更智能地发挥作用。典型例子就是客户厄运循环 —— 这种恶性循环会让客户陷入自动化的、千篇一律的回复中。

智能代理人工智能，或任何先进的大语言模型或人工智能解决方案，其效果取决于它所处理的数据。做出自主、明智决策的能力，取决于企业在跨系统中对数据进行结构化、标记和整合的程度。为数据的可移植性进行设计，可确保即使升级到更新的大语言模型，数据仍能在应用程序、系统和支持渠道之间无缝流动。然而，这需要数据标记和转换方面的专业知识。确实，要让工作和生活更轻松，就得付出努力。

那么，人工智能是否从根本上改变了客户体验呢？

答案既是肯定的，也是否定的。人工智能和生成式人工智能正在为企业提供客户体验的方式设定新标准。但如果不能有效利用，它们就无法兑现其承诺，消除那些最初导致客户寻求支持的核心困扰。

人工智能和生成式人工智能尚未取代人类。相反，我们将看到它们不断发展，在引导客户旅程方面成为更好的伙伴。取得切实成功的企业，并非只是为了提高效率而追逐这些技术。它们是在利用这些技术，让客户体验更轻松、更直观，减少困扰。新的创新会不断涌现又消逝，但如果企业没有坚实的基础来推进其客户体验战略，它们将不断在同样的障碍前徘徊。

与我们的专家交流

博客

在 AI 与生成式 AI 热潮过后，聊天机器人神秘购物揭示客户体验是否生变？

2 March 2025

更多文章