TDCX

博客

12 September 2024

想象一下，您的企业推出了一款由AI驱动的聊天机器人，用于即时提供关于最新智能手机的更新信息。目标在于：减少等待时间、制造话题热度以及提升客户满意度。然而，当客户试图追踪订单状态时，聊天机器人却建议他们排查一款从未购买过的智能手表的问题。结果如何？客户不仅未能获得他们亟需的关键信息，反而因无关紧要的建议而感到沮丧。

在现实中，这种场景屡见不鲜：据调查，40%的客户与聊天机器人的互动体验不佳。这一后果相当严重——30%的客户会彻底放弃购买。

这种失败不仅仅源于用于训练聊天机器人的数据质量，还涉及数量和真实性。许多企业在急于实施AI客户体验工具时，忽略了两个关键因素：拥有足够且正确的数据来妥善训练机器人，以及对输出结果进行监督。

在本系列文章的第一部分中，我们探讨了训练AI模型的复杂性，以及不准确、过时和存在偏见的数据如何削弱AI在客户体验方面的有效性。这些挑战因其他障碍而更加严峻——即数据稀缺和数据幻觉。以同样的AI聊天机器人为例。如果它主要基于与产品故障排除相关的数据进行训练，但缺乏关于订单追踪和其他客户服务查询的足够数据，它可能在一个领域表现出色，而在另一个领域则完全失败。

在本系列的第二部分中，我们将解释数据稀缺和由低质量数据引起的数据幻觉如何阻碍企业采用AI来改善客户体验。

数据稀缺导致AI模型表现不佳

虽然AI的强大之处在于能够处理和学习海量数据，但当必要的数据供不应求时，这一优势很快就会变成劣势。数据稀缺是一个重大挑战，特别是在细分市场或新兴客户体验（CX）趋势中，相关数据的数量可能有限或难以获取。例如，据报道，专注于金融和医疗等行业的人工智能初创公司（GenAI）在获取模型训练所需数据方面正面临困境。美国财政部也报告称，一些金融机构缺乏用于训练和检测以及缓解欺诈行为的人工智能模型的数据。

在细分市场，客户互动可能不那么频繁或高度专业化，缺乏足够的数据会严重阻碍有效的AI驱动客户体验（CX）解决方案的开发。例如，一家销售新型专业高科技产品的公司可能难以收集到足够的数据来训练聊天机器人或推荐引擎，以准确反映目标受众的需求和行为。如果没有大型且多样化的数据集，AI模型可能泛化能力较差，从而导致性能不佳和输出不可靠。

在处理新兴CX趋势时，这一挑战更为明显。设想一家公司试图在新兴的数字平台上使用生成式AI来改进CX，但该平台最近才流行起来。可用的有限数据可能无法捕捉用户行为的全部范围，也无法反映新兴趋势所特有的快速变化。AI模型可能难以预测客户需求或有效回应查询。

解决数据稀缺问题通常需要创造性的解决方案。公司可以通过合成数据（如由生成对抗网络（GAN）创建的数据）来补充其数据集，这些数据模仿了真实世界数据的特征。有些公司使用开源数据，如政府和云服务提供商提供的数据。此外，还可以使用数据增强等技术来人为地增加训练数据的多样性。然而，这些方法也有其自身的挑战和局限性，并非万无一失。

在开发AI解决方案时，例如TDCX，会通过数据重采样等技术来解决这些问题，即对代表性不足的类别进行过采样，或对代表性过强的类别进行欠采样。我们采用的另一种方法是应用专门设计的算法，以确保模型不会过度偏向于任何特定类型的数据。然而，我们明白这些解决方案并非没有复杂性。我们与合作伙伴合作，谨慎地实施这些解决方案，以避免引入新的偏见或不准确性。

数据质量不佳导致的“幻觉”现象

当AI模型生成的输出与实际输入数据或应响应的上下文脱节时，就会出现“幻觉”现象。在客户体验（CX）领域，这可能意味着聊天机器人会自信地用捏造或误导性的信息误导客户，或者AI情感分析工具会将讽刺误判为正面情绪。

在一个真实案例中，一家北美航空公司的AI聊天机器人对其票价和退款政策产生了“幻觉”，导致公司不得不因错误的承诺而面临法律诉讼。在另一起事件中，一家航空公司的聊天机器人误将客户对乘务员照顾其“植物剪枝”的称赞，错误地引导客户联系危机热线。

这些“幻觉”现象背后有多种原因。AI模型基于其训练数据进行输出，这些数据可能既包含准确信息也包含不准确信息，甚至可能充斥着社会和文化偏见。这些模型完全遵循算法规则，模仿训练数据中的模式，而不区分真伪。数据中的任何偏见或错误都可能在AI系统的输出中复制，因此，虽然它们听起来可能合理、令人信服且连贯，但可能在事实上是不正确且肤浅的。即使仅使用准确数据进行训练，专家也警告说，它们仍然可能以意外或无法解释的方式组合模式，从而导致可能误导或不准确的内容。

调整模型架构和后处理技术可以有所帮助，但当前的AI技术无法保证“幻觉”现象永远不会发生。这就是人工介入发挥作用的地方。

在TDCX，确保AI模型提供精确且符合品牌形象的客户互动，远在编写第一行代码之前就已经开始。该过程包括一个细致的预训练阶段，在此期间，数据集不仅要进行组装，还要进行精心策划。这涉及选择、组织和精炼数据，以确保其质量、相关性和准确性。任何错误都会被识别并纠正，缺失的数据会得到妥善处理，数据集会经过充分准备，以最大限度地提高后续机器学习模型的有效性。

TDCX的AI驱动CX解决方案还通过检索增强生成（RAG）和推理技术来建立基本事实，这对于减轻“幻觉”现象并确保准确、可靠且符合品牌形象的响应至关重要。TDCX的AI项目还采用了基于人类反馈的强化学习（RLHF）方法，该方法根据人类评估者的持续输入迭代地优化AI模型。RLHF在解决“幻觉”现象方面发挥着关键作用，它引导AI模型的输出符合人类偏好和准确信息，并通过迭代优化来提供更可靠的结果。人类监督与精确数据相结合，有助于确保TDCX的AI解决方案不仅能够遏制错误信息的传播，还能增强客户互动中的信任和安全性。

人类是我们AI项目的纽带。这种人类参与循环的方法使TDCX能够将AI转变为品牌客户体验的强大延伸。

随着72%的企业已经采用AI，它确实正在重新定义企业与客户的互动方式。然而，最近对全球企业的研究表明，仅对AI在客户体验方面的热情是不够的。基于劣质数据构建的AI模型正在消耗其6%的年收入（平均而言为4.06亿美元）。随着企业继续使用对话式AI和生成式AI来改善客户体验，劣质数据的成本不容忽视。

“TDCX Talks：在AI时代创造强大的客户体验”活动将于10月10日在新加坡滨海湾金沙举行，将探讨数据如何既能解锁AI在客户体验方面的承诺，又能暴露其陷阱。行业领袖和TDCX专家将分享实用见解和成功案例，帮助企业将AI和生成式AI转变为提供卓越客户体验的有价值工具。

与我们的专家交流

博客

AI赋能客户体验失败的缘由（第二部分）：数据不足与无监督幻想的困境

12 September 2024

更多文章