Why Your AI Chatbot Gives the Wrong Answers to Your Customers

博客

1 December 2024

Lianne Dehaye TDCX AI Senior Director

聊天机器人是现代客户体验（CX）战略的前线力量。在新加坡，一家银行和金融服务公司每月大约要处理10万次独特的聊天会话。据预测，到2028年，全球对聊天机器人的投资将激增470%，其中亚太地区将贡献66%的增长。目前，近40%的首席营销高管已经在他们的公司中使用人工智能驱动的聊天机器人与客户互动，另有20%计划在未来六个月内这样做。

从理论上讲，聊天机器人似乎是客户体验的万全之策——高效、可扩展、不知疲倦。但现实却大相径庭：虽然68%的客户使用过聊天机器人，但只有35%的客户表示聊天机器人解决了他们的问题，88%的客户仍然更喜欢与人类客服交谈。过去聊天机器人出现“幻觉”导致企业犯下代价高昂的错误的事件也屡见不鲜。

我们在去年10月的上一次TDCX Talks活动中分享的神秘顾客体验似乎印证了这一点。尽管电子邮件支持是一种异步渠道，但在问题解决率方面仍优于聊天机器人，后者的服务质量评分较低。那么，为何会出现这种脱节现象呢？

在采用人工智能（AI）和生成式人工智能（GenAI）优化客户体验（CX），尤其是聊天机器人时，企业必须遵循一个基本原则：垃圾输入，垃圾输出（GIGO）。对于美国、法国、德国、英国和爱尔兰近40%的企业而言，即使已经具备AI应用经验，数据质量仍然是一个持续存在的问题。其代价是，由于基于低质量、不准确和过时的数据构建的AI模型表现不佳，这些企业平均损失了全球年收入的6%。

数据如何推动或阻碍聊天机器人

以下是高质量数据与使聊天机器人偏离轨道的“垃圾”数据之间的区别所在：

准确性：数据是否正确？准确性确保产品推荐、客户支持回复或情感分析符合实际情况。例如，如果客户的资料被错误地标记为首次购买者，而实际上他们是回头客，那么互动就会显得不近人情或不切实际。

完整性：是否包含了所有必要的数据点？例如，如果聊天机器人或对话式人工智能工具处理的是不完整的客户历史记录，那么它可能会提供误导性的建议或片面的答案。

一致性：不同来源的数据是否一致？在整合来自客户关系管理（CRM）系统、社交媒体和电子商务平台等平台的数据时，不一致性可能会产生混合信号并生成不可靠的见解。

时效性：数据是否最新？客户的偏好会随着时间的推移而演变。依赖过时数据的AI模型可能会生成不再反映当前需求的见解。

相关性：数据是否相关，能否产生有意义的输出？在最近的一项IT领导者调查中，54%的受访者表示，他们面临的主要痛点在于收集正确的数据属性以产生有价值的结果。

人工智能（AI）和生成式人工智能（GenAI）模型无法自行检测或纠正错误数据，它们的有效运行完全依赖于输入数据的质量。因此，在数据整理和验证方面的专业知识，以及数据准备和转换的整体方法变得必不可少。即使超过50%的组织已经在生产或试点阶段为客户服务部署了AI项目，但只有5%的非科技公司拥有集中化、可直接使用的数据，这并不奇怪。此外，36%的公司报告称，他们的非结构化数据在收集、处理和验证方面仍需付出大量努力。

在AI驱动的聊天机器人中，“干净”数据的含义

“干净”的数据不仅意味着要消除错误，还意味着要对信息进行结构化处理，以便AI能够有效地解释和使用。当聊天机器人的基础是混乱无序的知识库以及过时、无关或组织不善的信息时，误导性的回答和客户的沮丧情绪便不可避免。决策者已经开始注意到这些问题。虽然67%的C级高管正在加大对GenAI的投资力度，但55%的高管由于担心使用错误类型的数据而暂停了某些应用场景。

干净数据对聊天机器人有何重要性？

当数据源包含重叠、矛盾或模糊的记录时，聊天机器人很难选择正确的回答。由于无法清晰理解上下文或确定哪个回答应优先使用，聊天机器人可能会编造答案或随机选择回答。

以基于包含多条记录的知识库进行训练的聊天机器人为例。这些记录可能是对同一问题提供相似但略有不同答案的回答。尽管这些记录旨在传达相同的信息，但其中的不一致性可能会让AI聊天机器人感到困惑。它可能会将相互矛盾的答案中的元素结合起来，最终导致产生幻觉（即提供错误或无关的信息）。

为了使聊天机器人有效运行，其训练数据必须规范化和情境化。这包括消除重复答案、解决歧义，并确保信息反映统一且唯一的事实来源。这些措施有助于避免重叠、冗余以及人工智能（AI）“猜测”的需要。

在TDCX AI，我们通过检索增强生成（RAG）等技术来解决这些挑战。例如，当客户向聊天机器人查询时，RAG使系统能够搜索连接的数据库或知识库，以查找最相关、最新的信息。AI不再仅仅依赖其训练数据，而是检索这些数据并使用它们来生成信息丰富且准确的回答。

为了实现这一点，知识库的数据集必须被拆分成易于管理且连贯的部分，并转换为机器可读格式。这确保AI聊天机器人仅检索最相关的“信息块”，从而减少混淆并防止其猜测或组合不相关数据。

然而，RAG在处理表格数据（如电子表格、数据库）时存在局限性。表格本质上具有高度结构化特征且缺乏叙述性上下文，这给电子商务、零售、银行、医疗保健和旅游等行业中的聊天机器人带来了独特的挑战，因为这些行业高度依赖表格数据。这就是数据转换发挥作用的地方——将表格转换为AI系统可以接收和解释的格式。如果不进行这种转换，AI模型可能会误解表格数据、遗漏关键关系或提供不准确的回答。

消除聊天机器人回答中的混乱猜测

在与企业合作开展人工智能（AI）或生成式人工智能（GenAI）项目时，TDCX AI的专家确保将原始、分散或表格数据转换为组织良好的格式。在一些项目中，我们的专家甚至提供清晰定义的消息、类别以及处理可能遇到的各种场景的可操作、分步指导。这使聊天机器人及其背后的人类代理能够提供精确、可靠的回答。

因此，如果您的聊天机器人给客户提供错误答案，很可能是因为它建立在数据不扎实的基础上。即使数据完整、一致且及时，如果缺乏干净、结构化且语义一致的信息，仍然可能存在错误和不准确的情况。

TDCX的定制数据标注和转换服务确保您的聊天机器人提供精确、可靠的回答。无论是拆分大型数据集、嵌入上下文元数据、映射关系、解决歧义还是使数据具备AI可用性，我们的方法都能确保您的聊天机器人知道该说什么，而不是凭空捏造。

与我们的专家交流

博客

为何您的AI聊天机器人会向客户提供错误答案

1 December 2024

更多文章