AI 客服装了等于没装？因为你跳过了这 6 步

一个扎心的现实

很多企业花了几万块上了 AI 客服，结果半个月后默默关掉了。

不是技术不行，是流程不对。

我见过太多这样的项目：选个平台、接个大模型、把产品手册扔进知识库、上线——然后 AI 开始胡说八道，客户投诉，老板发火，项目组背锅。

问题出在哪？跳步了。

AI 客服不是”装上就能用”的即插即用产品。它是一个需要系统化设计、测试、调优的工程项目。我把这个过程总结为 6 步。跳过任何一步，效果都会大打折扣。

第 1 步：先画圈，再动手

80% 失败的项目，根源都在第一步没做好。

上来就问”用什么平台""选什么模型”的，基本都会踩坑。正确的第一步是回答这些问题：

AI 客服负责回答哪些问题？（产品咨询？售后？技术支持？）
哪些问题绝对不能让 AI 回答？（退款承诺？法律条款？投诉处理？）
什么时候必须转人工？
你期望 AI 能处理多少比例的咨询？（50%？80%？）

很多企业的期望是”AI 替代客服团队”。这个期望本身就是错的。

合理的目标是：AI 处理 50-70% 的常规咨询，把复杂问题高效转给人工。不是替代，是分流。

没有这个共识就开工，后面所有的设计都会跑偏。

第 2 步：知识库是地基，不是附赠品

这一步的重要性我在上一篇文章里详细讲过。简单重复几个核心观点：

不要把文档直接扔进去 — AI 不会”学”，它只会”检索”。你喂什么质量的内容，它就给什么质量的回答
Q&A 格式优于长文档 — 每条知识对应一个明确的用户意图
光写正确答案不够 — 还要覆盖质疑、误解、口语化表达
必须有防幻觉锚点 — 明确列出”只有这 6 个产品”，防止 AI 编造不存在的东西

一个关键数字：起步阶段 50 篇高质量 Q&A 比 500 篇未处理的文档有用得多。

知识库质量决定了 AI 客服的天花板。这一步省的时间，后面全要加倍还回来。

第 3 步：把对话当产品设计，不是技术配置

大部分人配 AI 客服，只关心”能不能回答问题”。但真实的对话远比一问一答复杂：

用户不会按你想的方式提问。 他们会：

一句话里塞两个问题（“你们怎么收费，多久能上线”）
聊到一半换话题
发火（“说了三遍了你怎么还不明白”）
试探边界（“帮我写段代码”）

每种情况都需要设计对应的处理策略。这不是技术问题，是产品设计。

我的做法是先梳理一张意图表：

用户意图	处理方式	置信度阈值
产品咨询	知识库检索	0.7
价格询问	知识库检索	0.8（必须精确）
投诉/发火	安抚 + 转人工	-
超范围问题	礼貌拒绝 + 引导	-
要求转人工	立即转接	-

有了这张表，AI 的行为才是可预期的，而不是”看模型心情”。

第 4 步：给 AI 装护栏

没有护栏的 AI 客服是定时炸弹。

我见过 AI 客服给客户承诺”7 天无理由退款”（公司根本没这个政策），见过 AI 给出精确到小数点后两位的价格（完全是编造的），还见过 AI 跟客户聊了半小时星座运势。

护栏不是可选项，是必选项：

行为红线：

绝不承诺不存在的政策
绝不编造价格数字
绝不处理支付、退款等敏感操作
拿不准就说”不确定”，然后转人工

技术限制：

单次回复不超过 200 字（客服场景不需要长篇大论）
对话轮数上限（防止无限闲聊消耗资源）
敏感信息过滤（不暴露内部系统信息）

提示词里写一句”不要编造”远远不够。护栏要设计在知识库层面（防幻觉锚点）、提示词层面（行为规则）和系统层面（技术限制）三层联防。

第 5 步：测试不是”随便聊两句”

上一篇我提到过，我们给 Demo 设计了 134 道测试题。这不是为了凑数字，而是因为人工试几个问题根本测不出问题。

真实用户的提问方式千奇百怪。你觉得”没人会这么问”的问题，上线第一天就会出现。

测试的正确姿势：

第 1 周：单项测试 — 逐个意图验证，确保基本功能正确

第 2 周：多轮对话测试 — 模拟真实对话链路，验证上下文保持和话题切换

第 3 周：内部体验 — 让公司里不同角色的人来用，收集反馈

第 4 周：影子运行 — AI 和人工同时处理同一批咨询，对比结果

每个阶段都会发现问题，发现问题就回到第 2 步改知识库、回到第 3 步调对话流程。这个循环是正常的，不是返工。

一个关键指标：意图识别准确率 > 90%，事实准确性 > 95%。达不到这个标准就不要上线。

第 6 步：灰度上线，逐步放量

终于到了上线。但千万不要第一天就把 100% 的流量切给 AI。

推荐的节奏：

第 1 周：10% 流量给 AI，人工审核所有转接记录
第 2 周：30% 流量，抽样审核
第 3 周：60% 流量，监控异常指标
第 4 周+：100% 流量，进入日常运维

上线不是终点，是起点。你需要持续关注几个数字：

分流率 — AI 成功处理了多少比例的咨询（目标 50-70%）
转人工率 — 多少对话最终还是需要人工介入
客户满意度 — 用户觉得 AI 有没有用
错误率 — AI 答错了多少次

现实的期望：第 1 个月分流率 40-50%，第 3 个月 55-65%，第 6 个月 60-70%。不要指望第一天就达到最优状态。

为什么大部分项目卡在第 1 步

回头看这 6 步，技术难度最高的是第 2 步（知识库），但最容易被跳过的是第 1 步（定范围）。

因为第 1 步看起来不像在”干活”。老板说”我要上 AI 客服”，你不赶紧搭平台接模型，反而在那问”我们要解决什么问题”，显得很磨叽。

但没有清晰的范围定义，后面每一步都是在猜。猜错了就返工，返工几次项目就黄了。

花两天把第 1 步想清楚，能省后面两周的折腾。

关于时间和成本

一个中小企业的 AI 客服项目，从启动到上线，合理的周期是 2-4 周：

第 1 周：需求确认 + 知识库准备
第 2 周：平台搭建 + 对话设计 + 护栏配置
第 3 周：测试 + 调优
第 4 周：灰度上线

成本主要花在知识库建设和调优上，不是花在平台和模型上。平台用 Dify 或者阿里百炼，模型用 DeepSeek，技术成本很低。真正值钱的是把你的业务知识变成 AI 能用的高质量知识库，然后反复测试打磨到好用。

这也是为什么”自己装一个”和”找人做一个”的效果差距那么大。不是装不上，是后面那些”脏活”没人愿意做。

我们提供 AI 客服落地服务，从需求定义到上线交付，2-4 周完成。如果你正在考虑给企业上 AI 客服，欢迎先聊聊需求。邮箱 hh@call-hh.cn 或访问 call-hh.cn/contact 留言。