首页/ 产品/ 句子守护

产品 · 守护 · 主管

句子守护 ·
守护你的 AI 员工

我们为你的每一个 AI 员工做了什么、效果如何，一眼可见。Agent 上线前测过、上线后管着——AI 自动生成用例、批量验收、灰度测试、回归测试、AI 工单、AI 质检。没人拍板不上线，可追溯可审计。

看六道关口

六道

关口上线把关

AI 自动

生成用例

持续

健康度监控

可追溯

留痕可审计

句子守护 · 六关闭环

句子守护六关闭环

用例生成1

批量验收2

灰度3

4回归

AI 工单5

AI 质检6

为什么要守护

上线前测试不充分，问题会直接暴露给客户。

某家电客户上线前的一轮自动化测试中，28 条用例全部未通过，主要短板是故障咨询应答不达标，问题在上线前被拦下。Agent 上线不能止于流程搭建，上线前需充分测试，上线后需持续监控。

上一代 · 搭完流程就交付

句子守护 · 守护你的 AI 员工

测试用例靠人手写，几十条到头，覆盖不全

AI 读懂业务流程，几分钟生成上百条用例

上线就是终点，坏了没人知道、客户看不到

六道关口逐关把关，不达标不上线

版本一改，老功能悄悄崩，上线才暴露

上线后 AI 工单、质检接着盯，问题主动冒出来

做了多少质量活，客户完全无感

Agent 健康度看板，做了什么客户一眼看见

六道关口

每个 Agent 上线，都要过六道关口。

六道关口覆盖 Agent 从搭建、上线到运营的完整周期。用例先生成，批量验收再压测稳定性，灰度和回归控制版本风险，上线后由工单与质检持续兜底。

01 · 用例生成

AI 生成测试用例

AI 读懂流程引擎配置和业务场景，几分钟生成上百条用例。还可输入 SOP、客户资料包、历史对话、新旧版本差异作为依据，结果不满意可对话调整、重新生成。

上线前

02 · 批量验收

批量验收

单轮通过看似达标，但大模型每次输出存在波动。设定轮数与并发跑多轮，逐条判断回复是否正确，筛出未通过的用例修正，合格用例纳入回归集。

上线前

03 · 灰度测试

灰度测试

既要验证新版又要避免影响线上。开启灰度密钥，仅持有密钥的会话进入新版，其余会话维持原版。效果可对比，一键关闭即回退正式版。

上线中

04 · 回归测试

回归测试

新版一改，老功能可能悄悄坏。回归集跟版本绑定，上线前强制跑：不少于 50 条、通过率必须 100% 才放行。每次结果归档，质量怎么变的可追溯。

放行前强制

05 · AI 工单

AI 工单

AI 应答出错难以避免，问题在于客户缺少反馈渠道。客户在对话中点踩后，工单同步进入调优中心和客户侧看板，处理完成后回执状态，问题闭环处理。

上线后

06 · AI 质检

AI 质检

人工质检成本高、覆盖有限。建立质检模板，对线上对话批量抽检，输出会话数与未通过比例，支持二次复检，人工客服与 AI 客服统一标准。

上线后

关键环节实拍

挑三个关键环节，看看它们在产品里长什么样。

上面六关讲的是每一关做什么，这里挑三个环节看真实界面：批量验收多轮并发、灰度按比例分流、验收报告自动汇总。

批量验收：多轮并发跑，把波动拦在上线前

要压住输出波动，靠的是量。8 路浏览器并发跑同一批用例，每一路独立判断回复是否达标。

守

句子守护 · 批量验收8 路浏览器并发 · AI 自动跑测试

127/ 300 已执行

灰度对比：新版先吃小流量，确认稳定再放量

放量的底气来自比对。5% 的流量走新版 v2.4、95% 留在旧版 v2.3，两条线的表现实时摆在一起看。

守

句子守护 · 灰度对比新版本先放 5% 流量，AI 盯两边差异

46次实时比对

线上流量100% · 实时请求

新版本 v2.45% · 灰度

旧版本 v2.395% · 稳定

95%

验收报告：跑完自动汇总成一份交付凭证

能交给客户的，是结论。报告把通过率、失败归因、耗时汇到一起，可读、可追溯，直接作为交付凭证。

守

句子守护 · 用例报告自动生成客户可读的验收凭证

94.3%通过率

300

总用例

283

通过

不通过

8 路

并发执行

14′08″

总耗时

2.8s

平均单例

✓ 可作为交付验收凭证提交客户

客户看得见 · 健康度看板

每天打开，就知道你的 AI 员工今天健不健康。

客户无需询问。一块看板呈现当天为该 Agent 执行的动作、五个维度的各项进展和健康度评分。

健康度（较上周 +6）

行动日历 · 每天为这个 Agent 做了什么

126/98

用例生成 / 采纳

18 类

场景覆盖

94%

批量验收通过

3 版

灰度测试

100%

回归测试

示意数据；正式上线后由每个 Agent 的真实测试数据自动填充。

让句子守护把住你的 Agent 质量底线。

从一个 AI 角色起步，逐步扩展到多个 Agent。每一个上线前过完六道关口，上线后持续盯着，做了什么客户都看得见。

六道

关口逐关把关，不达标不上线

健康度

看板，做了什么客户一眼看见

可追溯

每次测试留痕归档，随时可审计