docs: W6 进展报告

功能成型收口周:整合成一个客服工作台页面(患者列表固定/画像标签分类筛选/小助手内嵌) + 按业务验证反馈校准召回算法 + AI"说人话"打磨。沿用 W5「一页 Demo + 业务语言」结构。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>

docs: W6 进展报告
功能成型收口周:整合成一个客服工作台页面(患者列表固定/画像标签分类筛选/小助手内嵌) + 按业务验证反馈校准召回算法 + AI"说人话"打磨。沿用 W5「一页 Demo + 业务语言」结构。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
49ff784a · luoqi · 496f92df · 49ff784a
Commit 49ff784a authored Jun 17, 2026 by luoqi
Hide whitespace changes
Inline Side-by-side

Showing with 187 additions and 0 deletions

docs/w6-report.md
+187 -0

No files found.
--- a/docs/w6-report.md
+++ b/docs/w6-report.md
+# 疗效保障(PAC)项目 W6 进展报告
+> **报告周期**:第 6 周(W6)
+> **汇报路径**:PAC(luoqi)→ CTO(于总)→ 管委会
+> **报告人**:luoqi
+> **状态**:🟢 W6 收口打磨 — 功能已成型,本周不做大动;重心转向「业务验证后按反馈调整(召回算法等)」+「整合成一个客服真正能用的工作台页面」
+---
+## Page 1 · 一句话 + 里程碑路线
+### ▎本周一句话
+> **W5 把引擎做扎实(召回准度 / 画像系统 / 话术三挡 / 对外开放),功能至此已成型,W6 不再加大功能,转做两件"落地"的事:① 把原本分散的患者列表 / 画像 / 召回 / 话术 / 小助手整合成「一个客服工作台页面」——左侧患者列表固定、画像标签可分类筛选圈人、AI 小助手内嵌进来帮客服;② 按业务验证后的真实反馈,对召回算法等做针对性校准。从"技术自评准"走向"客服真能上手、业务认可"。**
+### ▎答复
+| 问 | 答 |
+|---|---|
+| 这周功能又加了一堆吗? | ❌ 没有。功能 W5 已成型,W6 刻意**不做大动**,只做打磨 + 按反馈校准,避免"做不完的新功能"冲淡落地 |
+| 召回算法这周动了吗? | ✅ 动了,但不是推翻——是**按业务验证反馈做针对性调整**(场景口径 / 阈值 / 排除规则),把"技术上对"校准到"业务认可" |
+| 客服真用起来顺手吗? | ✅ 整合成**一个工作台页面**:左侧患者列表固定(选患者不跳页)、画像标签**分类筛选圈人**、小助手内嵌辅助,一站式 |
+| 小助手(AI 能力)怎么用上? | ✅ 从"独立演示页"**移进工作台**,客服边看患者边问助手;同时保留企微入口 |
+| AI 说的话客服 / 患者听得懂吗? | ✅ 本周重点打磨"说人话":三处关键信息压成**一句话摘要**、话术**禁止露内部代码(如 K08)**、站患者立场讲"为什么该来" |
+### ▎走向终态(按当前节奏)
+```
+下一步 ⭐ 正式上线(真实客服日常使用 + 召回成效对照)
+   ↑ 需要: 业务验收结论(GO/NO-GO)达80%
+W6 ✅ 功能成型后收口:整合成一个客服工作台页面(患者列表固定 / 画像标签分类筛选 / 小助手内嵌)+ 按业务验证反馈校准召回算法 + AI"说人话"打磨(本次报告)
+W5 ✅ 核心引擎做扎实:DW 摄入补充 + 召回准度全量核验(44万牙位/误召0.023%)+ 画像 v3 标签系统 + AI 话术三挡 + 能力开放给外部 agent(MCP)
+W4 ✅ 5 家试点全量数据上测试服务器 + 网络电话 + 实时 AI 辅助
+W3 ✅ 本地真实数据 demo + 潜在新链召回 + AI 话术 + 治疗链 5 阶段可视化
+W2 ✅ 数据接入文档 + 演示能力提前到位 + 召回算法策略落地
+W1 ✅ 框架定稿 + 数据库结构评审 closure
+```
+### ▎本周必须推动(求 CTO / 管委会协调)
+```
+🆘 1. 业务验收结论(GO/NO-GO)
+       - 功能已成型、工作台已整合成一个页面,具备让客服上手验收的条件
+       - 需业务给出"够好可上 / 还要改哪"的明确结论,否则打磨没有终点
+🆘 2. 召回口径的业务签字
+       - 本周已按反馈调整召回算法,但"调对没"要业务方场景化抽样确认
+       - 需业务指定 1-2 名熟悉口径的人做抽样审查 + 签字
+```
+---
+## Page 2 · 本周做的三件事(业务语言)
+### ▎① 整合成"一个客服工作台页面" — 客服一站式,不再来回跳
+> 以前患者列表 / 画像 / 召回原因 / 话术 / 小助手是分散的;本周收口成**一个页面**,贴着客服真实工作动线。
+| 区块 | 做法 | 对客服的价值 |
+|---|---|---|
+| **左侧患者列表(固定)** | 召回名单固定在左栏,选患者时右侧详情切换、列表不跳走 | 一批患者连续打,不丢上下文、不反复返回 |
+| **画像标签分类筛选(圈人)** | 画像标签按类(价值 / 生命周期 / 临床 / 偏好…)筛选,圈出目标人群 | "高价值 + 应治未治"等人群一键圈出,按需触达 |
+| **AI 小助手内嵌** | 把原独立的智能助手移进工作台,边看患者边问 | 现场问"这患者怎么聊 / 有什么风险",助手即时答 |
+**意义**:从"一堆能力"变成"一个客服真能坐下来用的工作台"——这是从"做得出"到"用得顺"的关键一步。
+### ▎② 按业务验证反馈,校准召回算法 — 从"技术对"到"业务认可"
+> W5 技术核验已证明误召 0.023%;W6 转入业务侧验证,按试点反馈对**口径**做针对性调整(不是推翻引擎)。
+- 调整性质:**场景口径 / 时间阈值 / 排除规则**的微调——例如某些场景该不该召、隔多久算"该回访",按业务实际习惯对齐;
+- 调整来源:**业务反馈驱动**,不是技术自定;每条调整可追溯到一个具体场景/案例;
+- 仍守红线:逝者 / 拒联 / 已有预约不召等硬约束**不变**。
+> 📌 具体调整条目随算法文档同步;待业务方抽样签字后定稿。
+### ▎③ AI"说人话" — 让客服 / 患者一眼就懂
+> 功能成型后,本周把 AI 输出的"可读性 / 分寸"打磨到位——这是客服真正天天看的东西。
+- **三处一句话摘要**:把"历史联系 / 画像标签 / 本次召回原因"各自从一堆结构化数据**压成一句话**,客服一眼抓重点(累人的结构化收进"详情"备查);
+- **召回简报站患者立场**:不是"诊所要邀约你做 X",而是"他为什么该来"——把缺口翻译成患者能感知的影响(客观说明、不吓唬、不推销),旁边箭头可展开看原始"为什么召回";
+- **话术说大白话**:深度档话术**禁止把内部代码(如 K08)、专业术语原样念给患者**(机器闸确定性拦截 + 校验补强),并要求逻辑层层递进、把不处理的后果讲清但不吓唬;
+- **不无中生有**:摘要 / 话术只用已有事实,"应治未治"是临床缺口、不擅自说成"患者有意向"。
+---
+## Page 3 · W6 交付清单(说结果)
+| 方向 | 状态 | 实际成果 |
+|---|---|---|
+| **客服工作台整合** | ✅ | 一个页面:左侧患者列表固定 + 画像标签分类筛选圈人 + AI 小助手内嵌;贴客服工作动线 |
+| **召回算法业务校准** | 🟡 进行中 | 按试点反馈调整场景口径 / 阈值 / 排除规则(红线不变);待业务抽样签字定稿 |
+| **AI 表达"说人话"** | ✅ | 三处一句话摘要 + 召回简报站患者立场 + 话术禁露内部代码 + 逻辑层层递进 + 不无中生有 |
+| **画像标签可解释** | ✅ | 画像标签独立成卡,详情可看每个标签的取值 + 判定规则(点开即知"为什么这么判") |
+| **稳定性 / 体验打磨** | ✅ | 详情页布局收口(长文不再撑乱右栏)+ 抽屉 / 展开交互一致;已部署测试服务器 |
+### ▎W6 期间业务能力提升要点(管委会角度)
+| 能力 | W5 末 → W6 末 |
+|---|---|
+| 客服使用形态 | 分散的能力 → **一个一站式工作台页面**(列表固定 / 标签圈人 / 助手内嵌) |
+| 召回准度 | 技术自评 0.023% 误召 → **按业务反馈校准口径(业务认可中)** |
+| AI 可读性 | 结构化数据 + 老话术 → **一句话摘要 + 站患者立场 + 说大白话(不露代码)** |
+| 画像可解释 | 标签有证据 → **页面可点开看每个标签"为什么这么判"** |
+---
+## Page 4 · 里程碑预告(等验收签字 → 上线)
+### ▎进行中(本阶段收口)
+```
+🎯 给管委会看
+  1. 一个客服工作台页面(列表固定 / 标签圈人 / 助手内嵌)— 拿到测试服务器,等客服实际验收
+  2. 召回算法按业务反馈校准的条目 — 待业务抽样签字定稿
+  3. AI"说人话"成果(摘要 / 话术)— 现场可演示对比
+```
+### ▎下一步 ⭐ · 看业务验收签字决定
+```
+🎯 业务验收 + 召回口径签字
+  - 工作台已成型,接下来用真实客服验收 + 业务对召回口径签字:
+      通过 → 走上线标准(GO/NO-GO)+ 客服培训 + 灰度
+      有意见 → 按反馈继续微调(标签优先级 / 话术口径 / 召回阈值)
+🎯 上线标准讨论(需管委会拍定)
+  - GO/NO-GO 口径:召回准度达到什么线 / 验收看哪几个指标 / 灰度范围与节奏
+```
+---
+## Page 5 · 风险 + 依赖
+### ▎本周风险
+| # | 风险 | 等级 | 现状 | 求协调 |
+|---|---|---|---|---|
+| 1 | **业务验收 / 召回口径签字未结** | 🟡 中 | 工作台已成型,召回已按反馈调,但缺业务正式签字 | 指定业务方做抽样审查 + 签字 |
+| 2 | **上线标准未定**(沿用) | 🟡 中 | 打磨没有明确终点判据 | 管委会拍定 GO/NO-GO 指标 |
+| 3 | **DW 字段补充**(沿用 W4/W5) | 🟡 中 | 保险保司名 / 专属客服等字段待补 | DW 团队补齐 + 重摄入 |
+| 4 | **"成型"后易陷入无尽微调** | 🟢 收敛中 | 功能已够,需靠"验收签字"框住打磨边界,避免无限调 | 用验收结论框定终点 |
+### ▎不报喜不报忧(W6 实际遇到的问题 + 怎么解的)
+| 问题 | 现象 | 处理 |
+|---|---|---|
+| AI 把内部代码念给患者 | 话术里出现"诊断记录为 K08"——患者根本听不懂 | 加**机器确定性拦截**(命中 K 码 / 内部枚举即拦,触发重写/兜底)+ 提示词要求说大白话 + 校验补一项"患者听得懂" |
+| 摘要"拔高"成患者意愿 | 把"应治未治"(临床缺口)说成"患者有种植意向" | 提示词明确:缺口≠意愿,只能说"待跟进",并禁编情绪/态度;统一三处摘要口径 |
+| 长文撑乱页面布局 | 规划大纲长文不换行,把右侧栏挤出屏幕 | 修正换行 + 容器可收缩(根治,不止一处) |
+| 话术段式太死板 | 提示词钦定固定段式,模型千篇一律 | 改为只给原则(从果推因 / 层层递进 / 说人话),具体分段交给模型,给自由度 |
+### ▎资源依赖矩阵
+```
+W6 ✅:PAC 1 人 + AI 完成工作台整合 / 召回校准 / AI 说人话打磨 / 部署(轻借力)
+进行中:PAC 1 人 + 业务(验收 + 召回口径签字)+ DW 1 人(补字段)(中借力)
+下一步:PAC 1 人 + 管委会(上线标准)+ 业务(验收签字)+ 客服培训(重借力)
+```
+---
+## ▎下一份报告预告
+**承诺给管委会看**:
+1. 业务验收结果 + 召回口径签字结论 → 据此定方向(上线 / 继续微调)
+2. 上线标准(GO/NO-GO)讨论结论
+3. 工作台页面在真实客服手里的使用反馈
+4. DW 字段补齐后画像在页面的真实显示
+**汇报形式**:沿用"一页 Demo + 业务语言"风格,继续 Demo over Memo。
+---
+## ▎附件(留参考)
+| 附件 | 内容 |
+|---|---|
+| algorithm/recall-verification.md | 召回准度核验方法 + 全量结果(W5)+ W6 业务校准条目 |
+| algorithm/persona-design-v2.md | 画像标签系统设计(16 标签 / 取数模式 / 证据链) |
+| algorithm/ai-script-generation.md | AI 话术三挡 + 安全闸 + "说人话"(禁内部代码)+ 从果推因/层层递进 |
+| (工作台)客服工作台单页面 | 患者列表固定 + 画像标签分类筛选圈人 + 小助手内嵌 |
+---
+> **核心信号**:W6 功能已成型、刻意不做大动 —— 把分散能力整合成"一个客服工作台页面"(列表固定 / 标签圈人 / 助手内嵌),并按业务验证反馈校准召回算法、把 AI 输出打磨到"说人话";下一步看业务验收 + 召回口径签字,定"上线 or 继续微调"。