A

分层优先（推荐）

按依赖关系分4个阶段逐步落地，每阶段可独立上线。

Phase 1 · 第1周

接入真实服务

消灭 rag.py / compliance.py 中的 Mock 数据，让系统真正可用

Phase 2 · 第2-3周

混合检索 + Reranking

Milvus sparse BM25 + dense RRF 融合 + Cross-encoder reranker

Phase 3 · 第4周

引用溯源 + 筛选 UI

答案内联 [1][2] 跳转原文片段，法规类型/版本筛选栏

Phase 4 · 第5周

会话持久化 + 压缩

PostgreSQL 存储会话，长对话上下文压缩，快问后端化

优势

每阶段可独立验证
Phase 1 即可见效
风险最低

劣势

完整交付需 5 周

B

检索优先

先升级检索质量（最有技术价值），再接入服务，最后做 UX。

Step 1

Milvus sparse + dense 混合索引

先在 Mock 环境验证检索效果，技术风险前移

Step 2

接入真实服务 + 端到端测试

Step 3

引用 + UX + 会话持久化

优势

技术风险前移验证

劣势

Mock 上测检索效果失真
用户最长时间看不到真实效果

C

最小可行改进

只做最小必要改动，跳过 BM25/Reranking，快速交付可用版本。

Step 1

接入真实服务（消灭 Mock）

Step 2

引用溯源 + 筛选 UI

跳过混合检索和会话持久化

优势

2周内完成
最低风险

劣势

检索质量无提升
会话仍会丢失

法规对话模块优化方案

分层优先（推荐）

优势

劣势

检索优先

优势

劣势

最小可行改进

优势

劣势