法规对话模块优化方案

选择你偏好的整体策略,我会据此展开详细设计

A

分层优先(推荐)

按依赖关系分4个阶段逐步落地,每阶段可独立上线。

Phase 1 · 第1周
接入真实服务

消灭 rag.py / compliance.py 中的 Mock 数据,让系统真正可用

Phase 2 · 第2-3周
混合检索 + Reranking

Milvus sparse BM25 + dense RRF 融合 + Cross-encoder reranker

Phase 3 · 第4周
引用溯源 + 筛选 UI

答案内联 [1][2] 跳转原文片段,法规类型/版本筛选栏

Phase 4 · 第5周
会话持久化 + 压缩

PostgreSQL 存储会话,长对话上下文压缩,快问后端化

优势

  • 每阶段可独立验证
  • Phase 1 即可见效
  • 风险最低

劣势

  • 完整交付需 5 周
B

检索优先

先升级检索质量(最有技术价值),再接入服务,最后做 UX。

Step 1
Milvus sparse + dense 混合索引

先在 Mock 环境验证检索效果,技术风险前移

Step 2
接入真实服务 + 端到端测试
Step 3
引用 + UX + 会话持久化

优势

  • 技术风险前移验证

劣势

  • Mock 上测检索效果失真
  • 用户最长时间看不到真实效果
C

最小可行改进

只做最小必要改动,跳过 BM25/Reranking,快速交付可用版本。

Step 1
接入真实服务(消灭 Mock)
Step 2
引用溯源 + 筛选 UI

跳过混合检索和会话持久化

优势

  • 2周内完成
  • 最低风险

劣势

  • 检索质量无提升
  • 会话仍会丢失