设计概览:法规对话模块优化路线

Section 1 of 4 — 架构演进全图

📍 当前状态

用户提问 (RagChatPage / ChatPanel)
POST /agent/chat/stream 真实
↓ ↗
POST /rag/chat & /compliance/chat/{id} Mock 数据
Dense 向量检索(COSINE) 可用
LLM 生成(输出含 [1][2] 引用) 可用
前端显示来源面板,[1][2] 未解析 未联动
会话存内存(30min过期,max 100) 易丢失

🎯 目标状态(4个阶段后)

用户提问 + 法规类型/版本筛选器 (P3)
/compliance/chat → 真实 AgentService + Segment 上下文 Phase 1
Hybrid 检索:Dense + Sparse BM25(Milvus)→ RRF 融合 Phase 2
Cross-Encoder Reranker(Top-K 精排) Phase 2
LLM 生成(含 [1][2] 引用编号)
前端内联引用解析:[1] → 高亮原文跳转 Phase 3
会话持久化(PostgreSQL)+ 上下文压缩 Phase 4
现有功能正常
当前有问题
Phase 1 新增/修复
Phase 2 升级
Phase 3 新增
Phase 4 新增
关键发现: RagChatPage 已通过 /agent/chat/stream 使用真实服务。 最需要修复的是 CompliancePage 的 ChatPanel(合规对话面板仍是 Mock),以及前端快速问题硬编码问题。 Phase 2 的 BM25 稀疏向量需要重建 Milvus Collection(或添加新 field)。