Fix SSE route dependency and align architecture docs

2026-05-18 16:32:42 +08:00
parent 86b9ac806a
commit 3f69cad404
149 changed files with 4786 additions and 5957 deletions
--- a/backend/app/api/routes/rag.py
+++ b/backend/app/api/routes/rag.py
@@ -1,29 +1,39 @@
+"""Define API routes for rag."""
+
+from __future__ import annotations
+
+import asyncio
+import json
+from typing import AsyncGenerator
+
 from fastapi import APIRouter
-from sse_starlette.sse import EventSourceResponse
+from fastapi.responses import StreamingResponse
+
 from app.schemas.rag import RagChatRequest, QuickQuestionsResponse, QuickQuestion
 from app.services.mock_data import (
    get_mock_quick_questions,
    get_mock_retrieval,
    get_mock_rag_answer,
 )
-import json
-import asyncio
+# Keep route handlers close to their transport-layer wiring for easier auditing.
+

 router = APIRouter(prefix="/rag", tags=["RAG问答"])


@router.post("/chat")
 async def rag_chat(request: RagChatRequest):
-    """SSE流式问答"""
+    """Handle rag chat."""

-    async def generate():
-        # 发送检索开始事件
-        yield {"event": "message", "data": json.dumps({"type": "retrieving"})}
+    async def generate() -> AsyncGenerator[str, None]:
+        # Keep route handlers close to their transport-layer wiring for easier auditing.
+        """Handle generate."""
+        yield f"event: message\ndata: {json.dumps({'type': 'retrieving'}, ensure_ascii=False)}\n\n"

-        # 模拟检索延迟
+        # Keep route handlers close to their transport-layer wiring for easier auditing.
        await asyncio.sleep(0.3)

-        # 执行检索
+        # Keep route handlers close to their transport-layer wiring for easier auditing.
        docs = get_mock_retrieval(request.query, top_k=request.top_k)

        retrieved_data = [
@@ -36,39 +46,49 @@ async def rag_chat(request: RagChatRequest):
            }
            for d in docs
        ]
-        yield {"event": "message", "data": json.dumps({"type": "retrieved", "docs": retrieved_data})}
+        yield f"event: message\ndata: {json.dumps({'type': 'retrieved', 'docs': retrieved_data}, ensure_ascii=False)}\n\n"

-        # 发送生成开始事件
-        yield {"event": "message", "data": json.dumps({"type": "generating", "text": "正在生成答案..."})}
+        # Keep route handlers close to their transport-layer wiring for easier auditing.
+        yield (
+            f"event: message\ndata: "
+            f"{json.dumps({'type': 'generating', 'text': '正在生成答案...'}, ensure_ascii=False)}\n\n"
+        )

-        # 模拟生成延迟
+        # Keep route handlers close to their transport-layer wiring for easier auditing.
        await asyncio.sleep(0.2)

-        # 获取预设答案
+        # Keep route handlers close to their transport-layer wiring for easier auditing.
        answer = get_mock_rag_answer(request.query)

-        # 流式输出答案（按句子分割）
+        # Keep route handlers close to their transport-layer wiring for easier auditing.
        sentences = answer.split("\n\n")
        for sentence in sentences:
            if sentence.strip():
-                # 进一步分割长句子
+                # Keep route handlers close to their transport-layer wiring for easier auditing.
                chunks = sentence.split("\n")
                for chunk in chunks:
                    if chunk.strip():
-                        await asyncio.sleep(0.05)  # 模拟生成延迟
-                        yield {"event": "message", "data": json.dumps({"type": "chunk", "text": chunk + "\n"})}
+                        await asyncio.sleep(0.05)  # Keep route handlers close to their transport-layer wiring for easier auditing.
+                        yield (
+                            "event: message\n"
+                            f"data: {json.dumps({'type': 'chunk', 'text': chunk + chr(10)}, ensure_ascii=False)}\n\n"
+                        )

-        # 发送完成事件
-        yield {"event": "message", "data": json.dumps({"type": "done"})}
+        # Keep route handlers close to their transport-layer wiring for easier auditing.
+        yield f"event: message\ndata: {json.dumps({'type': 'done'}, ensure_ascii=False)}\n\n"

-    return EventSourceResponse(generate())
+    return StreamingResponse(
+        generate(),
+        media_type="text/event-stream",
+        headers={"Cache-Control": "no-cache", "Connection": "keep-alive", "X-Accel-Buffering": "no"},
+    )


@router.get("/quick-questions", response_model=QuickQuestionsResponse)
 async def get_quick_questions():
-    """获取预设快捷问题"""
+    """Return quick questions."""
    questions = [
        QuickQuestion(id=q["id"], question=q["question"], category=q["category"])
        for q in get_mock_quick_questions()
    ]
-    return QuickQuestionsResponse(questions=questions)
+    return QuickQuestionsResponse(questions=questions)