Refactor code structure for improved readability and maintainability

2026-05-14 18:09:15 +08:00
parent 10d04c4083
commit 35cd927d02
105 changed files with 9043 additions and 7720 deletions
--- a/backend/app/services/agent/init.py
+++ b/backend/app/services/agent/init.py
@@ -1,7 +1,6 @@
-# src/services/agent/__init__.py
 """Agent服务模块"""

 from .qa_agent import QAAgent, ask_compliance_question
 from .session_manager import SessionManager, ChatSession

-__all__ = ["QAAgent", "ask_compliance_question", "SessionManager", "ChatSession"]
+__all__ = ["QAAgent", "ask_compliance_question", "SessionManager", "ChatSession"]
--- a/backend/app/services/agent/qa_agent.py
+++ b/backend/app/services/agent/qa_agent.py
@@ -1,4 +1,3 @@
-# src/services/agent/qa_agent.py
 """RAG问答Agent - 合规智能问答核心实现"""

 import time
--- a/backend/app/services/agent/session_manager.py
+++ b/backend/app/services/agent/session_manager.py
@@ -1,4 +1,3 @@
-# src/services/agent/session_manager.py
 """多轮对话会话管理"""

 import time
@@ -244,4 +243,4 @@ class SessionManager:
    def clear_all_sessions(self):
        """清空所有会话"""
        self._sessions.clear()
-        logger.info("所有会话已清空")
+        logger.info("所有会话已清空")
--- a/backend/app/services/document_processor.py
+++ b/backend/app/services/document_processor.py
@@ -1,4 +1,3 @@
-# src/services/document_processor.py
 """文档处理主流程 - 解析→摘要→分块→嵌入→入库"""

 import os
--- a/backend/app/services/embedding/init.py
+++ b/backend/app/services/embedding/init.py
@@ -1,7 +1,6 @@
-# src/services/embedding/__init__.py
 """嵌入和分块服务"""

 from .text_chunker import RegulationChunker
 from .bge_m3_embedder import BGEM3Embedder

-__all__ = ["RegulationChunker", "BGEM3Embedder"]
+__all__ = ["RegulationChunker", "BGEM3Embedder"]
--- a/backend/app/services/embedding/bge_m3_embedder.py
+++ b/backend/app/services/embedding/bge_m3_embedder.py
@@ -1,4 +1,3 @@
-# src/services/embedding/bge_m3_embedder.py
 """BGE-M3嵌入服务 - Dense+Sparse双路向量生成"""

 import numpy as np
@@ -293,4 +292,4 @@ def embed_single_text(
 ) -> Dict:
    """便捷函数：对单个文本生成嵌入"""
    embedder = BGEM3Embedder(model_name=model_name, **kwargs)
-    return embedder.embed_single(text)
+    return embedder.embed_single(text)
--- a/backend/app/services/embedding/text_chunker.py
+++ b/backend/app/services/embedding/text_chunker.py
@@ -1,4 +1,3 @@
-# src/services/embedding/text_chunker.py
 """智能分块器 - 章节级+条款级双粒度切割"""

 import re
@@ -446,4 +445,4 @@ def chunk_regulation_document(
        doc_name,
        regulation_type,
        version
-    )
+    )
--- a/backend/app/services/llm/init.py
+++ b/backend/app/services/llm/init.py
@@ -1,4 +1,3 @@
-# src/services/llm/__init__.py
 """LLM服务模块"""

 from .llm_factory import LLMFactory, get_llm_client
@@ -12,4 +11,4 @@ __all__ = [
    "BaseLLMClient", "LLMResponse", "LLMConfig", "LLMProvider",
    "DeepSeekClient", "QwenClient", "QwenVLClient",
    "DocumentSummarizer", "summarize_document", "DocumentSummary"
-]
+]
--- a/backend/app/services/llm/base_client.py
+++ b/backend/app/services/llm/base_client.py
@@ -1,4 +1,3 @@
-# src/services/llm/base_client.py
 """LLM客户端基类 - 统一接口定义"""

 from abc import ABC, abstractmethod
@@ -113,4 +112,4 @@ class BaseLLMClient(ABC):
        # 中文字符约1.5 token，英文约0.25 token
        chinese_chars = sum(1 for c in text if '一' <= c <= '鿿')
        other_chars = len(text) - chinese_chars
-        return int(chinese_chars * 1.5 + other_chars * 0.25)
+        return int(chinese_chars * 1.5 + other_chars * 0.25)
--- a/backend/app/services/llm/deepseek_client.py
+++ b/backend/app/services/llm/deepseek_client.py
@@ -1,4 +1,3 @@
-# src/services/llm/deepseek_client.py
 """DeepSeek LLM客户端 - OpenAI兼容API"""

 import time
--- a/backend/app/services/llm/document_summarizer.py
+++ b/backend/app/services/llm/document_summarizer.py
@@ -1,4 +1,3 @@
-# src/services/llm/document_summarizer.py
 """文档摘要生成服务 - LLM生成法规文档摘要"""

 from typing import Dict, Optional
--- a/backend/app/services/llm/llm_factory.py
+++ b/backend/app/services/llm/llm_factory.py
@@ -1,4 +1,3 @@
-# src/services/llm/llm_factory.py
 """LLM工厂 - 统一创建和管理LLM客户端"""

 from typing import Optional, Dict, Any
--- a/backend/app/services/llm/qwen_client.py
+++ b/backend/app/services/llm/qwen_client.py
@@ -1,4 +1,3 @@
-# src/services/llm/qwen_client.py
 """Qwen LLM客户端 - 支持OpenAI兼容API格式"""

 import time
--- a/backend/app/services/parser/init.py
+++ b/backend/app/services/parser/init.py
@@ -1,7 +1,6 @@
-# src/services/parser/__init__.py
 """文档解析服务"""

 from .pdf_parser import PDFParser
 from .docx_parser import DocxParser

-__all__ = ["PDFParser", "DocxParser"]
+__all__ = ["PDFParser", "DocxParser"]
--- a/backend/app/services/parser/docx_parser.py
+++ b/backend/app/services/parser/docx_parser.py
@@ -1,4 +1,3 @@
-# src/services/parser/docx_parser.py
 """Word文档解析 - 使用python-docx"""

 from docx import Document
@@ -284,4 +283,4 @@ def parse_docx(file_path: str) -> DocxDocumentContent:
 def parse_docx_to_markdown(file_path: str) -> str:
    """便捷函数：解析Word并返回Markdown"""
    parser = DocxParser()
-    return parser.parse_to_markdown(file_path)
+    return parser.parse_to_markdown(file_path)
--- a/backend/app/services/parser/mineru_parser.py
+++ b/backend/app/services/parser/mineru_parser.py
@@ -1,4 +1,3 @@
-# src/services/parser/mineru_parser.py
 """MinerU多模态PDF解析 - 版面感知解析"""

 from typing import Optional, Dict
@@ -201,4 +200,4 @@ def parse_with_mineru(file_path: str) -> MinerUResult:
 def parse_pdf_smart(file_path: str) -> str:
    """便捷函数：智能解析PDF（自动选择最佳解析器）"""
    orchestrator = ParserOrchestrator()
-    return orchestrator.parse_pdf(file_path)
+    return orchestrator.parse_pdf(file_path)
--- a/backend/app/services/parser/pdf_parser.py
+++ b/backend/app/services/parser/pdf_parser.py
@@ -1,4 +1,3 @@
-# src/services/parser/pdf_parser.py
 """PDF文档解析 - 使用PyMuPDF基础解析"""

 import fitz  # PyMuPDF
@@ -265,4 +264,4 @@ def parse_pdf(file_path: str, **kwargs) -> PDFDocumentContent:
 def parse_pdf_to_markdown(file_path: str) -> str:
    """便捷函数：解析PDF并返回Markdown"""
    parser = PDFParser()
-    return parser.parse_to_markdown(file_path)
+    return parser.parse_to_markdown(file_path)
--- a/backend/app/services/rag/init.py
+++ b/backend/app/services/rag/init.py
@@ -1,4 +1,3 @@
-# src/services/rag/__init__.py
 """RAG服务模块"""

 from .retriever import Retriever, retrieve_regulations
@@ -9,4 +8,4 @@ __all__ = [
    "Retriever", "retrieve_regulations",
    "ContextBuilder", "build_rag_context",
    "PromptTemplates", "get_prompt_template"
-]
+]
--- a/backend/app/services/rag/context_builder.py
+++ b/backend/app/services/rag/context_builder.py
@@ -1,4 +1,3 @@
-# src/services/rag/context_builder.py
 """RAG上下文构建服务 - 构建LLM输入上下文"""

 from typing import List, Dict, Optional
--- a/backend/app/services/rag/prompt_templates.py
+++ b/backend/app/services/rag/prompt_templates.py
@@ -1,4 +1,3 @@
-# src/services/rag/prompt_templates.py
 """RAG Prompt模板 - 合规问答专用Prompt"""

 from typing import Dict, Optional
@@ -293,4 +292,4 @@ def get_prompt_template(name: str) -> PromptTemplate:
    template = PromptTemplates.get_template(name)
    if not template:
        raise ValueError(f"不存在的模板: {name}")
-    return template
+    return template
--- a/backend/app/services/rag/retriever.py
+++ b/backend/app/services/rag/retriever.py
@@ -1,4 +1,3 @@
-# src/services/rag/retriever.py
 """RAG检索服务 - 封装Milvus检索"""

 from typing import List, Dict, Optional, Any
--- a/backend/app/services/storage/init.py
+++ b/backend/app/services/storage/init.py
@@ -1,7 +1,6 @@
-# src/services/storage/__init__.py
 """存储服务"""

 from .milvus_client import MilvusClient
 from .minio_client import MinIOClient

-__all__ = ["MilvusClient", "MinIOClient"]
+__all__ = ["MilvusClient", "MinIOClient"]
--- a/backend/app/services/storage/milvus_client.py
+++ b/backend/app/services/storage/milvus_client.py
@@ -1,4 +1,3 @@
-# src/services/storage/milvus_client.py
 """Milvus向量数据库客户端 - 存储与检索服务"""

 from pymilvus import (
--- a/backend/app/services/storage/minio_client.py
+++ b/backend/app/services/storage/minio_client.py
@@ -1,4 +1,3 @@
-# src/services/storage/minio_client.py
 """MinIO对象存储客户端 - 文档文件存储"""

 from minio import Minio