diff --git a/AI合规智能中枢_项目前期TODO.md b/AI合规智能中枢_项目前期TODO.md new file mode 100644 index 0000000..8924345 --- /dev/null +++ b/AI合规智能中枢_项目前期TODO.md @@ -0,0 +1,131 @@ +# AI 合规智能中枢 — 项目前期 TODO 清单 + +> 面向车企与工厂 | 项目管理视角 | 2026 Q2 启动阶段 + +--- + +## 一、业务调研与需求确认 + +- [ ] **1.1 客户访谈** — 与目标车企/工厂的 EHS、法务、采购、研发部门核心用户逐一开展需求访谈,收集真实痛点与使用场景优先级 +- [ ] **1.2 竞品调研** — 调研国内外现有合规 SaaS 工具(如律商联讯、北大法宝、iManage 等),明确差异化定位 +- [ ] **1.3 客户合规现状摸底** — 了解客户当前法规管理流程(手动/Excel/SharePoint),评估切换成本与接受度 +- [ ] **1.4 POC 场景筛选** — 从 EHS 隐患识别、文档合规审查、法规问答三大场景中,选取 2~3 个优先做 POC 验证 + +--- + +## 二、法规数据源与供应商 + +- [ ] **2.1 调研国内法规数据库供应商**,候选包括: + - 国家标准全文公开系统(免费) + - 工标网、标准云(标准文本采购) + - 北大法宝、威科先行(法规全文库商业授权) + - 工信部 MIIT 官网、国家生态环境部(免费但需爬取) +- [ ] **2.2 调研国际法规数据来源**: + - UN-ECE 法规(联合国欧洲经济委员会官网,免费) + - EUR-Lex 欧盟法规(免费 API) + - ISO/IEC 标准(付费采购,确认版权许可) + - IATF 16949、ISO 45001(ASQ/BSI 商业授权) +- [ ] **2.3 签订数据商务合同** — 明确授权范围、更新频率、数据格式(PDF/XML/结构化) +- [ ] **2.4 法规变更监控服务评估** — 是否采购第三方变更推送服务(如法规宝、JunGo),或自建爬虫 + 监控 + +--- + +## 三、技术栈选型与架构设计 + +- [ ] **3.1 向量数据库选型**,候选:Milvus、Weaviate、Qdrant、PGVector(私有化部署友好性为首要考量) +- [ ] **3.2 LLM 底座选型**: + - 私有部署:Qwen2.5、DeepSeek-R1、ChatGLM(满足数据不出厂要求) + - 云端备选:GPT-4o、Claude 3.5(针对非敏感场景) +- [ ] **3.3 Embedding 模型选型** — 中英双语嵌入模型(BGE-M3、text-embedding-3-large 等) +- [ ] **3.4 RAG 框架选型** — LlamaIndex vs LangChain vs 自研,评估混合检索(BM25 + 语义向量)支持能力 +- [ ] **3.5 OCR 引擎选型** — 版面感知 OCR,候选:PaddleOCR、Azure Document Intelligence、Textract +- [ ] **3.6 绘制整体技术架构图**,包含: + - 数据采集层(爬虫 / 文件上传 / API 对接) + - 处理层(OCR → 分块 → Embedding → 入库) + - 检索层(BM25 + 语义混合 + 知识图谱) + - 生成层(LLM + 引文锚定 + 置信度评分) + - 集成层(PLM/ERP/OA/MES API) + - 权限层(RBAC + 数据分区) +- [ ] **3.7 绘制数据流图** — 从法规入库到用户问答的完整链路 +- [ ] **3.8 知识图谱技术选型** — Neo4j vs TigerGraph vs NebulaGraph,确认多跳推理方案 + +--- + +## 四、私有化部署与安全合规 + +- [ ] **4.1 私有化部署方案设计** — 满足 PIPL/DSL 数据主权要求,确认"数据不出厂"的技术实现路径 +- [ ] **4.2 与客户 IT 安全团队对齐** — 确认服务器环境(K8s/Docker)、网络隔离策略、日志审计要求 +- [ ] **4.3 数据分级方案设计** — 内部文档(保密/内部/公开)三级分类标准确定 +- [ ] **4.4 RBAC 权限矩阵细化** — 对照合规管理员/法务专员/EHS工程师/采购专员等角色,落实细粒度权限清单 +- [ ] **4.5 安全审计日志方案** — 操作日志、查询日志的留存策略与查阅权限 + +--- + +## 五、系统集成与 API 设计 + +- [ ] **5.1 API 接口规范文档起草**,包括以下四类接口的入参/出参/鉴权规范: + - `POST /compliance/check` — 大文本分片合规检查 + - `POST /compliance/upload` — PDF/Word 文件上传审查 + - `GET /compliance/query` — 法规知识库问答 + - `POST /compliance/subscribe` — 法规变更 Webhook 订阅 +- [ ] **5.2 PLM/ERP/OA/MES 集成预调研** — 与客户 IT 确认各系统版本(如 SAP、用友、金蝶)、接口协议(REST/SOAP/文件传输)、集成可行性 +- [ ] **5.3 消息推送渠道接入评估** — 企业微信 Bot、飞书 Bot、钉钉 Bot、Teams Bot 的接入难度与审批流程 +- [ ] **5.4 Webhook 订阅机制设计** — 法规变更推送的订阅粒度(按法规域/业务线/角色) + +--- + +## 六、团队与资源规划 + +- [ ] **6.1 核心团队组建** — 明确所需角色:AI 算法工程师(RAG/NLP)、后端工程师、法规领域专家、产品经理、实施顾问 +- [ ] **6.2 法规领域顾问引入** — 寻找具有汽车行业合规背景的外部顾问(IATF/ISO 45001/PIPL 方向) +- [ ] **6.3 GPU 服务器资源评估** — 私有化部署 LLM 所需算力(至少 A100 80G × 2 起步),与客户 IT 确认采购或租用方案 +- [ ] **6.4 项目里程碑与交付计划制定** — 对齐三阶段路线,拆分 Sprint 计划: + + | 阶段 | 周期 | 交付目标 | + |------|------|----------| + | 第一阶段 | 0 - 3 个月 | 知识库 + 基础问答上线 | + | 第二阶段 | 3 - 6 个月 | 文档审查 + API 集成完成 | + | 第三阶段 | 6 - 12 个月 | EHS 隐患识别 + 个性化推荐全面上线 | + +--- + +## 七、产品与 POC 验证 + +- [ ] **7.1 构建最小知识库原型** — 接入 GB 7258、GB 18384、AQ/T 系列、IATF 16949 等核心法规,验证检索效果 +- [ ] **7.2 搭建问答 Demo** — 实现 5 个典型问答场景: + + | 场景类型 | 示例问题 | + |----------|----------| + | 法规解读 | 纯电 SUV 需满足哪些 GB 强制认证要求? | + | 政策查询 | 2025 年 NEV 积分核算方式有哪些最新变化? | + | 合规判断 | 供应商 A 的 REACH 声明是否满足采购合规要求? | + | 多跳推理 | ISO 45001 变更管理要求,对应哪些内部流程需更新? | + | 对比分析 | GB 18384 与欧盟 ECE R100 在电池安全上有哪些差异? | + +- [ ] **7.3 文档审查 POC** — 选取一类文档(如供应商 REACH 声明),跑通"上传 → 解析 → 比对 → 报告"完整流程 +- [ ] **7.4 POC 评估指标定义** — 检索准确率、响应时延、引文溯源率、用户满意度等量化指标 +- [ ] **7.5 Demo 演示材料制作** — 面向车企客户的产品演示脚本与样例数据准备 + +--- + +## 八、商务与法律 + +- [ ] **8.1 商业模式确认** — SaaS 订阅制 vs 私有化一次性部署 vs 混合模式,定价策略讨论 +- [ ] **8.2 目标客户名单整理** — 优先级排序:一汽、上汽、比亚迪、吉利等整车厂 + 头部 Tier1 供应商 +- [ ] **8.3 保密协议(NDA)模板准备** — 与客户开展需求访谈前签署 +- [ ] **8.4 法规数据版权风险评估** — 确认商业使用 GB/ISO 标准的合法性,规避版权侵权风险 + +--- + +## 当前最高优先级(本周内启动) + +| 优先级 | 任务编号 | 任务内容 | 负责人 | 截止日期 | +|--------|----------|----------|--------|----------| +| 🔴 P0 | 2.1 | 法规数据源供应商调研 | TBD | TBD | +| 🔴 P0 | 3.6 | 技术架构图绘制 | TBD | TBD | +| 🔴 P0 | 1.1 | 客户访谈计划制定 | TBD | TBD | +| 🔴 P0 | 7.1 | 最小知识库原型搭建 | TBD | TBD | +| 🟠 P1 | 4.1 | 私有化部署方案设计 | TBD | TBD | +| 🟠 P1 | 6.1 | 核心团队组建 | TBD | TBD | +| 🟡 P2 | 8.1 | 商业模式确认 | TBD | TBD | +| 🟡 P2 | 5.1 | API 接口规范文档起草 | TBD | TBD |