Files
AIRegulations-doc/AI合规智能中枢_项目前期TODO.md

132 lines
7.3 KiB
Markdown
Raw Normal View History

2026-04-08 16:59:07 +08:00
# AI 合规智能中枢 — 项目前期 TODO 清单
> 面向车企与工厂 | 项目管理视角 | 2026 Q2 启动阶段
---
## 一、业务调研与需求确认
- [ ] **1.1 客户访谈** — 与目标车企/工厂的 EHS、法务、采购、研发部门核心用户逐一开展需求访谈收集真实痛点与使用场景优先级
- [ ] **1.2 竞品调研** — 调研国内外现有合规 SaaS 工具如律商联讯、北大法宝、iManage 等),明确差异化定位
- [ ] **1.3 客户合规现状摸底** — 了解客户当前法规管理流程(手动/Excel/SharePoint评估切换成本与接受度
- [ ] **1.4 POC 场景筛选** — 从 EHS 隐患识别、文档合规审查、法规问答三大场景中,选取 2~3 个优先做 POC 验证
---
## 二、法规数据源与供应商
- [ ] **2.1 调研国内法规数据库供应商**,候选包括:
- 国家标准全文公开系统(免费)
- 工标网、标准云(标准文本采购)
- 北大法宝、威科先行(法规全文库商业授权)
- 工信部 MIIT 官网、国家生态环境部(免费但需爬取)
- [ ] **2.2 调研国际法规数据来源**
- UN-ECE 法规(联合国欧洲经济委员会官网,免费)
- EUR-Lex 欧盟法规(免费 API
- ISO/IEC 标准(付费采购,确认版权许可)
- IATF 16949、ISO 45001ASQ/BSI 商业授权)
- [ ] **2.3 签订数据商务合同** — 明确授权范围、更新频率、数据格式PDF/XML/结构化)
- [ ] **2.4 法规变更监控服务评估** — 是否采购第三方变更推送服务如法规宝、JunGo或自建爬虫 + 监控
---
## 三、技术栈选型与架构设计
- [ ] **3.1 向量数据库选型**候选Milvus、Weaviate、Qdrant、PGVector私有化部署友好性为首要考量
- [ ] **3.2 LLM 底座选型**
- 私有部署Qwen2.5、DeepSeek-R1、ChatGLM满足数据不出厂要求
- 云端备选GPT-4o、Claude 3.5(针对非敏感场景)
- [ ] **3.3 Embedding 模型选型** — 中英双语嵌入模型BGE-M3、text-embedding-3-large 等)
- [ ] **3.4 RAG 框架选型** — LlamaIndex vs LangChain vs 自研评估混合检索BM25 + 语义向量)支持能力
- [ ] **3.5 OCR 引擎选型** — 版面感知 OCR候选PaddleOCR、Azure Document Intelligence、Textract
- [ ] **3.6 绘制整体技术架构图**,包含:
- 数据采集层(爬虫 / 文件上传 / API 对接)
- 处理层OCR → 分块 → Embedding → 入库)
- 检索层BM25 + 语义混合 + 知识图谱)
- 生成层LLM + 引文锚定 + 置信度评分)
- 集成层PLM/ERP/OA/MES API
- 权限层RBAC + 数据分区)
- [ ] **3.7 绘制数据流图** — 从法规入库到用户问答的完整链路
- [ ] **3.8 知识图谱技术选型** — Neo4j vs TigerGraph vs NebulaGraph确认多跳推理方案
---
## 四、私有化部署与安全合规
- [ ] **4.1 私有化部署方案设计** — 满足 PIPL/DSL 数据主权要求,确认"数据不出厂"的技术实现路径
- [ ] **4.2 与客户 IT 安全团队对齐** — 确认服务器环境K8s/Docker、网络隔离策略、日志审计要求
- [ ] **4.3 数据分级方案设计** — 内部文档(保密/内部/公开)三级分类标准确定
- [ ] **4.4 RBAC 权限矩阵细化** — 对照合规管理员/法务专员/EHS工程师/采购专员等角色,落实细粒度权限清单
- [ ] **4.5 安全审计日志方案** — 操作日志、查询日志的留存策略与查阅权限
---
## 五、系统集成与 API 设计
- [ ] **5.1 API 接口规范文档起草**,包括以下四类接口的入参/出参/鉴权规范:
- `POST /compliance/check` — 大文本分片合规检查
- `POST /compliance/upload` — PDF/Word 文件上传审查
- `GET /compliance/query` — 法规知识库问答
- `POST /compliance/subscribe` — 法规变更 Webhook 订阅
- [ ] **5.2 PLM/ERP/OA/MES 集成预调研** — 与客户 IT 确认各系统版本(如 SAP、用友、金蝶、接口协议REST/SOAP/文件传输)、集成可行性
- [ ] **5.3 消息推送渠道接入评估** — 企业微信 Bot、飞书 Bot、钉钉 Bot、Teams Bot 的接入难度与审批流程
- [ ] **5.4 Webhook 订阅机制设计** — 法规变更推送的订阅粒度(按法规域/业务线/角色)
---
## 六、团队与资源规划
- [ ] **6.1 核心团队组建** — 明确所需角色AI 算法工程师RAG/NLP、后端工程师、法规领域专家、产品经理、实施顾问
- [ ] **6.2 法规领域顾问引入** — 寻找具有汽车行业合规背景的外部顾问IATF/ISO 45001/PIPL 方向)
- [ ] **6.3 GPU 服务器资源评估** — 私有化部署 LLM 所需算力(至少 A100 80G × 2 起步),与客户 IT 确认采购或租用方案
- [ ] **6.4 项目里程碑与交付计划制定** — 对齐三阶段路线,拆分 Sprint 计划:
| 阶段 | 周期 | 交付目标 |
|------|------|----------|
| 第一阶段 | 0 - 3 个月 | 知识库 + 基础问答上线 |
| 第二阶段 | 3 - 6 个月 | 文档审查 + API 集成完成 |
| 第三阶段 | 6 - 12 个月 | EHS 隐患识别 + 个性化推荐全面上线 |
---
## 七、产品与 POC 验证
- [ ] **7.1 构建最小知识库原型** — 接入 GB 7258、GB 18384、AQ/T 系列、IATF 16949 等核心法规,验证检索效果
- [ ] **7.2 搭建问答 Demo** — 实现 5 个典型问答场景:
| 场景类型 | 示例问题 |
|----------|----------|
| 法规解读 | 纯电 SUV 需满足哪些 GB 强制认证要求? |
| 政策查询 | 2025 年 NEV 积分核算方式有哪些最新变化? |
| 合规判断 | 供应商 A 的 REACH 声明是否满足采购合规要求? |
| 多跳推理 | ISO 45001 变更管理要求,对应哪些内部流程需更新? |
| 对比分析 | GB 18384 与欧盟 ECE R100 在电池安全上有哪些差异? |
- [ ] **7.3 文档审查 POC** — 选取一类文档(如供应商 REACH 声明),跑通"上传 → 解析 → 比对 → 报告"完整流程
- [ ] **7.4 POC 评估指标定义** — 检索准确率、响应时延、引文溯源率、用户满意度等量化指标
- [ ] **7.5 Demo 演示材料制作** — 面向车企客户的产品演示脚本与样例数据准备
---
## 八、商务与法律
- [ ] **8.1 商业模式确认** — SaaS 订阅制 vs 私有化一次性部署 vs 混合模式,定价策略讨论
- [ ] **8.2 目标客户名单整理** — 优先级排序:一汽、上汽、比亚迪、吉利等整车厂 + 头部 Tier1 供应商
- [ ] **8.3 保密协议NDA模板准备** — 与客户开展需求访谈前签署
- [ ] **8.4 法规数据版权风险评估** — 确认商业使用 GB/ISO 标准的合法性,规避版权侵权风险
---
## 当前最高优先级(本周内启动)
| 优先级 | 任务编号 | 任务内容 | 负责人 | 截止日期 |
|--------|----------|----------|--------|----------|
| 🔴 P0 | 2.1 | 法规数据源供应商调研 | TBD | TBD |
| 🔴 P0 | 3.6 | 技术架构图绘制 | TBD | TBD |
| 🔴 P0 | 1.1 | 客户访谈计划制定 | TBD | TBD |
| 🔴 P0 | 7.1 | 最小知识库原型搭建 | TBD | TBD |
| 🟠 P1 | 4.1 | 私有化部署方案设计 | TBD | TBD |
| 🟠 P1 | 6.1 | 核心团队组建 | TBD | TBD |
| 🟡 P2 | 8.1 | 商业模式确认 | TBD | TBD |
| 🟡 P2 | 5.1 | API 接口规范文档起草 | TBD | TBD |