7.3 KiB
7.3 KiB
AI 合规智能中枢 — 项目前期 TODO 清单
面向车企与工厂 | 项目管理视角 | 2026 Q2 启动阶段
一、业务调研与需求确认
- 1.1 客户访谈 — 与目标车企/工厂的 EHS、法务、采购、研发部门核心用户逐一开展需求访谈,收集真实痛点与使用场景优先级
- 1.2 竞品调研 — 调研国内外现有合规 SaaS 工具(如律商联讯、北大法宝、iManage 等),明确差异化定位
- 1.3 客户合规现状摸底 — 了解客户当前法规管理流程(手动/Excel/SharePoint),评估切换成本与接受度
- 1.4 POC 场景筛选 — 从 EHS 隐患识别、文档合规审查、法规问答三大场景中,选取 2~3 个优先做 POC 验证
二、法规数据源与供应商
- 2.1 调研国内法规数据库供应商,候选包括:
- 国家标准全文公开系统(免费)
- 工标网、标准云(标准文本采购)
- 北大法宝、威科先行(法规全文库商业授权)
- 工信部 MIIT 官网、国家生态环境部(免费但需爬取)
- 2.2 调研国际法规数据来源:
- UN-ECE 法规(联合国欧洲经济委员会官网,免费)
- EUR-Lex 欧盟法规(免费 API)
- ISO/IEC 标准(付费采购,确认版权许可)
- IATF 16949、ISO 45001(ASQ/BSI 商业授权)
- 2.3 签订数据商务合同 — 明确授权范围、更新频率、数据格式(PDF/XML/结构化)
- 2.4 法规变更监控服务评估 — 是否采购第三方变更推送服务(如法规宝、JunGo),或自建爬虫 + 监控
三、技术栈选型与架构设计
- 3.1 向量数据库选型,候选:Milvus、Weaviate、Qdrant、PGVector(私有化部署友好性为首要考量)
- 3.2 LLM 底座选型:
- 私有部署:Qwen2.5、DeepSeek-R1、ChatGLM(满足数据不出厂要求)
- 云端备选:GPT-4o、Claude 3.5(针对非敏感场景)
- 3.3 Embedding 模型选型 — 中英双语嵌入模型(BGE-M3、text-embedding-3-large 等)
- 3.4 RAG 框架选型 — LlamaIndex vs LangChain vs 自研,评估混合检索(BM25 + 语义向量)支持能力
- 3.5 OCR 引擎选型 — 版面感知 OCR,候选:PaddleOCR、Azure Document Intelligence、Textract
- 3.6 绘制整体技术架构图,包含:
- 数据采集层(爬虫 / 文件上传 / API 对接)
- 处理层(OCR → 分块 → Embedding → 入库)
- 检索层(BM25 + 语义混合 + 知识图谱)
- 生成层(LLM + 引文锚定 + 置信度评分)
- 集成层(PLM/ERP/OA/MES API)
- 权限层(RBAC + 数据分区)
- 3.7 绘制数据流图 — 从法规入库到用户问答的完整链路
- 3.8 知识图谱技术选型 — Neo4j vs TigerGraph vs NebulaGraph,确认多跳推理方案
四、私有化部署与安全合规
- 4.1 私有化部署方案设计 — 满足 PIPL/DSL 数据主权要求,确认"数据不出厂"的技术实现路径
- 4.2 与客户 IT 安全团队对齐 — 确认服务器环境(K8s/Docker)、网络隔离策略、日志审计要求
- 4.3 数据分级方案设计 — 内部文档(保密/内部/公开)三级分类标准确定
- 4.4 RBAC 权限矩阵细化 — 对照合规管理员/法务专员/EHS工程师/采购专员等角色,落实细粒度权限清单
- 4.5 安全审计日志方案 — 操作日志、查询日志的留存策略与查阅权限
五、系统集成与 API 设计
- 5.1 API 接口规范文档起草,包括以下四类接口的入参/出参/鉴权规范:
POST /compliance/check— 大文本分片合规检查POST /compliance/upload— PDF/Word 文件上传审查GET /compliance/query— 法规知识库问答POST /compliance/subscribe— 法规变更 Webhook 订阅
- 5.2 PLM/ERP/OA/MES 集成预调研 — 与客户 IT 确认各系统版本(如 SAP、用友、金蝶)、接口协议(REST/SOAP/文件传输)、集成可行性
- 5.3 消息推送渠道接入评估 — 企业微信 Bot、飞书 Bot、钉钉 Bot、Teams Bot 的接入难度与审批流程
- 5.4 Webhook 订阅机制设计 — 法规变更推送的订阅粒度(按法规域/业务线/角色)
六、团队与资源规划
- 6.1 核心团队组建 — 明确所需角色:AI 算法工程师(RAG/NLP)、后端工程师、法规领域专家、产品经理、实施顾问
- 6.2 法规领域顾问引入 — 寻找具有汽车行业合规背景的外部顾问(IATF/ISO 45001/PIPL 方向)
- 6.3 GPU 服务器资源评估 — 私有化部署 LLM 所需算力(至少 A100 80G × 2 起步),与客户 IT 确认采购或租用方案
- 6.4 项目里程碑与交付计划制定 — 对齐三阶段路线,拆分 Sprint 计划:
阶段 周期 交付目标 第一阶段 0 - 3 个月 知识库 + 基础问答上线 第二阶段 3 - 6 个月 文档审查 + API 集成完成 第三阶段 6 - 12 个月 EHS 隐患识别 + 个性化推荐全面上线
七、产品与 POC 验证
-
7.1 构建最小知识库原型 — 接入 GB 7258、GB 18384、AQ/T 系列、IATF 16949 等核心法规,验证检索效果
-
7.2 搭建问答 Demo — 实现 5 个典型问答场景:
场景类型 示例问题 法规解读 纯电 SUV 需满足哪些 GB 强制认证要求? 政策查询 2025 年 NEV 积分核算方式有哪些最新变化? 合规判断 供应商 A 的 REACH 声明是否满足采购合规要求? 多跳推理 ISO 45001 变更管理要求,对应哪些内部流程需更新? 对比分析 GB 18384 与欧盟 ECE R100 在电池安全上有哪些差异? -
7.3 文档审查 POC — 选取一类文档(如供应商 REACH 声明),跑通"上传 → 解析 → 比对 → 报告"完整流程
-
7.4 POC 评估指标定义 — 检索准确率、响应时延、引文溯源率、用户满意度等量化指标
-
7.5 Demo 演示材料制作 — 面向车企客户的产品演示脚本与样例数据准备
八、商务与法律
- 8.1 商业模式确认 — SaaS 订阅制 vs 私有化一次性部署 vs 混合模式,定价策略讨论
- 8.2 目标客户名单整理 — 优先级排序:一汽、上汽、比亚迪、吉利等整车厂 + 头部 Tier1 供应商
- 8.3 保密协议(NDA)模板准备 — 与客户开展需求访谈前签署
- 8.4 法规数据版权风险评估 — 确认商业使用 GB/ISO 标准的合法性,规避版权侵权风险
当前最高优先级(本周内启动)
| 优先级 | 任务编号 | 任务内容 | 负责人 | 截止日期 |
|---|---|---|---|---|
| 🔴 P0 | 2.1 | 法规数据源供应商调研 | TBD | TBD |
| 🔴 P0 | 3.6 | 技术架构图绘制 | TBD | TBD |
| 🔴 P0 | 1.1 | 客户访谈计划制定 | TBD | TBD |
| 🔴 P0 | 7.1 | 最小知识库原型搭建 | TBD | TBD |
| 🟠 P1 | 4.1 | 私有化部署方案设计 | TBD | TBD |
| 🟠 P1 | 6.1 | 核心团队组建 | TBD | TBD |
| 🟡 P2 | 8.1 | 商业模式确认 | TBD | TBD |
| 🟡 P2 | 5.1 | API 接口规范文档起草 | TBD | TBD |