Files
atlas-zero-agent/atlas-zero-agent-design.md
2026-04-21 23:16:39 +08:00

15 KiB
Raw Permalink Blame History

Atlas Zero Agent 设计草案

1. 项目目标

atlas-zero-agent 目标是做成一个通用的 chatbox agent 平台:

  • 对用户来说,它首先是一个好用的聊天入口,支持普通对话、工具调用、长期上下文和知识检索。
  • 对系统来说,它不只是一个单轮聊天接口,而是一个可编排、可扩展、可观测的 agent runtime。
  • 对工程实现来说,它希望同时吸收 LangChain 的组件化能力,以及 harness agent 一类系统在任务执行、工具编排、状态管理上的特性。

一句话定位:

一个以聊天为入口、以 agent runtime 为核心、以多人格分工为产品语言的通用智能体系统。

2. 贝加庞克分身设定

《海贼王》蛋头岛篇里,贝加庞克把自己的不同人格侧面拆成了多个 satellites。本体叫 Stella,分身共有 6 个:

  • Shaka
  • Lilith
  • Edison
  • Pythagoras
  • Atlas
  • York

这些分身本质上不是完全独立的新角色,而是同一个超级科学家不同侧面的拆分与外化。这一点和 agent 设计非常契合,因为一个完整 agent 往往也会被拆成:规划、执行、记忆、安全、探索、资源调度等不同能力模块。

3. 分身名称、性格与来源

下面的“来源”分两层理解:

  • 第一层是 One Piece 设定中的人格侧面。
  • 第二层是角色名字在现实世界中可能对应的神话、历史人物、哲学家或文化意象。

需要说明的是:作品中“人格职责”是明确设定;而“名字来源”很多属于高概率命名致敬或常见解读,不一定都有作者正式逐条说明。

3.1 Shaka

  • 作品内定位:Good,代表“善”
  • 角色气质:冷静、克制、规则感强、像总控和秩序维护者
  • 常见名字来源解读:
    • 最常见的理解是来自 Shaka,也就是日语中对释迦牟尼的称呼之一,关联佛教中的理性、觉悟、秩序与道德判断。
    • 也有一些二级解读会联系到其他历史人物或天体命名,但核心印象仍然是“理性、正面、克制”。
  • 适合映射的 agent 角色:
    • 安全策略 agent
    • 系统规则 agent
    • 审核与 guardrails agent
    • 风险判定 agent

为什么适合:

  • 一个通用 chat agent 不能只有能力,还必须有边界。
  • Shaka 很适合做“是否允许继续执行”“是否触发敏感操作确认”“是否需要降级回答”的决策层。

3.2 Lilith

  • 作品内定位:Evil,代表“恶”
  • 角色气质:激进、冒险、追求结果、手段不那么保守
  • 常见名字来源解读:
    • Lilith 在美索不达米亚与犹太传统里常被视为带有黑暗、反叛、原初女性恶魔等色彩的形象。
    • 在现代流行文化中,Lilith 也常被用来代表“不服从、危险、诱惑、边界突破”。
  • 适合映射的 agent 角色:
    • 探索型 agent
    • 实验型 agent
    • 自主搜索与假设验证 agent
    • “尝试不同路径” 的发散 agent

为什么适合:

  • 很多 agent 系统失败,不是因为不会回答,而是不会“试”。
  • Lilith 可以承担更激进的探索任务,例如多路搜索、失败重试、方案比较、信息侦察。
  • 但她不应拥有最终批准权,最好受 Shaka 约束。

3.3 Edison

  • 作品内定位:Think,代表“想”
  • 角色气质:灵感驱动、发明导向、快速出点子
  • 常见名字来源解读:
    • 明确对应现实中的发明家 Thomas Edison
    • 象征发明、工程实现、原型驱动、把抽象想法落成机制。
  • 适合映射的 agent 角色:
    • 规划型 agent
    • 工具编排 agent
    • 工作流生成 agent
    • 任务分解与步骤生成 agent

为什么适合:

  • 你的系统如果想兼具 LangChain 与 harness 风格,就需要一个专门负责“把用户目标转为可执行步骤”的角色。
  • Edison 很适合做 planner决定先检索、再调用工具、再总结或者什么时候需要拆任务并回写状态。

3.4 Pythagoras

  • 作品内定位:Wisdom,代表“知”
  • 角色气质:整理、分析、汇总、把知识结构化
  • 常见名字来源解读:
    • 明确对应古希腊哲学家、数学家 Pythagoras
    • 象征数学、结构、抽象、归纳、规律与知识体系。
  • 适合映射的 agent 角色:
    • 知识库 agent
    • RAG agent
    • memory agent
    • 数据分析与事实整理 agent

为什么适合:

  • 一个“通用 chatbox agent”如果没有稳定的记忆和知识管理就很容易变成只会临场生成文本的壳。
  • Pythagoras 非常适合负责检索、重排、引用、会话摘要、长期记忆写入与知识组织。

3.5 Atlas

  • 作品内定位:Violence,代表“暴”
  • 角色气质:行动直接、执行果断、解决问题优先
  • 常见名字来源解读:
    • 最直观来源是希腊神话中的巨人 Atlas,常见印象是“扛起天空的人”。
    • 这个名字还有“地图册、承载世界结构”的延伸含义,但在角色气质上更突出的是力量、承担、推进。
  • 适合映射的 agent 角色:
    • 执行型 agent
    • 行动派 agent
    • 工具调用 agent
    • 任务落地 agent

为什么适合:

  • 如果 Edison 负责想,Atlas 就负责做。
  • 她最适合做实际执行层,例如调用工具、跑工作流、操作外部服务、提交任务结果。
  • 对你的项目名来说,Atlas 也很强,因为它兼具力量感和工程执行感。

3.6 York

  • 作品内定位:Greed,代表“欲”
  • 角色气质:偏向资源占用、需求满足、为整体系统承担身体性与消耗性工作
  • 常见名字来源解读:
    • York 的来源没有前几个那么明确,常见解读并不统一。
    • 从作品功能上看,她更像“欲望 / 需求 / 资源消耗”的人格化承载体。
    • 也有一些解读会把它和天体、地名或科学人物关联,但都不如她在故事中的“欲望代理”功能重要。
  • 适合映射的 agent 角色:
    • 资源调度 agent
    • 队列与吞吐 agent
    • 成本控制 agent
    • 配额、缓存、优先级管理 agent

为什么适合:

  • 一个能跑起来的 agent 系统,除了会想、会做,还要知道“资源够不够、应该先跑谁、哪个模型值得调用、要不要缓存”。
  • York 非常适合负责 token 成本、模型路由、任务队列、优先级、配额和后台任务管理。

3.7 Stella

  • 作品内定位:本体
  • 名称含义:Stella 在拉丁语中有“星”之意
  • 适合映射的系统角色:
    • 主控人格
    • 对外统一身份
    • 路由入口
    • 多 agent 聚合层

为什么适合:

  • 用户不一定需要直接知道背后有多少子 agent。
  • 对外可以统一叫 Atlas Zero Agent,内部再由 Stella 作为总入口路由到不同分身能力。

4. 推荐的命名分工方案

如果你准备把这套世界观真正用进产品,我建议不要把这些名字只当作皮肤,而是让它们对应真实职责。

4.1 推荐的一号方案

  • Stella:主控入口 / orchestrator
  • Atlas:执行型 agent
  • Edison:规划与工具编排 agent
  • Pythagoras记忆、RAG、知识整理 agent
  • Shaka:安全、审核、边界控制 agent
  • Lilith:探索、实验、侦察 agent
  • York:资源、成本、队列调度 agent

这个方案的优点:

  • 人设和能力匹配度高。
  • 后续做多 agent 扩展时可自然拆模块。
  • 即使后面只实现其中 2 到 3 个角色,也不会浪费命名体系。

4.2 适合你的产品表达方式

对外产品文案可以写成:

  • Atlas Zero 是统一对话入口。
  • 内部由多个 satellite agents 协同工作。
  • 用户默认只看到一个 chatbox但系统会自动路由到最合适的能力模块。

这样既保留世界观,也不会把产品做得过度复杂。

5. 项目架构建议

你的目标不是单纯搭一个聊天接口,而是做一个“通用 agent 平台”。所以架构上建议分成六层。

5.1 总体分层

  1. Interface Layer
  2. Application Layer
  3. Agent Runtime Layer
  4. Knowledge and Memory Layer
  5. Tool and Integration Layer
  6. Observability and Governance Layer

5.2 各层职责

Interface Layer

建议技术:FastAPI

职责:

  • 提供聊天接口
  • 提供流式响应接口,建议支持 SSE
  • 提供会话管理接口
  • 提供 agent 配置与调试接口
  • 未来可扩展 WebSocket

建议接口:

  • POST /api/chat
  • POST /api/chat/stream
  • GET /api/sessions/{session_id}
  • POST /api/sessions/{session_id}/messages
  • GET /api/agents
  • POST /api/agents/run
  • GET /api/health

Application Layer

职责:

  • 处理 API 请求与响应模型
  • 维护会话上下文
  • 调用 orchestrator
  • 统一错误处理
  • 做鉴权、租户、多用户隔离

这一层尽量不要直接写复杂推理逻辑,而是作为业务编排层。

Agent Runtime Layer

建议技术:LangGraph + LangChain

职责:

  • 管理多 agent 状态流转
  • 管理 planner、executor、memory、safety 等节点
  • 支持可中断、可恢复、可追踪执行
  • 统一处理工具调用结果
  • 支持多步任务执行

为什么这里建议 LangGraph 而不是只用 LangChain

  • LangChain 适合组件和工具接线。
  • LangGraph 更适合处理 agent 的状态机、分支、恢复、checkpoint 和长任务。
  • 你的目标已经超出简单 chain更接近一个小型 runtime。

Knowledge and Memory Layer

职责:

  • 会话短期记忆
  • 用户长期记忆
  • 文档知识库检索
  • 摘要压缩
  • 事实缓存和向量检索

建议拆成三类存储:

  • Session Store:保存对话消息和运行状态
  • Memory Store:保存用户长期偏好、画像、任务历史
  • Vector Store:保存 RAG 文档嵌入和检索索引

适合由 Pythagoras 主导。

Tool and Integration Layer

职责:

  • 封装本地工具
  • 封装外部 API
  • 封装搜索、数据库、文件、浏览器等工具
  • 统一工具协议和权限边界

这层适合由 Atlas 执行、由 Edison 编排。

如果后面要做得更像现代 agent 平台,可以预留:

  • MCP 兼容层
  • sandbox 执行层
  • 第三方 connectors

Observability and Governance Layer

职责:

  • trace
  • prompt 版本管理
  • tool call 日志
  • token 和成本统计
  • 审计与安全策略
  • 人工接管与审批

这层很关键,因为真正可用的 agent 系统一定需要可观测性,而不是只有“能回话”。

ShakaYork 最适合共同负责这一层。

6. 推荐的内部多 agent 结构

如果以“单 chatbox多内部人格”的方式实现建议这样组织

6.1 最小闭环版本

  • Stella Router
  • Edison Planner
  • Atlas Executor
  • Pythagoras Memory
  • Shaka Guard

这是最适合第一阶段落地的组合。

对应流程:

  1. 用户输入进入 Stella Router
  2. Shaka Guard 先做风险检查与权限判断
  3. Edison Planner 生成执行步骤
  4. Pythagoras Memory 补充上下文、检索记忆与知识
  5. Atlas Executor 调用工具或执行动作
  6. Stella Router 汇总结果并输出给用户

6.2 第二阶段扩展

新增:

  • Lilith Explorer
  • York Resource Manager

用途:

  • Lilith 用于多路探索、网络搜索、候选方案试探、故障 fallback
  • York 用于模型路由、预算控制、优先级与后台任务调度

7. 推荐的目录结构

如果你准备用 FastAPI + LangGraph + LangChain,我建议从下面这个目录开始,而不是一上来就堆太多文件。

atlas-zero-agent/
  app/
    api/
      routes/
        chat.py
        sessions.py
        agents.py
      schemas/
        chat.py
        session.py
        agent.py
    core/
      config.py
      logging.py
      security.py
    runtime/
      orchestrator.py
      state.py
      graph.py
    agents/
      stella.py
      atlas.py
      edison.py
      pythagoras.py
      shaka.py
      lilith.py
      york.py
    memory/
      session_store.py
      memory_store.py
      vector_store.py
      summarizer.py
    tools/
      registry.py
      web_search.py
      browser.py
      filesystem.py
      knowledge.py
    services/
      chat_service.py
      session_service.py
      agent_service.py
    observability/
      tracing.py
      metrics.py
      audit.py
    main.py
  docs/
    architecture.md
    agents.md
  tests/
    test_chat_api.py
    test_runtime_flow.py
    test_memory.py
  pyproject.toml
  README.md

这个结构的重点:

  • api 只管接口
  • runtime 只管状态流转和 orchestrator
  • agents 只放角色级逻辑
  • memorytools 独立,方便后续扩展
  • observability 独立,避免后期难补

8. 推荐的技术栈

8.1 后端核心

  • FastAPI:对外 API
  • Pydantic:请求响应模型与配置
  • LangChain模型、prompt、tools、retriever 抽象
  • LangGraph:多 agent 编排与状态管理
  • Uvicorn:服务运行

8.2 存储层

  • PostgreSQL:会话、用户、任务、审计
  • Redis:缓存、队列、短期状态
  • pgvector 或独立向量库RAG 检索

8.3 观测层

  • LangSmith:链路追踪和调试
  • OpenTelemetry:统一 trace/metrics
  • Prometheus + Grafana:运行指标

8.4 前端

  • 如果先做后端验证:先不急着做复杂前端
  • 如果要快速出 chatbox
    • Next.js
    • 或直接参考 langchain-ai/agent-chat-ui

9. 产品能力建议

你说的是“通用 chatbox agent”那我建议第一版不要贪多优先做下面这些能力

第一阶段必须有

  • 多轮对话
  • 流式输出
  • session 持久化
  • 工具调用
  • 基础 RAG
  • 安全拦截
  • trace 日志

第二阶段再加

  • 多 agent 协同
  • 用户长期记忆
  • 文件上传解析
  • 后台异步任务
  • 模型路由
  • 成本统计与预算限制

第三阶段再加

  • 人工审批
  • MCP 工具接入
  • 插件市场
  • 多租户
  • 可视化工作流

10. 命名建议结论

如果你希望这个项目既有故事感,又能长期演化,我建议这样定:

  • 项目总名:atlas-zero-agent
  • 对外产品名:Atlas Zero
  • 内部 orchestratorStella
  • 核心执行 agentAtlas
  • 规划 agentEdison
  • 记忆与知识 agentPythagoras
  • 安全与审查 agentShaka
  • 探索与实验 agentLilith
  • 资源与预算 agentYork

这样命名的好处是:

  • 有统一世界观
  • 每个名字都有明确职责
  • 后续做文档、UI、日志、trace 时都很好表达
  • 未来如果你要把系统从单 agent 进化到多 agent也不需要重命名

11. 最推荐的启动路线

如果现在就开始做,我建议按这个顺序推进:

  1. 先做 FastAPI 聊天接口和 SSE 流式输出
  2. 接入一个基础 LangChain chat model
  3. LangGraph 搭建 Stella -> Shaka -> Edison -> Pythagoras -> Atlas 的最小图
  4. 接入 session store 和基础 memory
  5. 接入 2 到 3 个最常用工具
  6. 增加 trace、审计和成本统计
  7. 最后再扩展 LilithYork

12. 一句话设计原则

Atlas Zero 不应该只是“会聊天的模型壳”,而应该是:

Atlas 为执行核心、以 Stella 为统一入口、以多分身协作为内部机制的通用 agent runtime。