# ===== LLM 连接配置(RAGAS 评测 + 生成) ===== # 所有模型共用同一个 OpenAI 兼容 endpoint # 在 Web 控制台的「LLM 配置」页面可以保存多个命名配置, # 并在运行评估时按角色(Judge / Answer / Dataset)分别选择覆盖。 OPENAI_API_KEY=your-api-key OPENAI_BASE_URL=http://6.86.80.4:30080/v1 OPENAI_TIMEOUT_SECONDS=180 # 默认评测模型(可在场景 YAML 或 Web 控制台 LLM 配置中覆盖) # RAGAS_JUDGE_MODEL 需支持 OpenAI 兼容 chat.completions + 结构化 JSON 输出 # RAGAS_LLM_MAX_TOKENS 控制 Judge 评分链路的 completion budget;faithfulness 等 # 结构化指标在 GPT-5 系列上通常需要 4096 或更高,避免 IncompleteOutputException RAGAS_JUDGE_MODEL=gpt-5 RAGAS_EMBEDDING_MODEL=text-embedding-3-small RAGAS_LLM_MAX_TOKENS=4096 # 评估并发控制(启用 7 个指标时建议 RAGAS_METRIC_TIMEOUT_SECONDS=300) BATCH_SIZE=8 RAGAS_METRIC_TIMEOUT_SECONDS=300 # ===== 阿里云文档解析(dataset build 功能需要) ===== ALIBABA_ACCESS_KEY_ID= ALIBABA_ACCESS_KEY_SECRET= ALIBABA_ENDPOINT=docmind-api.cn-hangzhou.aliyuncs.com ALIYUN_PARSE_POLL_INTERVAL_SECONDS=5 ALIYUN_PARSE_TIMEOUT_SECONDS=900 ALIYUN_PARSE_LAYOUT_STEP_SIZE=50 ALIYUN_LLM_ENHANCEMENT=true ALIYUN_ENHANCEMENT_MODE=VLM DOCUMENT_PARSE_ARTIFACT_PREFIX=outputs/dataset-builds PARSER_FAILURE_MODE=fail # 生成题库时使用的模型(可在 Web 控制台 LLM 配置中按场景覆盖) DATASET_GENERATOR_MODEL=qwen3.6-plus # ===== Dify 集成 — 实时评分 API ===== # 为 /api/score 端点设置 Bearer Token 鉴权(留空则不鉴权,适合内网部署) # Dify 外部 Tool 配置 Authorization: Bearer <此处填写相同值> SCORE_API_TOKEN=