独立后处理器(轻量集成)
新增 rag_eval/advisor/ 包,run_scenario() 末尾调用一行 maybe_run_advisor(result, scenario)。
文件结构:
rag_eval/advisor/__init__.pyrag_eval/advisor/rules.py— 规则引擎,输入 score_rows,输出诊断列表rag_eval/advisor/llm_analyzer.py— 把规则诊断 + 低分样本交给 judge_modelrag_eval/advisor/writer.py— 写 optimization_advice.md,打日志摘要
优点
- 改动最小,runner.py 只加 3 行
- advisor 完全独立,可单独测试
- 与现有分层架构完全吻合
缺点
- 无法拿到 per-metric 的原始 NaN 率(需从 score_rows 重新算)