很多团队优化 agent 延迟时,先压模型 token,再砍上下文,结果用户体感几乎没变化。根因是优化没打在关键路径上。
关键路径视角
在 DAG 里,总时长取决于最长依赖链,而不是节点平均耗时。
$$T_ = \max(\text{all path durations})$$
所以并行分支优化 30%,如果不在最长链上,对用户几乎无感。
预算分配模板
| 路径阶段 | 预算建议 |
|---|---|
| 计划编译 | 10% |
| 数据准备 | 20% |
| 推理与工具执行 | 50% |
| 审批与提交 | 20% |
这是起步模板,最终要按真实 trace 反推。
失败案例:优化了 5 个节点,关键链没变
某系统把 5 个并行节点优化 40%,看板“节点平均耗时”很漂亮,但用户等待时间几乎不降。后续发现关键链是“证据抓取 -> 规则评估 -> 人工审批”,于是把预算和优化资源集中在这条链,体感延迟才明显下降。
执行 Checklist
- 每个 run 能计算关键路径
- 预算按路径而非按模块分配
- 优化项必须标注是否命中关键链
- 看板默认展示关键路径贡献度
- 关键链变更后要重算预算
延伸阅读:


