很多 agent 的问题不是“不会回答”,而是“建议太多”。输出看起来聪明,执行起来却不落地。这就是 suggestion pollution:建议密度高、可执行密度低。
如何判断系统进入建议污染
| 信号 | 现象 |
|---|---|
| 建议条数持续上升 | 但执行率不升反降 |
| 用户追问增加 | 反复问“所以我现在做什么” |
| 人工接管上升 | 团队要帮用户把建议翻译成动作 |
本质是输出目标错了:系统在追求“看起来全面”,而不是“帮助完成任务”。
先约束输出协议,再调模型
建议给高频任务定义输出协议:
- 结论不超过 3 条
- 每条结论必须带行动步骤
- 每条行动步骤必须带前置条件
- 无法执行时明确给出缺失信息
没有协议,模型会默认“多写一点更安全”。
失败案例:优化建议页变成信息洪水
某运营 agent 每次给出 15 条以上优化建议,团队执行率不到 20%。改成“3 条优先建议 + 每条一条最小动作 + 一个风险提示”后,执行率显著提升,追问下降。
建议污染治理清单
- 给每类任务定义最大建议条数
- 建议必须绑定可执行动作
- 对“泛化建议”设拒绝规则
- 指标看建议执行率,而非建议数量
- 周度复盘 Top 污染模板并下线
延伸阅读:


