AI agent 平台在扩张期最容易被奖励的动作,是不断上线新能力。新模型、新 prompt、新连接器、新自动化工作流,每一项都容易被看见价值。可平台做久之后,真正拖住速度的往往不是新能力上线慢,而是旧能力下不掉。过时的 prompt 还在被部分租户依赖,老连接器虽然没人愿意维护却仍挂在生产里,历史工作流看起来用量不高,却一旦直接关掉就会把某批客户的 run 一起带崩。
这类问题之所以会变严重,是因为多数团队把下线当成“以后找个窗口删掉”而不是一条需要设计的迁移路径。能力上线时有路标、有版本、有推广;能力退场时却常常只剩一个内部共识:这东西应该淘汰了。等真正动手才发现,谁在用、为什么还在用、替代路径是什么、停掉后客户会不会失去关键能力,这些问题都还没被系统回答过。
所以 capability deprecation 和 sunset migration 真正要解决的,不是让平台更保守,而是让系统拥有健康的新陈代谢。没有退场机制的平台,最终一定会被历史能力拖住:不敢清理、不敢简化、也不敢升级,因为任何动作都可能在看不见的角落伤到还在依赖旧世界的客户。
建议配合 AI agent Version Set Pinning 与 Rollback、AI agent Tenant Config Bundle 与 Override Governance、AI agent Maintenance Window 与 Change Freeze 和 AI agent Customer-Facing Incident Communication 一起看。
先分清:deprecated、frozen、sunset,不是同义词
| 状态 | 应该表达什么 | 对客户意味着什么 |
|---|---|---|
| Deprecated | 已不建议新增使用,但现有依赖仍能跑 | 应开始迁移,别再基于它扩新流程 |
| Frozen | 只做必要修复,不再继续扩能力 | 平台会保守维护,但不会再给长期承诺 |
| Sunset | 已进入明确下线窗口 | 客户必须在截止前迁走或接受停用 |
很多平台下线失败,恰恰是因为这三个阶段混在一起。内部觉得某能力“差不多等于没了”,客户却还以为它只是暂时不再推荐。状态语义一旦混乱,后面的沟通、迁移和支持就都会一起混乱。
真正的下线工作,第一步不是发公告,而是先把依赖图画出来
一个能力看起来使用量不高,不代表它可以轻松删掉。你至少要知道:
- 哪些租户、哪些 workflow、哪些历史 run 还引用它
- 哪些配置、模板和例外规则仍在围绕它存在
- 有没有替代路径,以及替代路径在质量、权限、成本上有没有新边界
- 一旦停用,支持和客户成功团队会收到哪一类后果
很多团队是在准备关的时候才去查这些依赖,结果越查越不敢动。因为平台从来没把能力生命周期作为正式对象管理过,自然也不会自动知道旧能力到底长出了多少旁支。
Sunset migration 最怕的不是客户不配合,而是平台自己没有可执行过渡方案
平台很容易把下线问题理解成“通知客户就好了”。现实里客户真正关心的不是你为什么想下线,而是:
- 他们现在在用什么替代物
- 迁过去之后会不会失去某些边缘能力
- 有没有双跑窗口可以验证质量和结果一致性
- 若迁移失败,是否还能暂时回到旧能力
如果这些问题没有答案,再合理的下线理由也会被客户视为平台把内部成本转嫁给他们。能力退场真正需要的是 migration plan,而不是只靠一封公告和一个日期。
一个常见事故:平台觉得这只是清理历史包袱,客户感受到的却是突然失能
某团队准备下线一条旧的文档生成工作流。内部判断很自然:新版本能力更强,旧工作流调用量也不高,而且维护成本偏高。可上线窗口一到,几个看似边缘的租户突然出现连续失败。后来才查清楚,这些租户不是没迁,而是他们的历史模板和例外配置一直绑定着旧工作流的某些特定参数语义。平台只做了功能替换,没有做参数级兼容和双跑验证,结果“下线旧能力”直接变成了“客户现网任务突然跑不动”。
团队最终补的,不只是回滚,还包括完整的 deprecation registry:任何进入 sunset 的能力都必须先登记依赖租户、替代路径、双跑窗口、冻结日期和最终停用日期;若替代路径还不能完整承接关键用例,状态只能停在 deprecated,不得进入 sunset。
如果你现在只能先补一层,先把下线也当成一种正式发布
很多平台对发布已经很成熟,对下线却仍然像在做清理杂物。更值得先补的是把 deprecation 和 sunset 当成正式发布流程的一部分:有版本状态、有对外语义、有迁移窗口、有回滚路径、有成功判定。只要这件事还停留在“内部觉得差不多可以删了”,平台就会继续被历史能力绑架。
AI agent 平台真正成熟的一面,不只是越来越会加东西,而是越来越敢安全地下线旧东西。因为能让能力有序退场,系统才有空间继续进化,而不是永远被自己过去的决定拖住。
延伸阅读:


