多租户 agent 平台最难的问题,不是“能不能共享”,而是“哪些可以共享,哪些必须隔离”。只讲隔离会导致成本失控,只讲复用会导致风险外溢。
四层隔离模型
| 层级 | 必须隔离 | 可复用 |
|---|---|---|
| 身份层 | 租户身份、权限策略 | 认证框架能力 |
| 数据层 | 会话数据、日志明细 | 通用索引服务 |
| 工具层 | 凭证、配额、策略 | 工具定义模板 |
| 运行层 | 沙箱实例、网络边界 | 基础镜像与调度器 |
先定四层边界,再谈复用策略,能避免大量返工。
复用的正确单位:模板,不是状态
推荐复用:
- Prompt 模板
- 工具 schema 模板
- 运行基线镜像
不推荐跨租户复用:
- 会话状态
- 凭证缓存
- 审计流水
模板可复用,状态要隔离,这是平台可扩展的底线。
失败案例:共享缓存导致跨租户建议泄露
某平台为了降延迟共享会话缓存,结果出现跨租户语义污染。修复后改为租户级命名空间和缓存分区,并对高风险数据禁用跨租户缓存复用。
多租户治理 Checklist
- 身份、数据、工具、运行四层边界有文档化定义
- 所有缓存与队列都有租户命名空间
- 凭证代理层与租户权限绑定
- 跨租户只复用模板,不复用运行状态
- 出现隔离事件可在 30 分钟内追溯
延伸阅读:


