AI agent 人工审批控制台设计：证据、风险、可选动作和恢复入口怎么呈现

很多 AI agent 系统都说支持 Human-in-the-Loop，但实际给人工的只是一个按钮：批准或拒绝。真正到现场用时，这种设计几乎一定会出问题。因为人工接管时最想知道的不是“我要不要点通过”，而是：

agent 为什么在这里停下
它依据了哪些证据
当前风险在哪里
如果我拒绝或修改，会从哪一步继续

人工审批控制台的作用，不是让人替 agent 背锅，而是让人能在最短时间内做出高质量决策。

建议先配合 Human-in-the-Loop 审批流设计、AI agent Artifact 设计、AI agent Policy Engine 规则分层和 AI agent Checkpoint 与断点恢复一起看。

先给结论：控制台至少回答 4 个问题

问题	控制台必须给出什么
为什么停在这里	风险原因、policy 命中、当前状态
依据是什么	evidence、artifact、上下文摘要
我能做什么	approve / reject / edit / reroute
做完以后会怎样	恢复入口、下一状态、副作用预览

如果这 4 个问题答不清，审批动作就只能靠经验和运气。

再进一步，控制台不只是一个详情页，它还是一个“把任务分配给合适的人，并在有限时间内完成决策”的操作系统入口。所以除了单页信息结构，还要考虑队列分流、权限和 SLA。

一、顶部先给“当前决策卡片”，不要一开始堆全部细节

人工进入控制台后，第一眼应该先看到一个 summary：

{
  "runId": "run_123",
  "status": "waiting_review",
  "reason": "high risk external send",
  "nextActionIfApproved": "send_message_and_update_status",
  "nextActionIfRejected": "return_to_draft",
  "riskLevel": "high"
}

这张卡片的作用是帮助审核者 5 秒内知道自己正在审什么，而不是立刻掉进日志海里。

一个更完整的决策卡片，最好再补上：

业务优先级
剩余处理 SLA
当前建议动作的风险等级
审批后将释放的外部副作用数量

这样审核者不仅知道“在审什么”，还知道“要先审哪个”。

二、证据区要展示“为什么这样建议”，而不是只贴最终结果

证据区建议按层显示：

区块	看什么
输入摘要	用户请求、任务类型、关键约束
evidence	检索来源、工具结果摘要
draft / proposal	agent 当前建议动作
policy hits	为什么被拦到 review

如果只展示最终建议，人工依然要靠猜测来判断是否靠谱。

如果 evidence 很多，控制台最好默认先展示“证据摘要 + 命中原因”，再允许展开原始片段，而不是一上来堆满全文。人工审批的瓶颈常常不是信息不够，而是信息太多却没有优先级。

三、可选动作不要只有 approve / reject

很多任务最需要的是“有条件批准”或“先改再继续”。一个更实用的动作集合：

动作	适用场景
approve	可以原样继续
reject	当前方案不可接受
edit_and_resume	小改后继续
reroute_to_human	直接人工接管后续流程
request_more_input	先向用户追问

审批控制台本质上是恢复入口，不只是同意或否决入口。

同时，动作是否可见也应该受角色和权限控制。例如：

角色	可执行动作
reviewer	approve / reject
senior reviewer	approve / reject / edit_and_resume
operator	reroute_to_human / request_more_input

否则控制台看起来功能很全，实际上谁都能做过大的动作。

四、每个动作都要告诉人“系统接下来会怎么跑”

例如 approve 可能意味着：

发送外发消息
更新任务状态
写入审计记录

而 edit_and_resume 可能意味着：

生成新 draft version
回到 validate 状态
重新经过 policy check

如果控制台不展示这些后果，人工是在盲签。

更稳的做法是把每个动作都渲染成“操作表单 + 影响预览”，至少包含：

恢复到哪个 checkpoint
会生成或替换哪些 artifact
会重新跑哪些 policy
会触发哪些外部副作用

当动作后果被结构化展示后，审批质量通常会比单靠经验明显稳定。

五、控制台最好支持“基于 artifact 的局部修改”

人工最常见的需求不是重写整份结果，而是：

换一条 evidence
改一个参数
删除一个高风险动作
修改外发文案

因此控制台最好围绕 artifact 操作，而不是围绕一个大文本框：

review proposal
  -> inspect evidence
  -> edit draft field
  -> confirm policy impact
  -> resume from checkpoint

这会比“复制全文到输入框里改一遍”稳定得多。

如果 edit_and_resume 会改动结构化字段，最好在提交前先做局部校验和 policy 预演，而不是等恢复后再报错。否则人工刚做完修改，又会被系统弹回，审批体验会非常差。

六、控制台最好先做队列分流，而不是让所有人看同一池任务

真正上线后，review console 的问题往往先出在入口，而不是详情页。建议至少按这些维度分流：

分流维度	示例
风险等级	high / critical
业务域	外发、内容发布、数据修改
所需权限	普通审批、资深审批、运营处理
SLA 紧急度	15 分钟内、1 小时内

分流做得好，才能让合适的人看到合适的任务，而不是所有待审项都挤在一个列表里。

七、上线后要看审批链路指标

一个成熟的 review console，建议持续观察：

指标	用途
平均首响时间	判断队列分流是否有效
审批完成时长	判断界面是否足够帮助快速决策
edit_and_resume 使用率	判断控制台是否支持真实协作
审批后回滚率	判断审批质量是否稳定
因信息不足被 reroute 的比例	判断证据展示是否充分

如果审批时长很长，同时 reroute 比例也很高，通常说明控制台不是缺按钮，而是缺上下文和分流。

八、失败案例：审批人只看到“请确认发送”，看不到发送依据

一个通知 Agent 在发消息前会进入人工确认，但控制台只显示一句“是否发送给客户”。审批人看不到来源、看不到当前状态、也看不到外发文案为什么这么写。

后来一次错误发送发生后，团队追查发现：

evidence 没有展示
policy 命中原因没展示
approve 后会触发的副作用没展示

修复后，控制台改为“决策卡片 + evidence + proposal + action impact”四块布局，审批时间反而缩短，因为审核者不再需要反复问系统管理员“这一步到底在干什么”。

九、Review Console Checklist

结语

AI agent 的人工审批控制台，不是一个“把锅交给人”的页面，而是一个帮助人快速理解上下文、判断风险、做出修改并让系统稳定恢复的入口。设计得好，人工接管会变成系统能力的一部分；设计得差，人工只会成为最后一道混乱的补丁。

AI agent 人工审批控制台设计：证据、风险、可选动作和恢复入口怎么呈现

先给结论：控制台至少回答 4 个问题

一、顶部先给“当前决策卡片”，不要一开始堆全部细节

二、证据区要展示“为什么这样建议”，而不是只贴最终结果

三、可选动作不要只有 approve / reject

四、每个动作都要告诉人“系统接下来会怎么跑”

五、控制台最好支持“基于 artifact 的局部修改”

六、控制台最好先做队列分流，而不是让所有人看同一池任务

七、上线后要看审批链路指标

八、失败案例：审批人只看到“请确认发送”，看不到发送依据

九、Review Console Checklist

结语

相关标签

相关文章推荐

Cursor 快捷键速查表（macOS/Windows）：从“会用”到“能提效”的 10 个工作流

Cursor vs GitHub Copilot vs VS Code：怎么选、怎么搭配、怎么把风险关在笼子里

AI 辅助调试与问题排查：让 AI 成为你的调试搭档