探索 人工智能

AI 编程实践、提示词工程、LLM 集成与前端智能化开发技巧

73 篇文章
持续更新
AI Agent 成本控制与预算治理:Token、工具、并发如何算账
2026年3月30日 · 13 分钟阅读

AI Agent 成本控制与预算治理:Token、工具、并发如何算账

AI Agent 的成本不只来自模型调用,还来自重试、并发、工具、回放和失败 run。本文给出预算分层、成本指标、失败案例和治理清单,帮助你把 Agent 从“能跑”变成“跑得起”。

AI Agent成本控制预算治理Token
AI Agent Eval Dataset 构建指南:怎样做一套能发现退化的测试集
2026年3月30日 · 14 分钟阅读

AI Agent Eval Dataset 构建指南:怎样做一套能发现退化的测试集

很多 AI Agent 团队有日志,也有线上投诉,但没有真正能复用的评测集。本文讲清 Eval Dataset 应该怎么抽样、写断言、做基线和持续回归,帮助你把“感觉变差了”变成可验证的退化信号。

AI AgentEval DatasetEvaluationRegression Testing
AI Agent 评估框架完全指南:从离线 Eval 到线上 Guardrail
2026年3月30日 · 14 分钟阅读

AI Agent 评估框架完全指南:从离线 Eval 到线上 Guardrail

没有评估框架的 AI Agent,只能靠感觉迭代。本文拆解离线 Eval、线上 Guardrail、分层指标、失败样本回放和发布前清单,帮助你把“看起来能跑”的 Agent 变成可验证系统。

AI AgentEval评估框架工程化
Human-in-the-Loop 审批流设计:什么时候必须让人接管 Agent
2026年3月30日 · 13 分钟阅读

Human-in-the-Loop 审批流设计:什么时候必须让人接管 Agent

真正危险的 Agent 事故,往往不是答错一句话,而是在错误时机自动执行。本文讲清 Human-in-the-Loop 的触发条件、审批流结构、失败案例和上线清单,帮助你决定哪些步骤必须让人接管。

AI AgentHuman in the Loop审批流风险控制
AI Agent 事故响应手册:超时、幻觉、越权、重试风暴怎么止血
2026年3月30日 · 14 分钟阅读

AI Agent 事故响应手册:超时、幻觉、越权、重试风暴怎么止血

AI Agent 的线上事故往往不是单点错误,而是模型、工具、状态机和权限一起连锁失效。本文给出事故分级、止血步骤、回放重点和值班清单,帮助团队在出事时先稳住系统。

AI AgentIncident Response故障处理可观测性
AI Agent 记忆淘汰与摘要策略:上下文放不下时,什么该留下
2026年3月30日 · 14 分钟阅读

AI Agent 记忆淘汰与摘要策略:上下文放不下时,什么该留下

长会话 Agent 的问题从来不是“要不要记忆”,而是“哪些记忆该留下,哪些必须淘汰”。本文讲清记忆分层、淘汰规则、摘要策略和失败案例,帮助你控制上下文长度而不牺牲任务质量。

AI AgentMemoryContext ManagementSummarization
AI Agent 可观测性设计:Trace、日志、指标、回放怎么串起来
2026年3月30日 · 15 分钟阅读

AI Agent 可观测性设计:Trace、日志、指标、回放怎么串起来

AI Agent 的可观测性不是多打一层日志,而是把 run、状态、工具、策略和回放串成一条可诊断链路。本文给出最小 tracing 结构、字段设计、故障定位方法和上线前清单。

AI Agent可观测性Tracing日志
AI Agent Session Replay 调试指南:如何复盘一次失败 Run 的每个决策
2026年3月30日 · 13 分钟阅读

AI Agent Session Replay 调试指南:如何复盘一次失败 Run 的每个决策

线上 Agent 问题如果只能看聊天记录,基本查不清。本文讲清 Session Replay 该记录什么、如何复盘模型决策、怎样把 replay 用在定位退化和事故复盘里。

AI AgentSession ReplayDebuggingTracing
AI Agent 状态机设计指南:把 Run 生命周期做成可控系统
2026年3月30日 · 14 分钟阅读

AI Agent 状态机设计指南:把 Run 生命周期做成可控系统

Agent 不该只是聊天记录的堆叠,而应该是可转移、可回滚、可观测的状态机。本文讲清 Run 生命周期设计、状态边界、失败恢复与验收指标,帮助你把 Agent 从 Demo 变成系统。

AI Agent状态机Run 生命周期工程化
...
共 73 篇文章,当前第 1/9 页