Agent 是一个 AI 系统,能够通过对工具使用和流程控制做出决策来自主执行任务。与遵循预定义路径的传统自动化不同,Agents 可以根据上下文和中间结果动态调整其方法。Agents 也与副驾驶(例如传统聊天应用程序)不同,它们可以完全自动化任务,而不是简单地增强和扩展人类输入。
- Agents → 非线性、非确定性(每次运行都可能改变)
- Workflows → 线性、确定性执行路径
- Co-pilots → 需要人工干预的增强 AI 助手
如果这是您第一次使用或与 Agents 交互,这个例子将说明 Agent 在预订假期这样的情境中是如何工作的。如果您已经熟悉这个主题,请继续阅读。
想象您正在尝试预订假期。您需要研究航班、寻找酒店、查看餐厅评价并跟踪您的预算。
传统自动化系统遵循预定的序列:
- 接受特定输入(日期、位置、预算)
- 按固定顺序调用预定义的 API 端点
- 基于硬编码标准返回结果
- 当出现意外情况时无法适应
Co-pilot 作为智能助手:
- 基于您的偏好提供酒店和行程推荐
- 能够理解和响应自然语言查询
- 提供指导和建议
- 需要人类决策和执行操作
Agent 结合了 AI 的判断能力和调用相关工具来执行任务的能力。Agent 的输出将是非确定性的,考虑到:
- 实时可用性和价格变化
- 约束条件的动态优先级排序
- 从故障中恢复的能力
- 基于中间结果的自适应决策
Agent 可以动态生成行程并执行预订,类似于您对旅行社的期望。
- 决策引擎: 通常是 LLM(大语言模型),决定行动步骤
- 工具集成: Agent 可以利用的 API、函数和服务
- 记忆系统: 维护上下文并跟踪任务进度
Agents 在以下连续循环中运行:
- 观察 当前状态或任务
- 规划 要采取的行动,使用 AI 进行推理
- 执行 使用可用工具执行这些行动(通常是 API 或 MCPs ↗)
- 学习 从结果中学习(将结果存储在记忆中,更新任务进度,并为下一次迭代做准备)
- @2025 Cloudflare Ubitools
- Cf Repo