前言
2025 年被许多人称为 “Agent 之年”,越来越多的企业和开发者开始投入到构建 AI Agent 的工作中。近日,Anthropic 公司发布了一篇重磅博客,详细探讨了如何构建高效的 Agent,并分享了他们在这一领域的最新研究成果。
这篇长达 18000 词的博客的重点如下。
总的来说就是简单 > 复杂
在构建 LLM Agent 时,最成功的实现使用了基本的可组合模式。
从简单开始!只有在需要时才增加复杂性。许多应用仅凭单次 LLM 调用和信息检索就能正常工作。
我的看法:Agent 框架在构建 Agent 模式时非常有用,因为它避免了我们需要重新发明轮子的麻烦。
Workflow & Agent
🔄 两种主要的 Agent 系统类型:
- Workflow(工作流):预定义路径
- Agent:动态的、自主引导的系统
🔍 Workflow 模式的关键:
- Prompt chaining(提示链)
- Routing(路由)
- Parallelization(并行化)
- Orchestrator-workers(协调者-工作者模式)
- Evaluator-optimizer(评估者-优化者模式)
详解如下 👇
💡Prompt chaining(提示链)
顺序进行的 LLM 调用,其中一个输出作为另一个输入——比如先写内容再翻译。
最适用于有明确子任务的任务,例如:
- 写作 + 翻译内容
- 先创建大纲,再生成完整文档
🔀 Routing(路由)
初始 LLM 决定由哪个专门的模型处理任务,特别适用于根据复杂度对查询进行分类。
在处理不同类型的输入时表现尤为出色:
- 客服查询
- 基于任务难度的分配
⚡️ Parallelization(并行化)
将任务拆分成并行的子任务,或者使用多个 LLM 对答案进行投票。
主要有两种形式:
- 分块(Sectioning):将任务拆分为多个子任务
- 投票(Voting):通过多次尝试获得更高的信心
🎯 Orchestrator-Workers(协调者-工作者模式)
可以将其视为一个中央指挥,领导着由专门 AI 工作者组成的乐团。
协调者的角色:
- 动态拆解复杂任务
- 将任务委派给工作者 LLM
- 将工作者的结果综合成连贯的输出
适用于:需要跨多个文件进行修改的复杂编程项目
🎭 Evaluator-Optimizer(评估者-优化者模式)
该模式创建了一个反馈循环,其中:
- 一个 LLM 生成回应
- 另一个 LLM 评估并提供反馈
- 这个过程反复进行,直到满足质量目标
适用于:文学翻译和需要多轮优化的复杂搜索任务
🎯 Agent 最适合:
- 开放性问题
- 需要灵活性的任务
- 需要自主决策的情况
⚠️ 请记住:Agent 系统以更高的成本和潜在的错误换取自主性。在实际应用之前,一定要在沙盒环境中进行充分测试。
🎮 工具设计至关重要!将 ACI(Agent-Computer Interface,Agent-计算机接口)的设计视为与人机接口(HCI)同样重要的工作。
总结
✅ 三大核心原则:
- 保持简单
- 保持透明
- 设计清晰的工具文档
🎯 最终总结:成功并不在于复杂性,而在于为你的需求构建正确的系统。从简单开始,进行测量,只有在需要时再扩展规模。