BotOf Tech
返回首页Agent 开发技术正在从“静态流程图”进化到“自适应编排”

Agent 开发技术正在从“静态流程图”进化到“自适应编排”

·2 分钟阅读·

Agent 开发技术最近三个月最值得注意的进化之一,是大家开始认真反思:

为什么很多多 Agent 系统看起来很复杂,效果却不稳定?

一个越来越清楚的答案是:

  • Agent 数量变多,不代表效果更好
  • 静态拓扑不一定适合每个 query
  • 很多系统的问题不是 agent 不够多,而是 orchestration 太死

旧路线:先画好流程图,再让所有 query 走同一条路

这其实是很多多 Agent demo 的默认做法:

  • planner
  • researcher
  • writer
  • reviewer

看起来很完整,但问题是:

  • 每个任务都走同一拓扑
  • 角色分工是提前写死的
  • query 变化了,系统结构却不变

当任务复杂度、领域和信息密度都不同的时候,这种静态结构很容易失效。

新信号之一:HERA 直接把“拓扑是否该变化”当研究对象

2026 年 4 月,DAIR.AI 在 X 上转发了一个很有代表性的工作:HERA

这项工作的切点非常明确:

  • 认为 static orchestration 是 multi-agent RAG 的瓶颈
  • 不只优化 prompt
  • 还优化 query-specific agent topology

它的想法可以概括成:

  • 全局层:针对 query 选择或进化更合适的 agent 拓扑
  • 局部层:优化单个 agent 的角色提示和行为

这和传统“固定多 agent pipeline”是完全不同的思路。

新信号之二:MAS-Orchestra 也在问“什么时候多 Agent 才真的有用”

2 月 18 日,Salesforce AI Research 在 X 上介绍 MAS-Orchestra 时提到一个我很认同的问题:

多 Agent 并不天然优于单 Agent。

这个说法非常关键,因为过去一年很多系统默认假设:

  • more agents = better performance

而 MAS-Orchestra 强调的是:

  • 用明确的方法去量化 multi-agent 的收益
  • 研究 degree of MAS
  • 不只是堆 agent,而是让 orchestration 更合理

这代表多 Agent 研发开始从“造结构”走向“测收益”。

为什么这件事和现实产品强相关

因为在真实系统里,多 Agent 的代价并不低:

  • 更高延迟
  • 更高 token 成本
  • 更高失败组合概率
  • 更难 debug

所以真正的问题从来不是“能不能做多 Agent”,而是:

  • 什么任务该并行
  • 什么任务该串行
  • 什么任务只要 evaluator-optimizer
  • 什么任务干脆别上 multi-agent

这和最近主流框架的演化其实是同一个方向

最近这些框架的官方文档,已经能看出一些共同趋势:

  • Google ADK 明确区分 workflow agents 和 LLM agents
  • Microsoft Agent Framework 同时提供 agents 和 workflows
  • Strands 强调 agents-as-tools 的层级组织
  • OpenAI Agents SDK 更强调 harness / workspace / subagent execution

这说明行业在慢慢形成一个共识:

orchestration 不是“写几条 prompt”,而是一层独立的系统设计问题。

我觉得接下来会发生什么

多 Agent 技术接下来大概率会继续往三个方向演化:

1. query-aware topology

不同问题动态选择不同编排结构。

2. role adaptation

同一个 agent 角色不再固定,由系统根据任务上下文微调。

3. orchestration evals

不再只评模型答案,而是评:

  • 拓扑是否过度复杂
  • 哪个角色最常拖后腿
  • 何时单 Agent 反而更优

我的判断

过去很多人把 Agent 开发理解成:

  • 选模型
  • 接工具
  • 写 prompt

但最近三个月越来越清楚的一点是:

真正的下一层竞争力,是 orchestration engineering。

也就是:

  • 任务如何拆
  • 角色如何分
  • 何时并行
  • 何时回退
  • 何时根本不需要多 Agent

这层做得好,系统才会从“好看的 demo”走向“可持续的产品”。

来源