多智能体系统工作前沿汇总

https://zhuanlan.zhihu.com/p/1950212759796049358

AgentDropout:Dynamic Agent Elimination for Token-Efficient, High-Performance Collaboration(ACL 2025)
这篇论文提出在多轮对话与推理过程中动态“淘汰”冗余 agent 与通信边,从而压缩推理成本。该机制在不同任务中节省了约 20% 以上的 token 使用,同时保持甚至提升性能,并展现良好的迁移性。

链接:https://arxiv.org/abs/2503.18891

上面这篇还挺有意思

Chain of Agents: Large Language Models Collaborating on Long-Context Tasks(2025)

这篇论文提出了 Chain-of-Agents (CoA) 框架,把长文本任务拆分给一系列顺序衔接的智能体处理,每个智能体只需关注自己的一小块内容,并通过通信单元传递关键信息,最后由管理智能体整合输出。这样既能避免窗口过大导致的“lost-in-the-middle”问题,又比单纯截断或检索方法更全面高效,在问答、摘要、代码等任务上都显著优于现有基线。

链接:https://openreview.net/pdf?id=LuCLf4BJsr

上面这篇想法也太自然了。。。不过没啥创新

多智能体这个现在基本上模式比较固定,没有太多可以优化的地方了。其核心点还是大模型本身的能力不足,无法做到对复杂任务的拆解,导致整体的实验效果还有真实场景下的应用都不达预期。

而对于基座模型的迭代,这个只能依靠OpenAI或者Anthropic去更新和发展。因此,需要另辟蹊径去考虑创新点。

比如,

1、大小模型的协同,让大模型分配和规划任务,然后让小模型去完成任务;

2、长期记忆如何保存和存取

3、智能体之间的反思、迭代,是否可以自行升级和优化原始的工作流

4、GUI Agent

不过从我的经验来说,现在这种多智能体还是处于实验室发论文的阶段,讲究一个速度,你不快点发,别人就水差不多了。