Devin 推出 Agentic MapReduce:用分布式架构让 Agent 真正读遍全仓库
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
7月1日,Cognition(Devin 背后的团队)发布了一个新架构——Agentic MapReduce。它要解决的核心问题是:当 coding agent 需要处理整个代码仓库时,大部分算力不是花在"改代码"上,而是花在"找代码"上。
单 Agent 的瓶颈
让一个 agent 扫描五万文件的仓库并修复所有问题,会碰到三个麻烦:
第一,探索消耗预算。 Agent 反复 grep、打开错文件、回溯、重新决定下一步看什么。在一个大仓库里,"找哪里要改"比"怎么改"花的时间多得多。
第二,上下文成为瓶颈。 一个长跑 agent 会把前面发现的代码背在身上,越跑越慢,不相关的信息互相争夺注意力。
第三,没有覆盖边界。 Agent 自己决定"做完了"就停——不是扫描完了停,是"觉得差不多了"就停。
研究数据佐证了这一点。Zhang et al. 在 2026 年的 FastContext 论文中分析了 300 条 coding agent 轨迹,发现超过 56% 的工具调用和接近 47% 的主 agent token 都花在了读取和搜索上。
MapReduce 思路:让 Agent 只做推理
Agentic MapReduce 借用了分布式系统中经典的 MapReduce 思路,但做了一个关键反转:经典 MapReduce 用手写指令处理全部输入,而这里 agent 只负责需要推理的部分,其余交给确定性程序。
架构分四个阶段:
| 阶段 | 做什么 | 是否用 Agent |
|------|--------|-------------|
| Plan | Agent 研究仓库,编写"选择器" | ✅ |
| Shard | 选择器对全仓库确定性扫描,匹配文件分批 | ❌ |
| Map | 每批一个 agent,并行推理 | ✅ |
| Reduce | Agent 汇总去重,输出最终结果 | ✅ |
核心原则:推理的地方用 agent,其他地方用程序。
选择器:连接推理和确定性的桥梁
Plan 阶段 agent 产出的"选择器"(selector)是整个架构的关键。选择器是一种确定性的相关性测试——写好之后不需要模型参与,直接跑遍全仓库。
不同任务用不同类型的选择器:
- 安全扫描:选择路由声明、认证边界、反序列化入口、危险 API 调用
- 破坏性变更检测:对比导出符号或生成的 API schema,选择受影响的消费方
- 代码质量:用 Tree-sitter 查询语法树中的废弃 API 或项目特定的反模式
- 大规模迁移:遍历 import 和引用,找到被替换接口的所有调用方
选择器跑完后,没命中任何信号的文件直接排除,不会进入后续的 Map 阶段。这一步把需要 agent 深度分析的范围从"整个仓库"缩小到"只包含相关代码的有限批次"。
首个落地:Security Swarm
Agentic MapReduce 的第一个产品是 Security Swarm——安全扫描。它的工作流程:
- Plan 阶段 agent 编写安全相关的选择器
- 选择器确定性扫描全仓库,找出所有路由、认证边界、危险调用等
- Map 阶段每个 agent 分析一个批次
- Reduce 阶段汇总所有发现
- 额外一步运行时验证:对每个发现启动一个沙箱 session 复现,标记为 Confirmed(已确认)、False Positive(误报)或 Inconclusive(不确定)
确认的漏洞可以直接交给 Devin 修复,自动生成修复 PR。这比传统 SAST 工具只能报不能修进了一步。
对谁有用,什么时候没用
有用的场景:
- 大仓库的全局性任务:安全扫描、代码质量检查、破坏性变更检测、大规模 API 迁移
- 需要"确定性覆盖"的团队——不希望 agent 觉得差不多了就停,而是要穷尽所有匹配
不需要的场景:
- 局部任务(修个 bug、加个接口)——传统 agent 就够了
- 小仓库——探索成本本来就不高
当前局限:
- 只在 Devin 平台内可用,没有开源
- 选择器质量完全依赖 Plan 阶段 agent 的判断,如果 agent 写了不合适的选择器,后续阶段也不会纠正
- Reduce 阶段仍然是单个 agent,如果 Map 阶段产出过多,可能遇到上下文瓶颈
为什么值得关注
Agentic MapReduce 不是又一个"换个模型"的更新,而是一个架构层面的创新。它把"agent 应该做什么"和"程序应该做什么"的边界画清楚了——agent 负责需要判断和推理的环节,确定性程序负责可枚举的扫描和分片。
这种思路可能会影响整个 coding agent 赛道。目前大多数 agent 产品都在拼模型能力,但 agent 的效率瓶颈往往不在模型够不够聪明,而在架构是否合理。Agentic MapReduce 给了一个可参考的答案。
---
*基于 Cognition 官方博客文章整理。原文:[Agentic MapReduce | Devin](https://devin.ai/blog/agentic-map-reduce)*
参考来源
说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。