Devin 推出 Agentic MapReduce：用分布式架构让 Agent 真正读遍全仓库

基于已整理草稿生成的网页版文章，适合先稳定落地，再做局部润色与发布检查。

7月1日，Cognition（Devin 背后的团队）发布了一个新架构——Agentic MapReduce。它要解决的核心问题是：当 coding agent 需要处理整个代码仓库时，大部分算力不是花在"改代码"上，而是花在"找代码"上。

单 Agent 的瓶颈

让一个 agent 扫描五万文件的仓库并修复所有问题，会碰到三个麻烦：

第一，探索消耗预算。 Agent 反复 grep、打开错文件、回溯、重新决定下一步看什么。在一个大仓库里，"找哪里要改"比"怎么改"花的时间多得多。

第二，上下文成为瓶颈。 一个长跑 agent 会把前面发现的代码背在身上，越跑越慢，不相关的信息互相争夺注意力。

第三，没有覆盖边界。 Agent 自己决定"做完了"就停——不是扫描完了停，是"觉得差不多了"就停。

研究数据佐证了这一点。Zhang et al. 在 2026 年的 FastContext 论文中分析了 300 条 coding agent 轨迹，发现超过 56% 的工具调用和接近 47% 的主 agent token 都花在了读取和搜索上。

Agentic MapReduce 借用了分布式系统中经典的 MapReduce 思路，但做了一个关键反转：经典 MapReduce 用手写指令处理全部输入，而这里 agent 只负责需要推理的部分，其余交给确定性程序。

架构分四个阶段：

| 阶段 | 做什么 | 是否用 Agent |

|------|--------|-------------|

| Plan | Agent 研究仓库，编写"选择器" | ✅ |

| Shard | 选择器对全仓库确定性扫描，匹配文件分批 | ❌ |

| Map | 每批一个 agent，并行推理 | ✅ |

| Reduce | Agent 汇总去重，输出最终结果 | ✅ |

核心原则：推理的地方用 agent，其他地方用程序。

Plan 阶段 agent 产出的"选择器"（selector）是整个架构的关键。选择器是一种确定性的相关性测试——写好之后不需要模型参与，直接跑遍全仓库。

不同任务用不同类型的选择器：

选择器跑完后，没命中任何信号的文件直接排除，不会进入后续的 Map 阶段。这一步把需要 agent 深度分析的范围从"整个仓库"缩小到"只包含相关代码的有限批次"。

Agentic MapReduce 的第一个产品是 Security Swarm——安全扫描。它的工作流程：

Plan 阶段 agent 编写安全相关的选择器
选择器确定性扫描全仓库，找出所有路由、认证边界、危险调用等
Map 阶段每个 agent 分析一个批次
Reduce 阶段汇总所有发现
额外一步运行时验证：对每个发现启动一个沙箱 session 复现，标记为 Confirmed（已确认）、False Positive（误报）或 Inconclusive（不确定）

确认的漏洞可以直接交给 Devin 修复，自动生成修复 PR。这比传统 SAST 工具只能报不能修进了一步。

有用的场景：

不需要的场景：

当前局限：

Agentic MapReduce 不是又一个"换个模型"的更新，而是一个架构层面的创新。它把"agent 应该做什么"和"程序应该做什么"的边界画清楚了——agent 负责需要判断和推理的环节，确定性程序负责可枚举的扫描和分片。

这种思路可能会影响整个 coding agent 赛道。目前大多数 agent 产品都在拼模型能力，但 agent 的效率瓶颈往往不在模型够不够聪明，而在架构是否合理。Agentic MapReduce 给了一个可参考的答案。

---

*基于 Cognition 官方博客文章整理。原文：[Agentic MapReduce | Devin](https://devin.ai/blog/agentic-map-reduce)*

说明：该页面由基础模板稳定生成，后续可继续局部润色样式或补充模块，再进入发布检查。