Claude Opus 4.7 正式发布：编程能力提升 13%，更可靠的长任务执行

draft.md - Claude Opus 4.7 发布

基于已整理草稿生成的网页版文章，适合先稳定落地，再做局部润色与发布检查。

如果你用 Claude 写代码，过去最难的任务可能需要反复调整、频繁干预。Opus 4.7 想解决这个问题。

4月17日，Anthropic 正式发布 Claude Opus 4.7。这是 Anthropic 目前"通用可用"的最强模型——比它更强的 Mythos Preview 目前只对少数合作伙伴开放。对于大多数用户来说，Opus 4.7 就是最能干的 Claude。

比上一代强在哪？

Opus 4.7 的核心提升在三个方向：编程、图像分析、指令遵循。

编程能力是最明显的改进。在 Anthropic 内部的 93 项编程基准测试中，Opus 4.7 的完成率比 Opus 4.6 提升了 13%，还解决了 4 项 Opus 4.6 无法完成的任务。简单说，那些之前需要你盯着、反复提示才能完成的复杂编程任务，现在更容易"一次跑完"。

Cursor 的测试结果印证了这一点：在 CursorBench 上，Opus 4.7 的通过率是 70%，而 Opus 4.6 只有 58%。这意味着在实际编程场景中，模型更能理解你的意图，不容易走偏。

图像分析也有明显进步。Opus 4.7 支持更高分辨率的图片输入——最高可达 2576 像素，是之前的三倍多。对于需要分析图表、截图、设计稿的场景，这个提升很实用。以前模糊的细节现在能看清了。

指令遵循变得更严格。之前的模型有时会"自作聪明"，跳过你要求的某些步骤。Opus 4.7 更倾向于按你的指令执行。这对自动化任务尤其重要——你不想让 AI 在关键步骤上"自作主张"。

不只是基准测试，多家企业已经给出了实际使用反馈。

Notion 团队发现，Opus 4.7 在多步骤工作流中更可靠：复杂任务的完成率提升 14%，工具调用错误减少三分之一。对于需要自动化执行的任务，这意味着更少的人工干预。

Devin（AI 编程代理）团队则提到，Opus 4.7 能"连贯地工作数小时"，不容易半途放弃。这种持续性对于长时间运行的任务很重要——比如重构一个大型代码库，模型不会在中途突然"不知道该做什么了"。

Vercel 团队注意到一个有趣的变化：Opus 4.7 会"在开始工作前先做证明"。这是一个新的行为——以前模型可能会直接开始写代码，现在它会先验证思路是否正确。这减少了"写了一半发现方向错了"的情况。

Opus 4.7 引入了新的网络安全防护机制。它会自动检测和阻止潜在的恶意请求——比如生成攻击代码、绕过安全限制等。对于企业用户来说，这是一个重要的保障。

定价与 Opus 4.6 相同：

这个价格在顶级模型中属于中等水平——比 GPT-5.4 xhigh 便宜，但比 Sonnet 系列贵。

可用性方面，Opus 4.7 已经在 Claude API、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 上线。如果你用的是这些平台，应该已经可以切换到新模型了。

Anthropic 最近还有一个更受关注的模型：Mythos Preview。这是一个网络安全专用模型，能发现操作系统和浏览器中的漏洞，目前只对 Nvidia、Apple、JPMorgan 等合作伙伴开放。

Opus 4.7 比 Mythos Preview 弱——官方承认在所有评估中 Mythos Preview 都更强。但 Opus 4.7 的优势是"通用可用"：不需要特殊申请，没有访问限制。

简单说：如果你追求极致能力，关注 Mythos Preview 的后续动态；如果你需要一个可靠的日常工具，Opus 4.7 是当前的最佳选择。

开发者：尤其是需要处理复杂编程任务的团队。重构大型代码库、调试难以追踪的问题、实现多步骤自动化——这些场景能明显感受到改进。

数据分析师：Opus 4.7 在处理复杂图表、文档方面更强。如果你需要 AI 帮你理解密集的报表或技术文档，更高的图像分辨率会派上用场。

企业用户：新的安全机制让 Opus 4.7 更适合在生产环境中使用。如果你的团队担心 AI 可能被滥用或产生安全问题，这个版本增加了额外的保护层。

如果你已经在用 Opus 4.6，升级到 4.7 是顺理成章的选择。定价不变、能力提升，没有明显的负面影响。

如果你用的是 Sonnet 系列，Opus 4.7 可能有些"大材小用"——除非你的任务确实需要更强的推理能力。日常的代码补全、简单问答，Sonnet 依然够用。

总体来说，Opus 4.7 是一次稳健的升级。它没有颠覆性的变化，但在关键场景上做得更好。对于依赖 Claude 进行开发工作的人来说，这是一个好消息。

---

*信息来源：Anthropic 官方博客、The Verge*