Claude Opus 4.7 正式发布:编程能力提升 13%,更可靠的长任务执行
draft.md - Claude Opus 4.7 发布
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
如果你用 Claude 写代码,过去最难的任务可能需要反复调整、频繁干预。Opus 4.7 想解决这个问题。
4月17日,Anthropic 正式发布 Claude Opus 4.7。这是 Anthropic 目前"通用可用"的最强模型——比它更强的 Mythos Preview 目前只对少数合作伙伴开放。对于大多数用户来说,Opus 4.7 就是最能干的 Claude。
比上一代强在哪?
Opus 4.7 的核心提升在三个方向:编程、图像分析、指令遵循。
编程能力是最明显的改进。在 Anthropic 内部的 93 项编程基准测试中,Opus 4.7 的完成率比 Opus 4.6 提升了 13%,还解决了 4 项 Opus 4.6 无法完成的任务。简单说,那些之前需要你盯着、反复提示才能完成的复杂编程任务,现在更容易"一次跑完"。
Cursor 的测试结果印证了这一点:在 CursorBench 上,Opus 4.7 的通过率是 70%,而 Opus 4.6 只有 58%。这意味着在实际编程场景中,模型更能理解你的意图,不容易走偏。
图像分析也有明显进步。Opus 4.7 支持更高分辨率的图片输入——最高可达 2576 像素,是之前的三倍多。对于需要分析图表、截图、设计稿的场景,这个提升很实用。以前模糊的细节现在能看清了。
指令遵循变得更严格。之前的模型有时会"自作聪明",跳过你要求的某些步骤。Opus 4.7 更倾向于按你的指令执行。这对自动化任务尤其重要——你不想让 AI 在关键步骤上"自作主张"。
实际表现如何?
不只是基准测试,多家企业已经给出了实际使用反馈。
Notion 团队发现,Opus 4.7 在多步骤工作流中更可靠:复杂任务的完成率提升 14%,工具调用错误减少三分之一。对于需要自动化执行的任务,这意味着更少的人工干预。
Devin(AI 编程代理)团队则提到,Opus 4.7 能"连贯地工作数小时",不容易半途放弃。这种持续性对于长时间运行的任务很重要——比如重构一个大型代码库,模型不会在中途突然"不知道该做什么了"。
Vercel 团队注意到一个有趣的变化:Opus 4.7 会"在开始工作前先做证明"。这是一个新的行为——以前模型可能会直接开始写代码,现在它会先验证思路是否正确。这减少了"写了一半发现方向错了"的情况。
安全和定价
Opus 4.7 引入了新的网络安全防护机制。它会自动检测和阻止潜在的恶意请求——比如生成攻击代码、绕过安全限制等。对于企业用户来说,这是一个重要的保障。
定价与 Opus 4.6 相同:
- 输入:每百万 token 5 美元
- 输出:每百万 token 25 美元
这个价格在顶级模型中属于中等水平——比 GPT-5.4 xhigh 便宜,但比 Sonnet 系列贵。
可用性方面,Opus 4.7 已经在 Claude API、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 上线。如果你用的是这些平台,应该已经可以切换到新模型了。
和 Mythos Preview 的关系
Anthropic 最近还有一个更受关注的模型:Mythos Preview。这是一个网络安全专用模型,能发现操作系统和浏览器中的漏洞,目前只对 Nvidia、Apple、JPMorgan 等合作伙伴开放。
Opus 4.7 比 Mythos Preview 弱——官方承认在所有评估中 Mythos Preview 都更强。但 Opus 4.7 的优势是"通用可用":不需要特殊申请,没有访问限制。
简单说:如果你追求极致能力,关注 Mythos Preview 的后续动态;如果你需要一个可靠的日常工具,Opus 4.7 是当前的最佳选择。
对谁有用?
开发者:尤其是需要处理复杂编程任务的团队。重构大型代码库、调试难以追踪的问题、实现多步骤自动化——这些场景能明显感受到改进。
数据分析师:Opus 4.7 在处理复杂图表、文档方面更强。如果你需要 AI 帮你理解密集的报表或技术文档,更高的图像分辨率会派上用场。
企业用户:新的安全机制让 Opus 4.7 更适合在生产环境中使用。如果你的团队担心 AI 可能被滥用或产生安全问题,这个版本增加了额外的保护层。
值得升级吗?
如果你已经在用 Opus 4.6,升级到 4.7 是顺理成章的选择。定价不变、能力提升,没有明显的负面影响。
如果你用的是 Sonnet 系列,Opus 4.7 可能有些"大材小用"——除非你的任务确实需要更强的推理能力。日常的代码补全、简单问答,Sonnet 依然够用。
总体来说,Opus 4.7 是一次稳健的升级。它没有颠覆性的变化,但在关键场景上做得更好。对于依赖 Claude 进行开发工作的人来说,这是一个好消息。
---
*信息来源:Anthropic 官方博客、The Verge*