Anthropic 发布 Claude Opus 4.8:2.5 倍提速、3 倍降本,动态工作流与 Effort 控制全面上线

分类: 生图平面类 |发布于: 5/29/2026 |最后更新: 5/29/2026
Anthropic 发布 Claude Opus 4.8:2.5 倍提速、3 倍降本,动态工作流与 Effort 控制全面上线

Anthropic 发布 Claude Opus 4.8:2.5 倍提速、3 倍降本,动态工作流与 Effort 控制全面上线

基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。

Anthropic 于 5 月 28 日正式发布旗舰模型 Claude Opus 4.8。这是继今年早些时候 Opus 4.7 之后的又一次重大迭代,核心卖点是速度提升 2.5 倍、推理成本降低 3 倍,同时引入动态工作流和用户可控的 effort 设置两项新功能。基于多家媒体转述整理。

性能与可靠性:更快、更便宜、更诚实

Opus 4.8 在 Opus 4.7 基础上做了全面优化。Anthropic 表示,早期测试者反馈该模型在 agentic 任务中的判断力更强、可靠性更高。

几个关键改进:

  • 速度:Claude Code 中的工作速度提升约 2.5 倍
  • 成本:同等任务的推理成本降低约 3 倍
  • 代码质量:模型主动标记代码缺陷的概率是前代的 4 倍,不再"默默放过"问题
  • 诚实度:经过专门训练,Opus 4.8 会主动标记不确定性,避免生成无根据的声明

定价方面,标准模式维持 Opus 4.7 水平:输入 $5/百万 token,输出 $25/百万 token。Fast mode 为 $10/$50。

动态工作流:单会话内跑数百个并行子代理

这是本次更新最引人注目的新能力,目前以 Research Preview 形式开放。

在 Claude Code 中,Opus 4.8 现在可以:

  1. 独立规划大型任务的执行方案
  2. 在单个会话内启动数百个并行子代理
  3. 自动验证所有输出,确认无误后再返回结果给用户

这意味着开发者可以把更大规模的工程任务交给 Claude 处理,而不需要手动拆分和监督每一步。Anthropic 将其定位为"让 Claude 像一位经验丰富的工程师一样独立工作"。

Effort 控制:用户决定 AI 花多少力气

模型选择器旁边新增了一个 effort 控制选项,让用户直接决定 Claude 在每次回复上投入多少计算资源:

  • 高 effort:深度思考,生成更详细、更周全的回复,适合复杂分析和长文写作
  • 低 effort:快速响应,消耗更少的使用配额,适合简单问答和日常对话

这个设计让用户在速度和质量之间有了明确的控制权,而不是完全依赖模型自行判断。

API 更新:运行时动态注入系统指令

Messages API 新增了一项对开发者友好的改进:现在可以直接在消息数组中插入 system 条目,而不需要把所有系统指令都放在对话开头。

实际用途包括:

  • 在代理运行过程中动态更新权限
  • 调整 token 预算
  • 注入新的环境上下文

关键是这些操作不会破坏 prompt cache,也不需要通过 user turn 来中转——对构建长时间运行的 AI 代理来说是个实质性改善。

安全评估

Anthropic 在发布前进行了详细的安全评估,结果显示:

  • Opus 4.8 在亲社会特质(支持用户自主权、维护用户利益)方面达到新高
  • 出现错位行为的概率略低于 Opus 4.7

后续计划

Anthropic 透露正在开发两个方向:一是提供与 Opus 同等能力但成本更低的模型系列;二是智能水平超越 Opus 的全新模型类别。具体时间表未公布。

Claude Opus 4.8 现已全球上线,所有 Claude 用户均可使用。

参考来源

说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。