OpenAI 发布 GPT-5.6 Sol 限量预览:三款新模型、子代理协作、政府审查下分阶段开放
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
6月26日,OpenAI 宣布开始 GPT-5.6 系列的限量预览。这次一口气推出三款模型——旗舰 Sol、日常均衡 Terra、低成本 Luna,并引入了"子代理协作"的 ultra mode。但目前只有少量受信合作伙伴能用,普通用户还得等几周。
三款模型,三种定位
GPT-5.6 系列不再只有一个旗舰,而是分成了三个档位:
- Sol:旗舰模型,推理能力最强,新增 max reasoning effort(让模型花更多时间深度思考)和 ultra mode(子代理协作模式)
- Terra:日常均衡模型,性能接近 GPT-5.5,但便宜2倍——对大多数日常使用场景够用且更划算
- Luna:最快最便宜的选项,适合对延迟敏感、成本敏感的场景
这种分档策略并不新鲜(Google、Anthropic 都在做),但 OpenAI 这次把价格梯度拉得更明确:不是"便宜但能力打折",而是"不同场景选不同模型"。
ultra mode:子代理协作,不再单打独斗
GPT-5.6 最值得关注的新功能是 ultra mode。
传统模式下,一个 AI 模型就是单个代理——不管多聪明,都是一个人在干活。ultra mode 打破了这个限制:它让 Sol 调度多个子代理(subagent)并行协作,加速处理复杂任务。
打个比方:以前是你一个人从调研、写方案到做PPT全包;ultra mode 像是你变成了一支小团队,有人负责查资料,有人负责写草稿,有人负责润色,最后由你统筹输出。
OpenAI 表示这个模式"超越了单代理的能力上限"。在编码基准 Terminal-Bench 2.1 上,GPT-5.6 Sol 刷新了 SOTA,这个成绩跟 ultra mode 的多代理协作能力直接相关。
安全层大幅加码,代价是可能误拦
GPT-5.6 系列搭载了 OpenAI 迄今"最强大的安全栈",具体包括四层:
- 模型层:训练时植入拒绝机制,抵制伪装意图和越狱尝试
- 实时分类器:生成过程中实时评估输出,高风险情况暂停并交给更大的推理模型复核
- 账户级审查:跨对话分析行为模式,区分持续恶意行为与合法双用途安全工作
- 差异化访问:敏感能力不默认开放,按客户/用户/工作负载风险级别分级
OpenAI 为此投入了超过 70 万 A100 等效 GPU 小时做自动红队测试——让自家模型攻击自家安全层,找出通用越狱漏洞。
但 OpenAI 也承认,安全层在预览期可能误拦合法请求,尤其是网络安全、生物信息这些"攻防双用途"领域。预览的目的之一,就是收集反馈减少误拦。
为什么是"限量预览"?
这次发布最引人注目的不是技术,而是发布方式。
OpenAI 在公告中明确说:按照美国政府要求,先只对少量受信合作伙伴开放预览,合作伙伴名单已与政府共享。全面开放需要等几周,期间继续与美国政府协调。
这源于 GPT-5.6 Sol 在网络安全能力上的显著提升——在 ExploitBench 上,Sol 用大约 1/3 的输出 token 就达到了 Mythos Preview 级别的表现;在 ExploitGym 上,三款模型随推理深度增加,网络攻防能力同步提升。
虽然 OpenAI 评估 Sol 未跨"网络关键阈值"(在 Chromium 和 Firefox 测试中能找到漏洞组件,但未自主完成完整攻击链),但能力的跃升仍促使他们选择分阶段发布。
值得注意的是,OpenAI 明确表示"不认为这种政府参与审查的流程应该成为长期默认",认为这会阻碍用户、开发者和全球合作伙伴获得最好的工具。
对普通用户意味着什么?
短期(现在): 大多数人用不了。限量预览只面向少数合作伙伴。
中期(几周内): OpenAI 计划逐步开放。ChatGPT Plus 和 Pro 用户大概率是第一批能体验到的,尤其是 Terra(性价比高)和 Sol 的标准模式。
长期: ultra mode 的子代理协作可能改变人们使用 AI 的方式——从"问一个模型"变成"调度一个团队"。如果体验流畅,复杂任务(写代码、做研究、多步骤规划)的效率会有质的变化。
需要注意的
- 没有确切的全面开放日期,"几周"是 OpenAI 的说法
- 基准测试为 OpenAI 自测,第三方独立验证尚未跟进
- 安全层误拦问题在预览期可能较明显,开放后体验可能不同
- Terra 和 Luna 的具体定价尚未公布
---
*基于 OpenAI 官方博客及多家媒体转述整理。来源:[OpenAI 官方博客](https://openai.com/index/previewing-gpt-5-6-sol/)、[GPT-5.6 Preview System Card](https://deploymentsafety.openai.com/gpt-5-6-preview)*
参考来源
说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。