AI商业工具周报:ChatGPT 256K上下文、Claude Sonnet 4.6、Grok 4.2公测、Perplexity弃广告
AI商业工具一周动态速递
ChatGPT扩容256K - Claude Sonnet 4.6颠覆性价比 - Grok 4.2万亿参数公测 - Perplexity弃广告
OpenAI:ChatGPT三连更新
NEW Thinking模式扩展至256K上下文窗口
2月20日,OpenAI宣布ChatGPT的Thinking模式上下文窗口从此前的196K tokens大幅扩展至256K tokens(128K输入 + 128K最大输出)。用户需手动选择Thinking模式以启用此扩展容量。这意味着ChatGPT现在可以处理更长的文档、更复杂的代码库和更深层的推理链。
NEW GPT-5.3 Codex编码模型发布
OpenAI于2月发布了GPT-5.3 Codex,这是其最新的高级编码专用模型。据SF Standard报道,该模型在自主编码能力上有显著提升,开发者已用它构建了完整的离线应用。同时,OpenAI宣布退役GPT-5(Instant和Thinking版本)。
安全 Lockdown Mode与Elevated Risk标签
OpenAI推出两项全新安全防护功能:
- Lockdown Mode(锁定模式):面向高安全需求用户的可选高级安全设置,严格限制ChatGPT与外部系统的交互方式,防止提示注入攻击导致的数据泄露。网页浏览被限制为缓存内容,不发出实时网络请求。目前适用于Enterprise、Edu、Healthcare和Teachers版本。
- Elevated Risk标签:在ChatGPT、ChatGPT Atlas和Codex中统一标注可能引入额外风险的功能,帮助用户做出知情选择。
热点 ChatGPT首次出现广告
据多家媒体报道,OpenAI已在ChatGPT中首次展示广告,标志着其商业化进程的重要一步。与此同时,OpenAI正为可能高达1万亿美元估值的IPO做准备。
Anthropic:Claude Sonnet 4.6 + 安全扫描
NEW Claude Sonnet 4.6 - 性价比颠覆者
2月17日,Anthropic发布Claude Sonnet 4.6,定价仅15美元/百万token,却在多项基准测试中击败了自家75美元/百万token的旗舰模型Opus 4.6。这款中端模型被评价为让人质疑旗舰模型存在意义的产品,在编码、推理和文档处理方面表现出色。
此前2月5日发布的Claude Opus 4.6也持续引发关注,它拥有100万token上下文窗口、128K token输出能力和Agent Teams功能,据METR评估其任务完成时间超越了GPT-5.2。
更新 Claude Code嵌入式安全扫描
据CyberScoop报道,Anthropic为Claude Code推出了嵌入式安全扫描功能,由Opus 4.6驱动,可自动检测代码中的安全漏洞,为企业级开发提供更强的安全保障。
xAI:Grok 4.2万亿参数公测
热点 Grok 4.2 Release Candidate
2月17日,xAI发布Grok 4.2公测版,主要亮点:
- 约1万亿参数,256K上下文窗口
- 在Alpha Arena Season 1.5实盘交易竞赛中以Mystery Model身份夺冠,两周平均回报率12.11%
- SWE-bench编码基准得分75.0%,微幅领先GPT-5(74.9%)和Claude Opus 4.1(74.5%)
- ARC-AGI推理基准达15.9%,首个突破10%门槛的模型
- 多智能体协作系统,支持更快学习和更少错误
Grok 4.2目前需在grok.com手动选择,尚未设为默认模型。同时,Tesla车辆已开始通过OTA更新集成Grok AI。
Perplexity:战略转型弃广告
热点 全面放弃广告模式
据Financial Times报道,估值180亿美元的Perplexity AI宣布全面放弃广告业务,承认AI聊天中的广告是一个错误。Perplexity成为继Anthropic之后又一家选择保持AI聊天无广告的公司,与OpenAI在ChatGPT中引入广告的策略形成鲜明对比。
NEW 三星Bixby深度集成Perplexity
三星在One UI 8.5 Beta 5中将Perplexity AI深度集成到Bixby助手中,用户可通过Hey Plex语音唤醒或侧键快速调用Perplexity搜索能力。Galaxy AI正在向多智能体生态系统演进。
| 产品 | 更新内容 | 发布日期 | 重要程度 |
|---|---|---|---|
| ChatGPT Thinking | 上下文窗口扩展至256K tokens | 2月20日 | ★★★★ |
| GPT-5.3 Codex | 新一代编码专用模型 | 2月(本月) | ★★★★★ |
| ChatGPT安全 | Lockdown Mode + Elevated Risk标签 | 2月20日 | ★★★★ |
| Claude Sonnet 4.6 | 15美元中端模型击败75美元旗舰 | 2月17日 | ★★★★★ |
| Claude Code | 嵌入式安全漏洞扫描 | 2月(本周) | ★★★★ |
| Grok 4.2 | 万亿参数公测,多智能体系统 | 2月17日 | ★★★★★ |
| Perplexity | 全面放弃广告模式 | 2月20日 | ★★★★ |
| Samsung Bixby | 深度集成Perplexity AI | 2月19日 | ★★★ |
本周趋势洞察
1. 性价比之战白热化:Claude Sonnet 4.6以五分之一的价格匹敌旗舰模型,预示着AI定价体系正在被重塑。中端模型的能力边界正在快速逼近顶级模型。
2. 安全成为核心卖点:OpenAI的Lockdown Mode和Anthropic的Claude Code安全扫描表明,随着AI深入企业核心业务,安全防护已从附加功能升级为核心竞争力。
3. 商业模式分化:Perplexity弃广告 vs OpenAI引入广告,AI公司在商业化路径上出现明显分歧。用户信任和产品纯净度正成为差异化竞争的新维度。
4. 万亿参数时代:Grok 4.2的万亿参数规模和实盘交易能力,标志着AI模型正从回答问题向自主决策跨越。