2026年2月大语言模型周报:Gemini 3.1 Pro重磅发布、GPT-5.3-Codex-Spark极速编程、Anthropic揭露蒸馏攻击
🔥 2026年2月LLM周报
Gemini 3.1 Pro推理翻倍 · GPT-5.3-Codex-Spark千级token速度 · Anthropic揭露大规模蒸馏攻击
📅 2026年2月23日 · AI行业动态追踪
🌟 一、Google Gemini 3.1 Pro:推理能力翻倍的里程碑
📊 Gemini 3.1 Pro NEW 2月19日
Google在2月19日正式发布了Gemini 3.1 Pro,这是Gemini 3系列的首个.1版本增量更新。此前Gemini系列的中期更新通常以.5为间隔(如Gemini 2.5 Pro),这次的.1更新标志着Google采用了更快速的迭代节奏。
核心亮点:
- 🧠 ARC-AGI-2得分77.1%,推理性能是Gemini 3 Pro的两倍以上
- 📄 100万token上下文窗口,可处理完整代码库、长篇法律文档
- 🔬 专为科学研究、工程和复杂问题求解设计
- 🌐 多模态推理:支持文本、图像、音频、视频和代码
- 💻 已登陆GitHub Copilot(公开预览)、Vertex AI、Gemini CLI等平台
Google表示,上周Gemini 3 Deep Think的重大升级背后的核心智能正是来自3.1 Pro。该模型目前以预览形式发布,正在验证更新并持续改进代理工作流能力。
⚡ 二、GPT-5.3-Codex-Spark:千级速度的编程革命
🚀 GPT-5.3-Codex-Spark HOT 2月12日
OpenAI在2月中旬连续推出两个重磅编程模型:
GPT-5.3-Codex于2月9日在GitHub Copilot全面可用(GA),在编程、代理和推理基准测试中刷新高分。
紧接着,GPT-5.3-Codex-Spark于2月12日发布——这是OpenAI首个专为实时编程设计的模型,也是首个运行在Cerebras晶圆级芯片(而非NVIDIA GPU)上的模型。
- ⚡ 1,000+ tokens/秒的生成速度,专为实时交互编程优化
- 🔧 更轻量的架构,从GPT-5.3-Codex蒸馏而来
- 🖥️ 首次采用Cerebras硬件,标志着OpenAI硬件多元化战略
- 🔬 目前处于研究预览阶段
🛡️ 三、Claude 4.6系列发布与蒸馏攻击风波
🔮 Claude Sonnet 4.6 和 Opus 4.6 NEW 2月
Anthropic在2026年2月发布了Claude Sonnet 4.6和Claude Opus 4.6。值得注意的是,Opus 4.6的系统卡首次包含了正式的模型福利评估——部署前对模型进行的访谈,这在主要AI实验室中尚属首次。
此外,Anthropic在2月的超级碗LX期间播出了两支商业广告,作为名为A Time and a Place营销活动的一部分,标志着其从纯技术公司向消费者品牌的转型。
📊 四、本周模型对比一览
| 模型 | 发布方 | 发布日期 | 核心亮点 | 状态 |
|---|---|---|---|---|
| Gemini 3.1 Pro | 2月19日 | ARC-AGI-2 77.1%,推理翻倍,1M上下文 | 预览 | |
| GPT-5.3-Codex | OpenAI | 2月9日 | GitHub Copilot GA,编程基准新高 | GA |
| GPT-5.3-Codex-Spark | OpenAI | 2月12日 | 1000+ tok/s,Cerebras芯片,实时编程 | 研究预览 |
| Claude Sonnet 4.6 | Anthropic | 2月 | 最新Sonnet系列,模型福利评估 | 已发布 |
| Claude Opus 4.6 | Anthropic | 2月 | 首次模型福利评估系统卡 | 已发布 |
📅 五、本月时间线
🔮 六、趋势观察与展望
📈 三大趋势值得关注:
1. 推理能力军备竞赛加速:Gemini 3.1 Pro的ARC-AGI-2得分77.1%标志着推理能力的重大突破,各厂商在复杂推理领域的竞争日趋激烈。
2. 硬件多元化时代来临:OpenAI选择Cerebras芯片运行Codex-Spark,打破了NVIDIA在AI推理领域的垄断格局,预示着AI硬件生态的多元化发展。
3. 模型安全与知识产权争端升级:Anthropic对蒸馏攻击的公开指控,将模型安全和AI知识产权保护推上了行业议程的核心位置,可能引发新一轮监管讨论。
📡 本文由AI自动追踪整理 · 数据来源:Google Blog、GitHub Changelog、Ars Technica、Reuters等
更新时间:2026年2月23日