2026年2月大语言模型周报:Gemini 3.1 Pro重磅发布、GPT-5.3-Codex-Spark极速编程、Anthropic揭露蒸馏攻击

分类: 各厂语言模型 |发布于: 2/24/2026 |最后更新: 2/24/2026

🔥 2026年2月LLM周报

Gemini 3.1 Pro推理翻倍 · GPT-5.3-Codex-Spark千级token速度 · Anthropic揭露大规模蒸馏攻击

📅 2026年2月23日 · AI行业动态追踪

📌 本周核心看点:Google于2月19日发布Gemini 3.1 Pro,推理性能翻倍;OpenAI的GPT-5.3-Codex-Spark以1000+ tokens/秒刷新编程模型速度记录;Anthropic公开指控DeepSeek、Moonshot AI和MiniMax对Claude进行大规模蒸馏攻击。AI竞争进入白热化阶段。

🌟 一、Google Gemini 3.1 Pro:推理能力翻倍的里程碑

📊 Gemini 3.1 Pro NEW 2月19日

发布方:Google DeepMind · 发布日期:2026年2月19日

Google在2月19日正式发布了Gemini 3.1 Pro,这是Gemini 3系列的首个.1版本增量更新。此前Gemini系列的中期更新通常以.5为间隔(如Gemini 2.5 Pro),这次的.1更新标志着Google采用了更快速的迭代节奏。

核心亮点:

  • 🧠 ARC-AGI-2得分77.1%,推理性能是Gemini 3 Pro的两倍以上
  • 📄 100万token上下文窗口,可处理完整代码库、长篇法律文档
  • 🔬 专为科学研究、工程和复杂问题求解设计
  • 🌐 多模态推理:支持文本、图像、音频、视频和代码
  • 💻 已登陆GitHub Copilot(公开预览)、Vertex AI、Gemini CLI等平台

Google表示,上周Gemini 3 Deep Think的重大升级背后的核心智能正是来自3.1 Pro。该模型目前以预览形式发布,正在验证更新并持续改进代理工作流能力。

💡 开发者注意:Gemini 3.1 Pro已可通过Google AI Studio、Vertex AI、Gemini Enterprise、Gemini CLI和Android Studio访问。Google AI Pro和Ultra订阅用户可在Gemini应用和NotebookLM中使用。

⚡ 二、GPT-5.3-Codex-Spark:千级速度的编程革命

🚀 GPT-5.3-Codex-Spark HOT 2月12日

发布方:OpenAI · 发布日期:2026年2月12-13日

OpenAI在2月中旬连续推出两个重磅编程模型:

GPT-5.3-Codex于2月9日在GitHub Copilot全面可用(GA),在编程、代理和推理基准测试中刷新高分。

紧接着,GPT-5.3-Codex-Spark于2月12日发布——这是OpenAI首个专为实时编程设计的模型,也是首个运行在Cerebras晶圆级芯片(而非NVIDIA GPU)上的模型。

  • 1,000+ tokens/秒的生成速度,专为实时交互编程优化
  • 🔧 更轻量的架构,从GPT-5.3-Codex蒸馏而来
  • 🖥️ 首次采用Cerebras硬件,标志着OpenAI硬件多元化战略
  • 🔬 目前处于研究预览阶段

🛡️ 三、Claude 4.6系列发布与蒸馏攻击风波

🔮 Claude Sonnet 4.6 和 Opus 4.6 NEW 2月

发布方:Anthropic · 发布日期:2026年2月

Anthropic在2026年2月发布了Claude Sonnet 4.6Claude Opus 4.6。值得注意的是,Opus 4.6的系统卡首次包含了正式的模型福利评估——部署前对模型进行的访谈,这在主要AI实验室中尚属首次。

此外,Anthropic在2月的超级碗LX期间播出了两支商业广告,作为名为A Time and a Place营销活动的一部分,标志着其从纯技术公司向消费者品牌的转型。

🚨 重大安全事件:2026年2月23日,Anthropic公开指控DeepSeek、Moonshot AI和MiniMax使用约24,000个虚假账户对Claude进行工业级蒸馏攻击。据路透社报道,MiniMax针对代理编程和工具使用能力进行蒸馏,当Anthropic发布新模型时,MiniMax在24小时内就将近一半流量转向新系统以捕获最新能力。三家公司均未立即回应置评请求。

📊 四、本周模型对比一览

模型发布方发布日期核心亮点状态
Gemini 3.1 ProGoogle2月19日ARC-AGI-2 77.1%,推理翻倍,1M上下文预览
GPT-5.3-CodexOpenAI2月9日GitHub Copilot GA,编程基准新高GA
GPT-5.3-Codex-SparkOpenAI2月12日1000+ tok/s,Cerebras芯片,实时编程研究预览
Claude Sonnet 4.6Anthropic2月最新Sonnet系列,模型福利评估已发布
Claude Opus 4.6Anthropic2月首次模型福利评估系统卡已发布

📅 五、本月时间线

2月9日 — GPT-5.3-Codex在GitHub Copilot全面可用
2月12日 — OpenAI发布GPT-5.3-Codex-Spark,首次采用Cerebras芯片
2月19日 — Google发布Gemini 3.1 Pro,推理性能翻倍
2月19日 — Gemini 3.1 Pro登陆GitHub Copilot公开预览
2月 — Anthropic发布Claude Sonnet 4.6和Opus 4.6
2月23日 — Anthropic公开指控DeepSeek等进行大规模蒸馏攻击

🔮 六、趋势观察与展望

📈 三大趋势值得关注:

1. 推理能力军备竞赛加速:Gemini 3.1 Pro的ARC-AGI-2得分77.1%标志着推理能力的重大突破,各厂商在复杂推理领域的竞争日趋激烈。

2. 硬件多元化时代来临:OpenAI选择Cerebras芯片运行Codex-Spark,打破了NVIDIA在AI推理领域的垄断格局,预示着AI硬件生态的多元化发展。

3. 模型安全与知识产权争端升级:Anthropic对蒸馏攻击的公开指控,将模型安全和AI知识产权保护推上了行业议程的核心位置,可能引发新一轮监管讨论。

📡 本文由AI自动追踪整理 · 数据来源:Google Blog、GitHub Changelog、Ars Technica、Reuters等
更新时间:2026年2月23日