🔥 2026年2月LLM周报

Gemini 3.1 Pro推理翻倍 · GPT-5.3-Codex-Spark千级token速度 · Anthropic揭露大规模蒸馏攻击

📅 2026年2月23日 · AI行业动态追踪

📌 本周核心看点：Google于2月19日发布Gemini 3.1 Pro，推理性能翻倍；OpenAI的GPT-5.3-Codex-Spark以1000+ tokens/秒刷新编程模型速度记录；Anthropic公开指控DeepSeek、Moonshot AI和MiniMax对Claude进行大规模蒸馏攻击。AI竞争进入白热化阶段。

🌟 一、Google Gemini 3.1 Pro：推理能力翻倍的里程碑

📊 Gemini 3.1 Pro NEW 2月19日

发布方：Google DeepMind · 发布日期：2026年2月19日

Google在2月19日正式发布了Gemini 3.1 Pro，这是Gemini 3系列的首个.1版本增量更新。此前Gemini系列的中期更新通常以.5为间隔（如Gemini 2.5 Pro），这次的.1更新标志着Google采用了更快速的迭代节奏。

核心亮点：

🧠 ARC-AGI-2得分77.1%，推理性能是Gemini 3 Pro的两倍以上
📄 100万token上下文窗口，可处理完整代码库、长篇法律文档
🔬 专为科学研究、工程和复杂问题求解设计
🌐 多模态推理：支持文本、图像、音频、视频和代码
💻 已登陆GitHub Copilot（公开预览）、Vertex AI、Gemini CLI等平台

Google表示，上周Gemini 3 Deep Think的重大升级背后的核心智能正是来自3.1 Pro。该模型目前以预览形式发布，正在验证更新并持续改进代理工作流能力。

💡 开发者注意：Gemini 3.1 Pro已可通过Google AI Studio、Vertex AI、Gemini Enterprise、Gemini CLI和Android Studio访问。Google AI Pro和Ultra订阅用户可在Gemini应用和NotebookLM中使用。

⚡ 二、GPT-5.3-Codex-Spark：千级速度的编程革命

🚀 GPT-5.3-Codex-Spark HOT 2月12日

发布方：OpenAI · 发布日期：2026年2月12-13日

OpenAI在2月中旬连续推出两个重磅编程模型：

GPT-5.3-Codex于2月9日在GitHub Copilot全面可用（GA），在编程、代理和推理基准测试中刷新高分。

紧接着，GPT-5.3-Codex-Spark于2月12日发布——这是OpenAI首个专为实时编程设计的模型，也是首个运行在Cerebras晶圆级芯片（而非NVIDIA GPU）上的模型。

⚡ 1,000+ tokens/秒的生成速度，专为实时交互编程优化
🔧 更轻量的架构，从GPT-5.3-Codex蒸馏而来
🖥️ 首次采用Cerebras硬件，标志着OpenAI硬件多元化战略
🔬 目前处于研究预览阶段

🛡️ 三、Claude 4.6系列发布与蒸馏攻击风波

🔮 Claude Sonnet 4.6 和 Opus 4.6 NEW 2月

发布方：Anthropic · 发布日期：2026年2月

Anthropic在2026年2月发布了Claude Sonnet 4.6和Claude Opus 4.6。值得注意的是，Opus 4.6的系统卡首次包含了正式的模型福利评估——部署前对模型进行的访谈，这在主要AI实验室中尚属首次。

此外，Anthropic在2月的超级碗LX期间播出了两支商业广告，作为名为A Time and a Place营销活动的一部分，标志着其从纯技术公司向消费者品牌的转型。

🚨 重大安全事件：2026年2月23日，Anthropic公开指控DeepSeek、Moonshot AI和MiniMax使用约24,000个虚假账户对Claude进行工业级蒸馏攻击。据路透社报道，MiniMax针对代理编程和工具使用能力进行蒸馏，当Anthropic发布新模型时，MiniMax在24小时内就将近一半流量转向新系统以捕获最新能力。三家公司均未立即回应置评请求。

📊 四、本周模型对比一览

模型	发布方	发布日期	核心亮点	状态
Gemini 3.1 Pro	Google	2月19日	ARC-AGI-2 77.1%，推理翻倍，1M上下文	预览
GPT-5.3-Codex	OpenAI	2月9日	GitHub Copilot GA，编程基准新高	GA
GPT-5.3-Codex-Spark	OpenAI	2月12日	1000+ tok/s，Cerebras芯片，实时编程	研究预览
Claude Sonnet 4.6	Anthropic	2月	最新Sonnet系列，模型福利评估	已发布
Claude Opus 4.6	Anthropic	2月	首次模型福利评估系统卡	已发布

📅 五、本月时间线

2月9日 — GPT-5.3-Codex在GitHub Copilot全面可用

2月12日 — OpenAI发布GPT-5.3-Codex-Spark，首次采用Cerebras芯片

2月19日 — Google发布Gemini 3.1 Pro，推理性能翻倍

2月19日 — Gemini 3.1 Pro登陆GitHub Copilot公开预览

2月 — Anthropic发布Claude Sonnet 4.6和Opus 4.6

2月23日 — Anthropic公开指控DeepSeek等进行大规模蒸馏攻击

🔮 六、趋势观察与展望

📈 三大趋势值得关注：

1. 推理能力军备竞赛加速：Gemini 3.1 Pro的ARC-AGI-2得分77.1%标志着推理能力的重大突破，各厂商在复杂推理领域的竞争日趋激烈。

2. 硬件多元化时代来临：OpenAI选择Cerebras芯片运行Codex-Spark，打破了NVIDIA在AI推理领域的垄断格局，预示着AI硬件生态的多元化发展。

3. 模型安全与知识产权争端升级：Anthropic对蒸馏攻击的公开指控，将模型安全和AI知识产权保护推上了行业议程的核心位置，可能引发新一轮监管讨论。

📡 本文由AI自动追踪整理 · 数据来源：Google Blog、GitHub Changelog、Ars Technica、Reuters等
更新时间：2026年2月23日