Google 发布 Gemini 3.5 Flash:不是更快的小模型,是第一个能动手的前沿模型

分类: 大语言模型 |发布于: 5/20/2026 |最后更新: 5/20/2026
Google 发布 Gemini 3.5 Flash:不是更快的小模型,是第一个"能动手"的前沿模型

Google 发布 Gemini 3.5 Flash:不是更快的小模型,是第一个"能动手"的前沿模型

基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。

2026 年 5 月 19 日,Google 在 I/O 开发者大会上正式发布 Gemini 3.5 Flash。这不是又一个小而快的补充型号——Google 把它定位为"前沿智力 + 行动力"结合的第一款模型,明确宣告 AI 从回答问题转向替你干活。

它到底是什么

Gemini 3.5 Flash 是 Gemini 3.5 系列的第一款产品。Google DeepMind 首席技术专家 Koray Kavukcuoglu 在发布会上直接说:3.5 Flash 在几乎所有基准测试上超越了前代旗舰 3.1 Pro。

关键数字:

  • 编码能力:Terminal-Bench 2.1 达到 76.2%,SWE-Bench Pro 达到 55.1%
  • Agent 能力:MCP Atlas(多步工具调用工作流)83.6%,Toolathlon 56.5%
  • 计算机操控:OSWorld-Verified 78.4%
  • 速度:输出速度是其他前沿模型的 4 倍;在 Antigravity 中的优化版达到 12 倍

这些数字意味着什么?3.5 Flash 不是在某个单项上刷榜——它在编码、Agent 多步任务、桌面操控三个维度同时达到前沿水平,而且快得多。

为什么说它"能动手"

之前的主流大模型,核心能力是"回答问题"和"生成内容"。Gemini 3.5 Flash 的设计重心完全不同:它能自主执行长时间任务。

Google 高级产品总监 Tulsee Doshi 透露,3.5 Flash 可以自主运行数小时,处理从编码到研究项目的复杂工作流。当遇到需要人类判断的决策点时,它会暂停并征求用户意见,而不是自己硬闯。

一个更直观的例子:在 I/O 现场演示中,工程师 Varun Mohan 展示了多个 Agent 分头工作,各自完成操作系统不同组件的开发,最终合在一起构建出一个完整的操作系统。这不是写代码片段,而是从规划到实现的全流程自主工作。

和 Antigravity 2.0 的深度绑定

3.5 Flash 不是孤立的模型发布。Google 同时推出了 Antigravity 2.0——一个独立的桌面应用程序,专为 Agent 优先的开发方式设计。

Kavukcuoglu 说 3.5 Flash 是"与 Antigravity 共同开发"的,目的是让 Agent 有一个"原生的生存和工作环境"。Antigravity 不再只是一个 IDE 插件,而是变成了管理和编排多个自主 Agent 的平台。

这种绑定关系很明确:3.5 Flash 的 Agent 能力需要 Antigravity 这样的环境才能真正发挥,而 Antigravity 的价值也依赖于 3.5 Flash 的执行能力。Google 在试图定义一个"模型 + 环境"的完整闭环。

3.5 Flash 和 3.5 Pro 的分工

Google 已经确认 3.5 Pro 将在下月发布。两者的分工逻辑很清晰:

  • 3.5 Pro:做规划和编排,负责深度推理
  • 3.5 Flash:做具体执行,负责快速工具调用和任务完成

Doshi 的原话是:"3.5 Pro 成为你的编排者和规划者,然后它可以让 Flash 担任各个子 Agent。"这是一个典型的"大脑 + 手脚"架构——大型慢模型想清楚做什么,小型快模型去做完。

消费端的 Agent 化

3.5 Flash 不仅仅是给开发者用的。它现在是 Gemini App 和 Google 搜索 AI Mode 的默认模型。Google 同时宣布了:

  • Gemini Spark:24/7 运行的个人 AI Agent,集成 Gmail 等服务,帮你管理数字生活
  • 搜索中的信息 Agent:可以 24/7 在后台帮你寻找和追踪特定信息
  • 搜索中的生成式 UI:基于 3.5 Flash 和 Antigravity,搜索结果可以生成动态布局和交互式可视化

从聊天到搜索再到个人助理,Google 正在把 Agent 能力铺到每一个产品触点。

安全问题不容回避

更强的自主能力意味着更大的潜在风险。Google 表示 3.5 Flash 加强了网络安全和 CBRN(化学、生物、放射、核)防护,同时在处理敏感问题时更倾向于精确回应而非一刀切拒绝。

值得注意的是,Google 目前正面临一起与 Gemini 相关的诉讼——一名用户在与 Gemini 长时间聊天后几乎实施了大规模伤亡事件并自杀。在这个背景下,向更广泛的消费者推出自主 Agent 的决定,必然会面临更严格的审视。

今天就能用

Gemini 3.5 Flash 已于发布当日上线:

  • Gemini App(默认模型)
  • Gemini API
  • Antigravity 2.0
  • Google 搜索 AI Mode
  • Gemini Enterprise

3.5 Pro 预计下月跟进。

---

*基于 Google I/O 2026 官方主题演讲及多家媒体报道整理。*

参考来源

说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。