Microsoft MAI-Image-2.5 发布:文生图能力超 Google,Arena 排名升至第二
draft.md
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
Microsoft MAI-Image-2.5 发布:文生图能力超 Google,Arena 排名升至第二
2026年6月2日,微软在 Build 2026 上发布了 MAI-Image-2.5——一款专注文生图与图像编辑的生成模型。 在图像编辑类榜单 Arena-Score 中,它目前排名全球第二,仅次于 OpenAI 的 GPT-Image-2,超越了 Google 的 Nano-Banana 系列。这意味着微软终于在图像生成赛道上拿出了能与头部玩家正面竞争的成果。
MAI-Image-2.5 是什么?
它是微软本次 MAI 全家桶(一共7个模型)中的图像生成模型,基于稀疏 MoE 架构,拥有 35B 活跃参数、约 1T 总参数量,与 MAI 系列其他模型共享同一数据基础设施和训练 pipeline。微软在发布中强调,该模型训练数据全部来自"企业级、已获授权的干净数据",没有蒸馏第三方模型。
Arena-Score 是由用户盲评打分得出的图像生成排行榜,目前 MAI-Image-2.5 位列图像编辑类第二,第一名是 OpenAI 的 GPT-Image-2,Google 同期发布的 Nano-Banana 系列排在它之后。这个排名对于微软有特殊意义——在图像生成这件事上,微软过去几年几乎是失声状态,如今不仅有了产品,而且直接跻身第一梯队。
怎么用、多少钱?
MAI-Image-2.5 目前通过两条主要路径开放:
一条是 Azure Foundry,面向企业用户,支持模型微调(Fine-tuning),这是微软首次允许开发者直接调整模型权重,突破了以往只能通过 API 调用的限制。另一条是 OpenRouter,任何开发者都可以按量付费接入,没有最低消费门槛。此外,模型也已登陆 Fireworks AI 和 Baseten 平台。
对于已经在使用微软生态(Microsoft 365、Teams、Outlook)的企业用户来说,MAI-Image-2.5 的集成成本会更低——微软表示该模型会逐步接入 Copilot 产品线。
意味着什么?
微软在 MAI 战略上的逻辑正在从"追赶"转向"多线并进"。过去一年,微软在推理模型(MAI-Thinking-1)、编程模型(MAI-Code-1-Flash)、语音模型和图像模型上同步发力,MAI-Image-2.5 补上了最后一块明显短板。
从市场竞争角度看,文生图领域目前形成了三强格局:OpenAI 的 GPT-Image-2 领跑,Microsoft MAI-Image-2.5 紧随其后,Google 的 Nano-Banana 系列暂列第三。对开发者和企业用户而言,这意味着又多了一个有实质竞争力的选择,尤其对于那些已经在 Azure 上部署业务的团队,切换成本几乎为零。
适合谁用?
- 需要在微软生态内(Azure / Teams / Office)集成图像生成能力的团队
- 关注多模型调用的开发者——OpenRouter 现已支持 MAI-Image-2.5,可以一站式调用多家模型
- 对训练数据合规有要求的企业——微软强调了数据授权的透明度
参考来源
说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。