Cohere 开源 Command A+：218B MoE 多模态推理模型，Apache 2.0 许可，2 张 H100 即可部署

分类: 生图平面类 |发布于: 5/26/2026 |最后更新: 5/26/2026

基于已整理草稿生成的网页版文章，适合先稳定落地，再做局部润色与发布检查。

加拿大 AI 公司 Cohere 于 5 月 24 日正式发布并开源了 Command A+，这是其迄今最强大的语言模型，专为复杂推理和 Agent 任务设计。模型采用 Apache 2.0 许可证，开发者可自由用于商业场景。基于多家媒体转述整理。

架构：218B 参数，只激活 25B

Command A+ 采用混合专家（MoE）架构，总参数量 218B，但每次推理仅激活 25B 参数。这意味着模型在保持前沿能力的同时，推理成本远低于同等规模的稠密模型。

模型支持三种输入输出模态：文本、图像和工具调用，覆盖从文档理解到多步骤 Agent 工作流的完整链路。

根据 Cohere 官方数据，Command A+ 在推理、多模态理解和编程基准上全面超越前代 Command 模型：

这些效率提升对需要大规模调用 API 的企业用户来说意味着直接的成本节省。

Command A+ 的一大亮点是低部署门槛。得益于 MoE 架构的稀疏激活特性，模型可以在仅 2 张 NVIDIA H100 GPU 或 1 张 Blackwell GPU 上运行。

HuggingFace 上提供 16-bit、8-bit 和 4-bit 多种量化格式下载，开发者也可通过 Cohere 的 Model Vault 服务进行托管部署。

Command A+ 支持 48 种语言的输入输出，配合新设计的 tokenizer，在非英语语言上的 token 效率显著提升。这对需要多语言文档处理和跨语言检索的企业场景尤为实用。

在前沿模型普遍闭源或限制商用的当下，Cohere 选择以 Apache 2.0 开源一个 218B 参数的多模态推理模型，且部署门槛低至 2 张 H100，这为中小团队和企业自建 AI 基础设施提供了一个实际可用的选项。MoE 架构让它在性能和效率之间取得了不错的平衡。

说明：该页面由基础模板稳定生成，后续可继续局部润色样式或补充模块，再进入发布检查。