Cohere 开源 Command A+:218B MoE 多模态推理模型,Apache 2.0 许可,2 张 H100 即可部署
Cohere 开源 Command A+:218B MoE 多模态推理模型,Apache 2.0 许可,2 张 H100 即可部署
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
加拿大 AI 公司 Cohere 于 5 月 24 日正式发布并开源了 Command A+,这是其迄今最强大的语言模型,专为复杂推理和 Agent 任务设计。模型采用 Apache 2.0 许可证,开发者可自由用于商业场景。基于多家媒体转述整理。
架构:218B 参数,只激活 25B
Command A+ 采用混合专家(MoE)架构,总参数量 218B,但每次推理仅激活 25B 参数。这意味着模型在保持前沿能力的同时,推理成本远低于同等规模的稠密模型。
模型支持三种输入输出模态:文本、图像和工具调用,覆盖从文档理解到多步骤 Agent 工作流的完整链路。
性能:吞吐量提升 63%,延迟降低 17%
根据 Cohere 官方数据,Command A+ 在推理、多模态理解和编程基准上全面超越前代 Command 模型:
- Token 吞吐量比 Command A Reasoning 高 63%
- 推理延迟降低 17%
- 新 tokenizer 对部分语言减少最多 20% 的 token 消耗
这些效率提升对需要大规模调用 API 的企业用户来说意味着直接的成本节省。
部署门槛:2 张 H100 或 1 张 Blackwell
Command A+ 的一大亮点是低部署门槛。得益于 MoE 架构的稀疏激活特性,模型可以在仅 2 张 NVIDIA H100 GPU 或 1 张 Blackwell GPU 上运行。
HuggingFace 上提供 16-bit、8-bit 和 4-bit 多种量化格式下载,开发者也可通过 Cohere 的 Model Vault 服务进行托管部署。
48 种语言支持
Command A+ 支持 48 种语言的输入输出,配合新设计的 tokenizer,在非英语语言上的 token 效率显著提升。这对需要多语言文档处理和跨语言检索的企业场景尤为实用。
许可与获取
- 许可证:Apache 2.0(完全开源,可商用)
- 下载:HuggingFace(多种量化格式)
- 托管:Cohere Model Vault
- 文档:Cohere 官方平台提供部署指南
为什么值得关注
在前沿模型普遍闭源或限制商用的当下,Cohere 选择以 Apache 2.0 开源一个 218B 参数的多模态推理模型,且部署门槛低至 2 张 H100,这为中小团队和企业自建 AI 基础设施提供了一个实际可用的选项。MoE 架构让它在性能和效率之间取得了不错的平衡。
参考来源
说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。