Cohere开源Command A+ 218B MoE模型重塑企业主权AI

2026年05月25日 577 约3分钟 News Factory 已核实

Cohere 开源模型 MoE架构

技术规格与架构创新

Command A+总参数218B，活跃参数仅25B，采用稀疏MoE设计。输入上下文达128K，最大生成长度64K，支持文本与图像双模态及工具调用。官方提供W4A4量化版本，单张B200或双张H100即可运行，推理效率显著高于同等规模稠密模型。

与竞品MoE模型的直接对比

DeepSeek-V2总参数236B、活跃21B，Command A+在代理编码任务上高出12个百分点。Llama 3.1 405B为稠密结构，单次前向需全部参数激活，Command A+在相同H100集群上吞吐量提升2.3倍。Mistral Large采用8专家配置，Command A+专家数量更多且支持48种语言，远超Mistral的12种语言支持。

代理能力量化提升

τ²-Bench电信场景得分从Command A Reasoning的37%升至85%，Terminal-Bench Hard从3%升至25%。多模态文档处理与长时序推理能力同步增强，单一模型整合了此前Command A系列所有子模型功能。

北美某电信运营商已在North工作区内用Command A+替换原有混合模型栈，部署成本降低41%。

Apache 2.0许可的商业价值

Apache 2.0允许企业修改、商用并闭源二次开发，无需开源衍生代码。开发者可直接集成至私有SaaS产品，规避GPL传染风险。该许可与Llama系列自定义协议相比，法律确定性更高，便于风控审查与投资融资。

企业可将模型嵌入自有硬件设备，无需向Cohere付费
支持vLLM、Transformers等主流框架，迁移成本接近零
48语言覆盖为跨国合规部署提供基础

主权AI落地路径

模型权重已上传Hugging Face并提供多种无损量化版本。Model Vault托管方案则满足不愿自建推理集群的机构需求。两者结合形成从实验到生产的完整闭环，降低主权AI门槛至单节点级别。

技术规格与架构创新

与竞品MoE模型的直接对比

代理能力量化提升

Apache 2.0许可的商业价值

主权AI落地路径

相关推荐