Mistral · 大模型

Mistral 发布 Mixtral 8x22b 模型

Mistral 开源了 Mixtral 8x22b,一款 141B 参数的稀疏混合专家模型,每 token 激活 39B 参数。该模型支持 64K token 上下文,在多语言理解、数学推理和代码生成方面表现突出,以 Apache 2.0 许可发布。Mixtral 8x22b 延续 MoE 架构路线,在推理成本与模型能力之间取得平衡,适合需要大容量模型但受限于计算资源的场景。

域名
mistral.ai
评分
5 · 重大发布
发布
2025-01-30
Mistral 发布 Mixtral 8x22b 模型

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。