Mistral · 大模型
Mistral 发布 Mixtral 8x22b 模型
Mistral 开源了 Mixtral 8x22b,一款 141B 参数的稀疏混合专家模型,每 token 激活 39B 参数。该模型支持 64K token 上下文,在多语言理解、数学推理和代码生成方面表现突出,以 Apache 2.0 许可发布。Mixtral 8x22b 延续 MoE 架构路线,在推理成本与模型能力之间取得平衡,适合需要大容量模型但受限于计算资源的场景。
- 域名
mistral.ai- 评分
- 5 · 重大发布
- 发布
- 2025-01-30
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
