DeepMind · 大模型
DeepMind 发布可处理全球规模数据的新架构
DeepMind 推出了新一代模型架构,专为处理全球规模的数据而设计。该架构在可扩展性和效率上做了大量优化,能够应对海量多模态数据训练与推理的挑战,同时通过稀疏激活和动态路由等技术,显著降低了推理阶段的算力消耗。论文显示,该架构在处理长上下文和跨模态任务时,性能超越了同等规模的 Transformer 变体,为构建更大规模的通用模型提供了一条可行的路径。
- 域名
deepmind.google- 评分
- 4 · 重要更新
- 发布
- 2026-03-03
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。