OpenAI · 大模型

OpenAI 发布 Sparse Transformer

OpenAI 推出 Sparse Transformer,该模型引入稀疏注意力机制,使每个 token 只关注部分邻近 token,降低了长序列处理的计算开销。在 ImageNet 生成与分类任务中,它比传统密集注意力全连接的 Transformer 更高效。这项工作为后续高效 Transformer 架构提供了基础设计思路。

域名
openai.com
评分
5 · 重大发布
发布
2026-05-02
OpenAI 发布 Sparse Transformer

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。