HuggingFace Papers · 评测
AgentKernelArena 发布 GPU 内核优化 agent 泛化能力评测基准
AgentKernelArena 是一个面向 GPU 内核优化 agent 的评测基准,重点考察 agent 在未见过的 kernel 和 GPU 架构上的泛化能力。该基准包含 80 个来自 cuBLAS 和 FlashAttention 的 kernel 任务,覆盖多种 GPU 架构,并设计了跨 kernel 和跨架构的评估协议。初步评测显示,现有 agent 在泛化场景下性能显著下降,揭示出当前方法在迁移能力上的不足。
- 域名
huggingface.co- 评分
- 4 · 重要更新
- 收录
- 2026-05-19
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。