Google AI · 其他

Google 推出两款专为 agent 时代设计的 TPU

Google 发布,Google 推出两款面向 agent 时代的专用 TPU。第八代张量处理单元包含两种芯片变体,分别针对训练与推理场景进行优化,旨在提升 AI 工作负载的能效与吞吐量。这一硬件升级表明,Google 正在为更复杂的多步骤 agent 应用部署提供底层算力支撑。

域名
blog.google
评分
4 · 重要更新
发布
2026-04-22
Google 推出两款专为 agent 时代设计的 TPU

导读

Google 在 Cloud Next 2026 大会上发布第八代 TPU,包括 8t 和 8i 两款芯片,分别针对训练 与推理两类负载做了专门优化。这是自 TPU v1 在 2015 年上线以来的第八次硬件迭代,也是 Google 第一次把 agent 时代的工作负载特性直接写进硬件设计目标。

8t 训练芯片强化的是大规模分布式训练时的内存带宽和互连吞吐,配合 Decoupled DiLoCo 这 样的分布式训练方法可以撑住更大模型的预训练。8i 推理芯片把延迟和能效摆在首位,面向 agent 应用里频繁的小批次调用和长上下文推理。两款芯片共用 Pathways 软件栈,开发者 无需改代码即可在两种角色间切换。

外部能拿到 TPU 8 的渠道是 Google Cloud,Anthropic 早期采用方之一被点名提及。TPU 8 真 正的战略价值不只是性能数字,而是 Google 在 AI 算力基础设施上保持自主可控——Gemini 系列 的训练与服务完全跑在自研芯片上,与依赖 NVIDIA H100/B100 的同业拉开了供应链层面的差异。

原文摘要

The eighth generation of Google’s TPU includes two specialized chips that will power the future of AI.