Google AI · 其他

Google 推出两款专为 agent 时代设计的 TPU

Google 发布，Google 推出两款面向 agent 时代的专用 TPU。第八代张量处理单元包含两种芯片变体，分别针对训练与推理场景进行优化，旨在提升 AI 工作负载的能效与吞吐量。这一硬件升级表明，Google 正在为更复杂的多步骤 agent 应用部署提供底层算力支撑。

域名: blog.google
评分: 4 · 重要更新
发布: 2026-04-22

访问项目本体

导读

Google 在 Cloud Next 2026 大会上发布第八代 TPU，包括 8t 和 8i 两款芯片，分别针对训练与推理两类负载做了专门优化。这是自 TPU v1 在 2015 年上线以来的第八次硬件迭代，也是 Google 第一次把 agent 时代的工作负载特性直接写进硬件设计目标。

8t 训练芯片强化的是大规模分布式训练时的内存带宽和互连吞吐，配合 Decoupled DiLoCo 这样的分布式训练方法可以撑住更大模型的预训练。8i 推理芯片把延迟和能效摆在首位，面向 agent 应用里频繁的小批次调用和长上下文推理。两款芯片共用 Pathways 软件栈，开发者无需改代码即可在两种角色间切换。

外部能拿到 TPU 8 的渠道是 Google Cloud，Anthropic 早期采用方之一被点名提及。TPU 8 真正的战略价值不只是性能数字，而是 Google 在 AI 算力基础设施上保持自主可控——Gemini 系列的训练与服务完全跑在自研芯片上，与依赖 NVIDIA H100/B100 的同业拉开了供应链层面的差异。

原文摘要

The eighth generation of Google’s TPU includes two specialized chips that will power the future of AI.

Back to Latest