硅谷101: E228｜谷歌TPU能撼动英伟达吗？前TPU工程师首次揭秘

在AI算力争霸时代，英伟达凭借GPU市值一路狂飙。但如今，它的蛋糕正在被一点点分食——2024年，苹果论文披露Apple Intelligence全部由TPU训练；2025年，Anthropic签下数十亿美元订单，购买TPU训练Claude；近期，Meta与谷歌签署数十亿美元协议，租用TPU跑Llama。
TPU一直是谷歌低调的“自家武器”，在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗，人们才开始重新审视：这套从搜索推荐系统中长出来的定制芯片，究竟藏着多少秘密？
本期播客，我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发，也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度，一层层揭开TPU的神秘面纱。
我们将深入探讨：TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？

【主播】
泓君，硅谷101创始人，播客主理人
【嘉宾】
Henry Zhu，前Google TPU工程师，参与V6/V7/V8 TPU研发

【你将听到】
TPU挑战GPU
03:06 架构对决：GPU像多个大厨，TPU像流水线接力
06:41 TPU vs GPU：谁在模型训练上更强？
10:20 TPU产能之困：HBM、封装与良率

XLA软件黑盒
14:06 Anthropic为何率先下单百万部署？
16:01 黑盒优化如何“榨干”硬件性能
17:47 XLA与CUDA，两种生态之争
19:53 苹果为什么能成为TPU大客户？

“大模型客户”
20:45 Gemini成功背后，TPU做了什么？
22:34 TPU是如何做MoE优化的？
23:45 设计难点：如何押中两三年后的算法？
26:05 TPU的转身：V6开始押注大模型预训练
28:53 Transformer先发优势带来的旗鼓相当能持续多久？
32:04 Meta的TPU托管服务：生态逐渐走向兼容

供应链命门
36:08 拓扑通信架构如何为TPU打赢数据中心成本战
38:27 博通（Broadcom）是谁？为什么它如此关键
42:04 挑战GPU的机会：用户规模越大推理越快
45:36 V7（Ironwood）之后：Gemini实现100%TPU训练
48:15 一句话总结TPU优劣势

TPU十年进化史
49:49 V1推理芯片试水，V2训练芯片旗舰，V4优化推荐算法
52:16 V5/V6：进入大模型时代，推出推理专用版本
56:05 团队演变：软件组话语权越来越重

新星Groq
57:14 踩准每一次红利的编译器公司
59:27 差异化定位：做小规模部署的低延迟优化
01:01:59 AI算力芯片新战局

【更正】
54:20 口误，Groq创始人Jonathan Ross，现为英伟达首席软件架构师

【延伸阅读】
《谷歌收获大单：与Anthropic达成数百亿美元合作，部署100万个TPU芯片》
《不再单押英伟达，Meta斥资数十亿美元租用谷歌TPU》

【监制】
泓君
【剪辑】
小师 Jacob
【运营】
朱婕
【BGM】
Virtuoso Violin - Rafael Krux
Angular Pulse - Guy Copeland
Top Flow - This Violin

【在这里找到我们】
公众号：硅谷101
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」
联系我们：[email protected]

本期节目中嘉宾所表达观点均为其个人看法。
本期节目不构成任何投资建议，投资有风险，入市需谨慎。

E228｜谷歌TPU能撼动英伟达吗？前TPU工程师首次揭秘

Episode Host

Special Guest

Episode Host

Special Guest

Episode Link

Embeddable Audio Player

Download URL

Social Network Quick Links