
在AI算力争霸时代,英伟达凭借GPU市值一路狂飙。但如今,它的蛋糕正在被一点点分食——2024年,苹果论文披露Apple Intelligence全部由TPU训练;2025年,Anthropic签下数十亿美元订单,购买TPU训练Claude;近期,Meta与谷歌签署数十亿美元协议,租用TPU跑Llama。
TPU一直是谷歌低调的“自家武器”,在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗,人们才开始重新审视:这套从搜索推荐系统中长出来的定制芯片,究竟藏着多少秘密?
本期播客,我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发,也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度,一层层揭开TPU的神秘面纱。
我们将深入探讨:TPU与GPU的架构有何根本不同?TPU的产能瓶颈卡在哪里?当谷歌开始向Anthropic、Meta开放TPU,它在软件生态上要迈过哪些坎?如果未来模型的底层范式发生改变,TPU还能押准方向吗?而最关键的问题是:TPU真的有机会撼动英伟达的霸主地位吗?

【主播】
泓君,硅谷101创始人,播客主理人
【嘉宾】
Henry Zhu,前Google TPU工程师,参与V6/V7/V8 TPU研发
【你将听到】
TPU挑战GPU
03:06 架构对决:GPU像多个大厨,TPU像流水线接力
06:41 TPU vs GPU:谁在模型训练上更强?
10:20 TPU产能之困:HBM、封装与良率
XLA软件黑盒
14:06 Anthropic为何率先下单百万部署?
16:01 黑盒优化如何“榨干”硬件性能
17:47 XLA与CUDA,两种生态之争
19:53 苹果为什么能成为TPU大客户?
“大模型客户”
20:45 Gemini成功背后,TPU做了什么?
22:34 TPU是如何做MoE优化的?
23:45 设计难点:如何押中两三年后的算法?
26:05 TPU的转身:V6开始押注大模型预训练
28:53 Transformer先发优势带来的旗鼓相当能持续多久?
32:04 Meta的TPU托管服务:生态逐渐走向兼容
供应链命门
36:08 拓扑通信架构如何为TPU打赢数据中心成本战
38:27 博通(Broadcom)是谁?为什么它如此关键
42:04 挑战GPU的机会:用户规模越大推理越快
45:36 V7(Ironwood)之后:Gemini实现100%TPU训练
48:15 一句话总结TPU优劣势
TPU十年进化史
49:49 V1推理芯片试水,V2训练芯片旗舰,V4优化推荐算法
52:16 V5/V6:进入大模型时代,推出推理专用版本
56:05 团队演变:软件组话语权越来越重
新星Groq
57:14 踩准每一次红利的编译器公司
59:27 差异化定位:做小规模部署的低延迟优化
01:01:59 AI算力芯片新战局
【更正】
54:20 口误,Groq创始人Jonathan Ross,现为英伟达首席软件架构师
【延伸阅读】
《谷歌收获大单:与Anthropic达成数百亿美元合作,部署100万个TPU芯片》
《不再单押英伟达,Meta斥资数十亿美元租用谷歌TPU》
【监制】
泓君
【剪辑】
小师 Jacob
【运营】
朱婕
【BGM】
Virtuoso Violin - Rafael Krux
Angular Pulse - Guy Copeland
Top Flow - This Violin
【在这里找到我们】
公众号:硅谷101
收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|荔枝FM|网易云音乐|QQ音乐
其他平台:YouTube|Bilibili 搜索「硅谷101播客」
联系我们:[email protected]
本期节目中嘉宾所表达观点均为其个人看法。
本期节目不构成任何投资建议,投资有风险,入市需谨慎。