E230｜1万亿收入预期背后：英伟达的巅峰与软肋

硅谷101 — Wed, 25 Mar 2026 17:00:00 -0700

本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起：
1万亿——这是黄仁勋预期到2027年底，Blackwell和Vera Rubin两个平台带来的订单收入。
7块——这是大会一次性发布的Vera Rubin新芯片数量。
10倍、35倍——这是Vera Rubin NVL72 AI机架系统，相比Blackwell，它的推理效率提升了10倍，每瓦Token产出性能是之前的35倍。
但我们聊的远不止数字本身，也不只是芯片的故事。当推理拐点全面到来，算力狂奔的路上，芯片设计、代工产能、推理架构、软件生态、电力基建、云服务运营……这些环节都在被重新丈量。
在这场串联起AI全产业链关键节点的线下对谈中，我们试图穿透英伟达庞大的AI生态帝国表象，看清它真正的护城河，以及那些潜伏在高速增长背后的软肋与隐忧。

【主播】
泓君，硅谷101创始人，播客主理人
【嘉宾】
张璐，Fusion Fund创始管理合伙人
Dr.Mark Ren, Agentrys创始人&CEO，前英伟达研究总监
Dr.Zhibin Xiao, ZFLOW AI创始人&CEO，前CASPA主席与董事会顾问
Alex Yeh，GMI Cloud创始人&CEO

【你将听到】
万亿野心背后的产业现实
03:21 万亿目标背后，推理业务正成为英伟达关键收入来源
05:50 供应链瓶颈：CoWoS产能成最大挑战，硬件周期非资金可突破
09:03 七芯齐发的关键：英伟达全公司都在用 Coding Agent 做芯片
10:10 Groq的优势：纯SRAM架构专攻低延迟
15:43 推理芯片创业还有机会吗？关键：找英伟达短板
19:07 未来数据中心是异构的，系统级优化比单芯片更重要
21:25 OpenClaw引爆TOKEN消耗，英伟达NemoCloud能让人惊艳吗？
24:27 SaaS面临挑战：未来软件公司卖的不是软件，是AI劳动力
28:36 未来企业架构：CEO同时管员工和智能体，HR、财务都可外包
30:07 英伟达芯片设计模型ChipNemo，硬件代码也能写，难点在于优化
31:47 谷歌TPU系统能力强，但英伟达的护城河已从CUDA扩展到全栈基础设施
35:28 英伟达的护城河：执行力与供应链
36:14 未来挑战：垂直领域、边缘端与私有化部署的崛起、推理市场红利被分流、资本压力
40:16 观众提问1：英特尔是否有望成为代工第二源？
42:56 观众提问2：CUDA护城河是否会被Coding Agent削弱？

一线云服务商谈数据中心瓶颈
46:30 数据中心竞速：靠自发电与预制集装箱加速
50:22 谁在引爆GPU云需求？模型训练、视频生成、AI Coding以及OpenClaw
53:39 模块化、标准化、全套打包的AI工厂方案
56:57 不止GPU缺货，数据中心核心配件供应趋紧
58:42 运营GPU云的核心能力：先有卡，再稳得住，SLA是生死线
01:01:04 GPU折旧比资本市场预估更耐久
01:02:08 观众提问3：AI云服务商的差异化策略

【监制】
泓君
【后期】
Amei
【运营】
朱婕
【BGM】
Pulse Runner - Helmut Schenker
Interstate 895 - Bonnie Grace
Unfinished Stories - Lennon Hutton
Seven Daughters - Fabien Tell
AI sing-along recaps GTC keynote

本期节目不构成任何投资建议

【在这里找到我们】
公众号：硅谷101
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」
联系我们：podcast@sv101.net Special Guests: Alex Yeh, Dr.Mark Ren, Dr.Zhibin Xiao, and 张璐.

E228｜谷歌TPU能撼动英伟达吗？前TPU工程师首次揭秘

硅谷101 — Thu, 12 Mar 2026 17:00:00 -0700

在AI算力争霸时代，英伟达凭借GPU市值一路狂飙。但如今，它的蛋糕正在被一点点分食——2024年，苹果论文披露Apple Intelligence全部由TPU训练；2025年，Anthropic签下数十亿美元订单，购买TPU训练Claude；近期，Meta与谷歌签署数十亿美元协议，租用TPU跑Llama。
TPU一直是谷歌低调的“自家武器”，在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗，人们才开始重新审视：这套从搜索推荐系统中长出来的定制芯片，究竟藏着多少秘密？
本期播客，我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发，也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度，一层层揭开TPU的神秘面纱。
我们将深入探讨：TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？

【主播】
泓君，硅谷101创始人，播客主理人
【嘉宾】
Henry Zhu，前Google TPU工程师，参与V6/V7/V8 TPU研发

【你将听到】
TPU挑战GPU
03:06 架构对决：GPU像多个大厨，TPU像流水线接力
06:41 TPU vs GPU：谁在模型训练上更强？
10:20 TPU产能之困：HBM、封装与良率

XLA软件黑盒
14:06 Anthropic为何率先下单百万部署？
16:01 黑盒优化如何“榨干”硬件性能
17:47 XLA与CUDA，两种生态之争
19:53 苹果为什么能成为TPU大客户？

“大模型客户”
20:45 Gemini成功背后，TPU做了什么？
22:34 TPU是如何做MoE优化的？
23:45 设计难点：如何押中两三年后的算法？
26:05 TPU的转身：V6开始押注大模型预训练
28:53 Transformer先发优势带来的旗鼓相当能持续多久？
32:04 Meta的TPU托管服务：生态逐渐走向兼容

供应链命门
36:08 拓扑通信架构如何为TPU打赢数据中心成本战
38:27 博通（Broadcom）是谁？为什么它如此关键
42:04 挑战GPU的机会：用户规模越大推理越快
45:36 V7（Ironwood）之后：Gemini实现100%TPU训练
48:15 一句话总结TPU优劣势

TPU十年进化史
49:49 V1推理芯片试水，V2训练芯片旗舰，V4优化推荐算法
52:16 V5/V6：进入大模型时代，推出推理专用版本
56:05 团队演变：软件组话语权越来越重

新星Groq
57:14 踩准每一次红利的编译器公司
59:27 差异化定位：做小规模部署的低延迟优化
01:01:59 AI算力芯片新战局

【更正】
54:20 口误，Groq创始人Jonathan Ross，现为英伟达首席软件架构师

【延伸阅读】
《谷歌收获大单：与Anthropic达成数百亿美元合作，部署100万个TPU芯片》
《不再单押英伟达，Meta斥资数十亿美元租用谷歌TPU》

【监制】
泓君
【剪辑】
小师 Jacob
【运营】
朱婕
【BGM】
Virtuoso Violin - Rafael Krux
Angular Pulse - Guy Copeland
Top Flow - This Violin

【在这里找到我们】
公众号：硅谷101
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」
联系我们：podcast@sv101.net

本期节目中嘉宾所表达观点均为其个人看法。
本期节目不构成任何投资建议，投资有风险，入市需谨慎。 Special Guest: Henry Zhu.

硅谷101 - Episodes Tagged with “Gpu”

E230｜1万亿收入预期背后：英伟达的巅峰与软肋

E228｜谷歌TPU能撼动英伟达吗？前TPU工程师首次揭秘