<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" encoding="UTF-8" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:admin="http://webns.net/mvcb/" xmlns:atom="http://www.w3.org/2005/Atom/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:googleplay="http://www.google.com/schemas/play-podcasts/1.0" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:fireside="http://fireside.fm/modules/rss/fireside">
  <channel>
    <fireside:hostname>web01.fireside.fm</fireside:hostname>
    <fireside:genDate>Wed, 29 Apr 2026 13:46:44 -0500</fireside:genDate>
    <generator>Fireside (https://fireside.fm)</generator>
    <title>硅谷101 - Episodes Tagged with “Groq”</title>
    <link>https://sv101.fireside.fm/tags/groq</link>
    <pubDate>Wed, 25 Mar 2026 17:00:00 -0700</pubDate>
    <description>失败、背叛、不被理解，硅谷精神领袖一直都不是完美的存在；他们是科学家，创造者，行动派，他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目，是一档分享当下最新鲜的技术、知识与思想的科技播客。
公众账号：硅谷101
联系邮箱：podcast@sv101.net
</description>
    <language>zh-cn</language>
    <itunes:type>episodic</itunes:type>
    <itunes:subtitle>这是一档分享当下最新鲜的技术、知识与思想的科技播客</itunes:subtitle>
    <itunes:author>硅谷101</itunes:author>
    <itunes:summary>失败、背叛、不被理解，硅谷精神领袖一直都不是完美的存在；他们是科学家，创造者，行动派，他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目，是一档分享当下最新鲜的技术、知识与思想的科技播客。
公众账号：硅谷101
联系邮箱：podcast@sv101.net
</itunes:summary>
    <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
    <itunes:explicit>no</itunes:explicit>
    <itunes:keywords>tech, business, SiiconValley, 科技, 泓君, 硅谷101</itunes:keywords>
    <itunes:owner>
      <itunes:name>硅谷101</itunes:name>
      <itunes:email>liuhj60@gmail.com</itunes:email>
    </itunes:owner>
<itunes:category text="Technology"/>
<itunes:category text="Business"/>
<itunes:category text="Business">
  <itunes:category text="Entrepreneurship"/>
</itunes:category>
<item>
  <title>E230｜1万亿收入预期背后：英伟达的巅峰与软肋</title>
  <link>https://sv101.fireside.fm/244</link>
  <guid isPermaLink="false">d97446f1-d6e3-4894-89d1-dca0a362b10b</guid>
  <pubDate>Wed, 25 Mar 2026 17:00:00 -0700</pubDate>
  <author>硅谷101</author>
  <enclosure url="https://aphid.fireside.fm/d/1437767933/f0f20376-8faf-4940-b920-84af6c734e2d/d97446f1-d6e3-4894-89d1-dca0a362b10b.mp3" length="95572334" type="audio/mpeg"/>
  <itunes:episodeType>full</itunes:episodeType>
  <itunes:season>4</itunes:season>
  <itunes:author>硅谷101</itunes:author>
  <itunes:subtitle>本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起，</itunes:subtitle>
  <itunes:duration>1:06:21</itunes:duration>
  <itunes:explicit>no</itunes:explicit>
  <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
  <description>https://imagev2.xmcdn.com/storages/c4ce-audiofreehighqps/29/FA/GAqhI8INmcS2AAHpNQR_oxXw.jpg
本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起：
1万亿——这是黄仁勋预期到2027年底，Blackwell和Vera Rubin两个平台带来的订单收入。
7块——这是大会一次性发布的Vera Rubin新芯片数量。
10倍、35倍——这是Vera Rubin NVL72 AI机架系统，相比Blackwell，它的推理效率提升了10倍，每瓦Token产出性能是之前的35倍。
但我们聊的远不止数字本身，也不只是芯片的故事。当推理拐点全面到来，算力狂奔的路上，芯片设计、代工产能、推理架构、软件生态、电力基建、云服务运营……这些环节都在被重新丈量。
在这场串联起AI全产业链关键节点的线下对谈中，我们试图穿透英伟达庞大的AI生态帝国表象，看清它真正的护城河，以及那些潜伏在高速增长背后的软肋与隐忧。
【主播】
泓君，硅谷101创始人，播客主理人
【嘉宾】
张璐，Fusion Fund创始管理合伙人
Dr.Mark Ren, Agentrys创始人&amp;amp;CEO，前英伟达研究总监
Dr.Zhibin Xiao, ZFLOW AI创始人&amp;amp;CEO，前CASPA主席与董事会顾问
Alex Yeh，GMI Cloud创始人&amp;amp;CEO
https://imagev2.xmcdn.com/storages/50ad-audiofreehighqps/EE/F3/GKwRIW4NmdQWADbk8QR_pxN9.png
【你将听到】
万亿野心背后的产业现实
03:21 万亿目标背后，推理业务正成为英伟达关键收入来源
05:50 供应链瓶颈：CoWoS产能成最大挑战，硬件周期非资金可突破
09:03 七芯齐发的关键：英伟达全公司都在用 Coding Agent 做芯片
10:10 Groq的优势：纯SRAM架构专攻低延迟
15:43 推理芯片创业还有机会吗？关键：找英伟达短板
19:07 未来数据中心是异构的，系统级优化比单芯片更重要
21:25 OpenClaw引爆TOKEN消耗，英伟达NemoCloud能让人惊艳吗？
24:27 SaaS面临挑战：未来软件公司卖的不是软件，是AI劳动力
28:36 未来企业架构：CEO同时管员工和智能体，HR、财务都可外包
30:07 英伟达芯片设计模型ChipNemo，硬件代码也能写，难点在于优化
31:47 谷歌TPU系统能力强，但英伟达的护城河已从CUDA扩展到全栈基础设施
35:28 英伟达的护城河：执行力与供应链
36:14 未来挑战：垂直领域、边缘端与私有化部署的崛起、推理市场红利被分流、资本压力
40:16 观众提问1： 英特尔是否有望成为代工第二源？
42:56 观众提问2：CUDA护城河是否会被Coding Agent削弱？
 (https://picui.ogmua.cn/s1/2026/03/26/69c40ec134afd.webp)
一线云服务商谈数据中心瓶颈
46:30 数据中心竞速：靠自发电与预制集装箱加速
50:22 谁在引爆GPU云需求？模型训练、视频生成、AI Coding以及OpenClaw
53:39 模块化、标准化、全套打包的AI工厂方案
56:57 不止GPU缺货，数据中心核心配件供应趋紧
58:42 运营GPU云的核心能力：先有卡，再稳得住，SLA是生死线
01:01:04 GPU折旧比资本市场预估更耐久
01:02:08 观众提问3：AI云服务商的差异化策略
https://imagev2.xmcdn.com/storages/121b-audiofreehighqps/DF/36/GKwRIRwNmcTMACQAOwR_ox4C.jpg
【监制】
泓君
【后期】
Amei
【运营】
朱婕
【BGM】
Pulse Runner - Helmut Schenker
Interstate 895 - Bonnie Grace
Unfinished Stories - Lennon Hutton
Seven Daughters - Fabien Tell
AI sing-along recaps GTC keynote
本期节目不构成任何投资建议
https://imagev2.xmcdn.com/storages/139a-audiofreehighqps/BF/FB/GKwRIW4NqiVHAAKfCwSGO-Sb.jpg
【在这里找到我们】
公众号：硅谷101
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」
联系我们：podcast@sv101.net Special Guests: Alex Yeh, Dr.Mark Ren, Dr.Zhibin Xiao, and 张璐.
</description>
  <itunes:keywords>英伟达, GPU, GTC, Groq, 推理芯片, AI数据中心, TOKEN经济</itunes:keywords>
  <content:encoded>
    <![CDATA[<p><img src="https://imagev2.xmcdn.com/storages/c4ce-audiofreehighqps/29/FA/GAqhI8INmcS2AAHpNQR_oxXw.jpg" alt=""></p>

<p>本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起：<br>
<strong>1万亿</strong>——这是黄仁勋预期到2027年底，Blackwell和Vera Rubin两个平台带来的订单收入。<br>
<strong>7块</strong>——这是大会一次性发布的Vera Rubin新芯片数量。<br>
<strong>10倍、35倍</strong>——这是Vera Rubin NVL72 AI机架系统，相比Blackwell，它的推理效率提升了10倍，每瓦Token产出性能是之前的35倍。<br>
但我们聊的远不止数字本身，也不只是芯片的故事。当推理拐点全面到来，算力狂奔的路上，芯片设计、代工产能、推理架构、软件生态、电力基建、云服务运营……这些环节都在被重新丈量。<br>
在这场串联起AI全产业链关键节点的线下对谈中，我们试图穿透英伟达庞大的AI生态帝国表象，看清它真正的护城河，以及那些潜伏在高速增长背后的软肋与隐忧。</p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
张璐，Fusion Fund创始管理合伙人<br>
Dr.Mark Ren, Agentrys创始人&amp;CEO，前英伟达研究总监<br>
Dr.Zhibin Xiao, ZFLOW AI创始人&amp;CEO，前CASPA主席与董事会顾问<br>
Alex Yeh，GMI Cloud创始人&amp;CEO</p>

<p><img src="https://imagev2.xmcdn.com/storages/50ad-audiofreehighqps/EE/F3/GKwRIW4NmdQWADbk8QR_pxN9.png" alt=""></p>

<p><strong>【你将听到】</strong><br>
<strong>万亿野心背后的产业现实</strong><br>
03:21 万亿目标背后，推理业务正成为英伟达关键收入来源<br>
05:50 供应链瓶颈：CoWoS产能成最大挑战，硬件周期非资金可突破<br>
09:03 七芯齐发的关键：英伟达全公司都在用 Coding Agent 做芯片<br>
10:10 Groq的优势：纯SRAM架构专攻低延迟<br>
15:43 推理芯片创业还有机会吗？关键：找英伟达短板<br>
19:07 未来数据中心是异构的，系统级优化比单芯片更重要<br>
21:25 OpenClaw引爆TOKEN消耗，英伟达NemoCloud能让人惊艳吗？<br>
24:27 SaaS面临挑战：未来软件公司卖的不是软件，是AI劳动力<br>
28:36 未来企业架构：CEO同时管员工和智能体，HR、财务都可外包<br>
30:07 英伟达芯片设计模型ChipNemo，硬件代码也能写，难点在于优化<br>
31:47 谷歌TPU系统能力强，但英伟达的护城河已从CUDA扩展到全栈基础设施<br>
35:28 英伟达的护城河：执行力与供应链<br>
36:14 未来挑战：垂直领域、边缘端与私有化部署的崛起、推理市场红利被分流、资本压力<br>
40:16 观众提问1： 英特尔是否有望成为代工第二源？<br>
42:56 观众提问2：CUDA护城河是否会被Coding Agent削弱？</p>

<p><a href="https://picui.ogmua.cn/s1/2026/03/26/69c40ec134afd.webp" rel="nofollow"></a></p>

<p><strong>一线云服务商谈数据中心瓶颈</strong><br>
46:30 数据中心竞速：靠自发电与预制集装箱加速<br>
50:22 谁在引爆GPU云需求？模型训练、视频生成、AI Coding以及OpenClaw<br>
53:39 模块化、标准化、全套打包的AI工厂方案<br>
56:57 不止GPU缺货，数据中心核心配件供应趋紧<br>
58:42 运营GPU云的核心能力：先有卡，再稳得住，SLA是生死线<br>
01:01:04 GPU折旧比资本市场预估更耐久<br>
01:02:08 观众提问3：AI云服务商的差异化策略</p>

<p><img src="https://imagev2.xmcdn.com/storages/121b-audiofreehighqps/DF/36/GKwRIRwNmcTMACQAOwR_ox4C.jpg" alt=""></p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【后期】</strong><br>
Amei<br>
<strong>【运营】</strong><br>
朱婕<br>
<strong>【BGM】</strong><br>
Pulse Runner - Helmut Schenker<br>
Interstate 895 - Bonnie Grace<br>
Unfinished Stories - Lennon Hutton<br>
Seven Daughters - Fabien Tell<br>
AI sing-along recaps GTC keynote</p>

<p><em>本期节目不构成任何投资建议</em></p>

<p><img src="https://imagev2.xmcdn.com/storages/139a-audiofreehighqps/BF/FB/GKwRIW4NqiVHAAKfCwSGO-Sb.jpg" alt=""></p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p><p>Special Guests: Alex Yeh, Dr.Mark Ren, Dr.Zhibin Xiao, and 张璐.</p>]]>
  </content:encoded>
  <itunes:summary>
    <![CDATA[<p><img src="https://imagev2.xmcdn.com/storages/c4ce-audiofreehighqps/29/FA/GAqhI8INmcS2AAHpNQR_oxXw.jpg" alt=""></p>

<p>本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起：<br>
<strong>1万亿</strong>——这是黄仁勋预期到2027年底，Blackwell和Vera Rubin两个平台带来的订单收入。<br>
<strong>7块</strong>——这是大会一次性发布的Vera Rubin新芯片数量。<br>
<strong>10倍、35倍</strong>——这是Vera Rubin NVL72 AI机架系统，相比Blackwell，它的推理效率提升了10倍，每瓦Token产出性能是之前的35倍。<br>
但我们聊的远不止数字本身，也不只是芯片的故事。当推理拐点全面到来，算力狂奔的路上，芯片设计、代工产能、推理架构、软件生态、电力基建、云服务运营……这些环节都在被重新丈量。<br>
在这场串联起AI全产业链关键节点的线下对谈中，我们试图穿透英伟达庞大的AI生态帝国表象，看清它真正的护城河，以及那些潜伏在高速增长背后的软肋与隐忧。</p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
张璐，Fusion Fund创始管理合伙人<br>
Dr.Mark Ren, Agentrys创始人&amp;CEO，前英伟达研究总监<br>
Dr.Zhibin Xiao, ZFLOW AI创始人&amp;CEO，前CASPA主席与董事会顾问<br>
Alex Yeh，GMI Cloud创始人&amp;CEO</p>

<p><img src="https://imagev2.xmcdn.com/storages/50ad-audiofreehighqps/EE/F3/GKwRIW4NmdQWADbk8QR_pxN9.png" alt=""></p>

<p><strong>【你将听到】</strong><br>
<strong>万亿野心背后的产业现实</strong><br>
03:21 万亿目标背后，推理业务正成为英伟达关键收入来源<br>
05:50 供应链瓶颈：CoWoS产能成最大挑战，硬件周期非资金可突破<br>
09:03 七芯齐发的关键：英伟达全公司都在用 Coding Agent 做芯片<br>
10:10 Groq的优势：纯SRAM架构专攻低延迟<br>
15:43 推理芯片创业还有机会吗？关键：找英伟达短板<br>
19:07 未来数据中心是异构的，系统级优化比单芯片更重要<br>
21:25 OpenClaw引爆TOKEN消耗，英伟达NemoCloud能让人惊艳吗？<br>
24:27 SaaS面临挑战：未来软件公司卖的不是软件，是AI劳动力<br>
28:36 未来企业架构：CEO同时管员工和智能体，HR、财务都可外包<br>
30:07 英伟达芯片设计模型ChipNemo，硬件代码也能写，难点在于优化<br>
31:47 谷歌TPU系统能力强，但英伟达的护城河已从CUDA扩展到全栈基础设施<br>
35:28 英伟达的护城河：执行力与供应链<br>
36:14 未来挑战：垂直领域、边缘端与私有化部署的崛起、推理市场红利被分流、资本压力<br>
40:16 观众提问1： 英特尔是否有望成为代工第二源？<br>
42:56 观众提问2：CUDA护城河是否会被Coding Agent削弱？</p>

<p><a href="https://picui.ogmua.cn/s1/2026/03/26/69c40ec134afd.webp" rel="nofollow"></a></p>

<p><strong>一线云服务商谈数据中心瓶颈</strong><br>
46:30 数据中心竞速：靠自发电与预制集装箱加速<br>
50:22 谁在引爆GPU云需求？模型训练、视频生成、AI Coding以及OpenClaw<br>
53:39 模块化、标准化、全套打包的AI工厂方案<br>
56:57 不止GPU缺货，数据中心核心配件供应趋紧<br>
58:42 运营GPU云的核心能力：先有卡，再稳得住，SLA是生死线<br>
01:01:04 GPU折旧比资本市场预估更耐久<br>
01:02:08 观众提问3：AI云服务商的差异化策略</p>

<p><img src="https://imagev2.xmcdn.com/storages/121b-audiofreehighqps/DF/36/GKwRIRwNmcTMACQAOwR_ox4C.jpg" alt=""></p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【后期】</strong><br>
Amei<br>
<strong>【运营】</strong><br>
朱婕<br>
<strong>【BGM】</strong><br>
Pulse Runner - Helmut Schenker<br>
Interstate 895 - Bonnie Grace<br>
Unfinished Stories - Lennon Hutton<br>
Seven Daughters - Fabien Tell<br>
AI sing-along recaps GTC keynote</p>

<p><em>本期节目不构成任何投资建议</em></p>

<p><img src="https://imagev2.xmcdn.com/storages/139a-audiofreehighqps/BF/FB/GKwRIW4NqiVHAAKfCwSGO-Sb.jpg" alt=""></p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p><p>Special Guests: Alex Yeh, Dr.Mark Ren, Dr.Zhibin Xiao, and 张璐.</p>]]>
  </itunes:summary>
</item>
<item>
  <title>E228｜谷歌TPU能撼动英伟达吗？前TPU工程师首次揭秘</title>
  <link>https://sv101.fireside.fm/241</link>
  <guid isPermaLink="false">fd17090c-0d72-4c0d-aa3e-9b00bc062149</guid>
  <pubDate>Thu, 12 Mar 2026 17:00:00 -0700</pubDate>
  <author>硅谷101</author>
  <enclosure url="https://aphid.fireside.fm/d/1437767933/f0f20376-8faf-4940-b920-84af6c734e2d/fd17090c-0d72-4c0d-aa3e-9b00bc062149.mp3" length="99114212" type="audio/mpeg"/>
  <itunes:episodeType>full</itunes:episodeType>
  <itunes:season>4</itunes:season>
  <itunes:author>硅谷101</itunes:author>
  <itunes:subtitle>TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？</itunes:subtitle>
  <itunes:duration>1:06:46</itunes:duration>
  <itunes:explicit>no</itunes:explicit>
  <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
  <description>https://imagev2.xmcdn.com/storages/a723-audiofreehighqps/B7/79/GAqhfD0NByqOAAHpNQRBU__s.jpg
在AI算力争霸时代，英伟达凭借GPU市值一路狂飙。但如今，它的蛋糕正在被一点点分食——2024年，苹果论文披露Apple Intelligence全部由TPU训练；2025年，Anthropic签下数十亿美元订单，购买TPU训练Claude；近期，Meta与谷歌签署数十亿美元协议，租用TPU跑Llama。
TPU一直是谷歌低调的“自家武器”，在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗，人们才开始重新审视：这套从搜索推荐系统中长出来的定制芯片，究竟藏着多少秘密？
本期播客，我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发，也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度，一层层揭开TPU的神秘面纱。
我们将深入探讨：TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？
https://imagev2.xmcdn.com/storages/53ac-audiofreehighqps/25/65/GAqhVp8NiJDXAALbYgR4uiFR.jpg
【主播】
泓君，硅谷101创始人，播客主理人
【嘉宾】
Henry Zhu，前Google TPU工程师，参与V6/V7/V8 TPU研发
【你将听到】
TPU挑战GPU
03:06 架构对决：GPU像多个大厨，TPU像流水线接力
06:41 TPU vs GPU：谁在模型训练上更强？
10:20 TPU产能之困：HBM、封装与良率
XLA软件黑盒
14:06 Anthropic为何率先下单百万部署？
16:01 黑盒优化如何“榨干”硬件性能
17:47 XLA与CUDA，两种生态之争
19:53 苹果为什么能成为TPU大客户？
“大模型客户”
20:45 Gemini成功背后，TPU做了什么？
22:34 TPU是如何做MoE优化的？
23:45 设计难点：如何押中两三年后的算法？
26:05 TPU的转身：V6开始押注大模型预训练
28:53 Transformer先发优势带来的旗鼓相当能持续多久？
32:04 Meta的TPU托管服务：生态逐渐走向兼容
供应链命门
36:08 拓扑通信架构如何为TPU打赢数据中心成本战
38:27 博通（Broadcom）是谁？为什么它如此关键
42:04 挑战GPU的机会：用户规模越大推理越快
45:36 V7（Ironwood）之后：Gemini实现100%TPU训练
48:15 一句话总结TPU优劣势
TPU十年进化史
49:49 V1推理芯片试水，V2训练芯片旗舰，V4优化推荐算法
52:16 V5/V6：进入大模型时代，推出推理专用版本
56:05 团队演变：软件组话语权越来越重
新星Groq
57:14 踩准每一次红利的编译器公司
59:27 差异化定位：做小规模部署的低延迟优化
01:01:59 AI算力芯片新战局
【更正】
54:20 口误，Groq创始人Jonathan Ross，现为英伟达首席软件架构师
【延伸阅读】
《谷歌收获大单：与Anthropic达成数百亿美元合作，部署100万个TPU芯片》 (https://www.thepaper.cn/newsDetail_forward_31831042)
《不再单押英伟达，Meta斥资数十亿美元租用谷歌TPU》 (https://news.qq.com/rain/a/20260227A0243600)
【监制】
泓君
【剪辑】
小师 Jacob
【运营】
朱婕
【BGM】
Virtuoso Violin - Rafael Krux
Angular Pulse - Guy Copeland
Top Flow - This Violin
【在这里找到我们】
公众号：硅谷101
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」
联系我们：podcast@sv101.net
本期节目中嘉宾所表达观点均为其个人看法。
本期节目不构成任何投资建议，投资有风险，入市需谨慎。 Special Guest: Henry Zhu.
</description>
  <itunes:keywords>TPU, 谷歌, Gemini, Ironwood, GPU, 英伟达, Groq, AI, 芯片</itunes:keywords>
  <content:encoded>
    <![CDATA[<p><img src="https://imagev2.xmcdn.com/storages/a723-audiofreehighqps/B7/79/GAqhfD0NByqOAAHpNQRBU__s.jpg" alt=""></p>

<p>在AI算力争霸时代，英伟达凭借GPU市值一路狂飙。但如今，它的蛋糕正在被一点点分食——2024年，苹果论文披露Apple Intelligence全部由TPU训练；2025年，Anthropic签下数十亿美元订单，购买TPU训练Claude；近期，Meta与谷歌签署数十亿美元协议，租用TPU跑Llama。<br>
TPU一直是谷歌低调的“自家武器”，在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗，人们才开始重新审视：这套从搜索推荐系统中长出来的定制芯片，究竟藏着多少秘密？<br>
本期播客，我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发，也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度，一层层揭开TPU的神秘面纱。<br>
我们将深入探讨：TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？</p>

<p><img src="https://imagev2.xmcdn.com/storages/53ac-audiofreehighqps/25/65/GAqhVp8NiJDXAALbYgR4uiFR.jpg" alt=""></p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
Henry Zhu，前Google TPU工程师，参与V6/V7/V8 TPU研发</p>

<p><strong>【你将听到】</strong><br>
<strong>TPU挑战GPU</strong><br>
03:06 架构对决：GPU像多个大厨，TPU像流水线接力<br>
06:41 TPU vs GPU：谁在模型训练上更强？<br>
10:20 TPU产能之困：HBM、封装与良率</p>

<p><strong>XLA软件黑盒</strong><br>
14:06 Anthropic为何率先下单百万部署？<br>
16:01 黑盒优化如何“榨干”硬件性能<br>
17:47 XLA与CUDA，两种生态之争<br>
19:53 苹果为什么能成为TPU大客户？</p>

<p><strong>“大模型客户”</strong><br>
20:45 Gemini成功背后，TPU做了什么？<br>
22:34 TPU是如何做MoE优化的？<br>
23:45 设计难点：如何押中两三年后的算法？<br>
26:05 TPU的转身：V6开始押注大模型预训练<br>
28:53 Transformer先发优势带来的旗鼓相当能持续多久？<br>
32:04 Meta的TPU托管服务：生态逐渐走向兼容</p>

<p><strong>供应链命门</strong><br>
36:08 拓扑通信架构如何为TPU打赢数据中心成本战<br>
38:27 博通（Broadcom）是谁？为什么它如此关键<br>
42:04 挑战GPU的机会：用户规模越大推理越快<br>
45:36 V7（Ironwood）之后：Gemini实现100%TPU训练<br>
48:15 一句话总结TPU优劣势</p>

<p><strong>TPU十年进化史</strong><br>
49:49 V1推理芯片试水，V2训练芯片旗舰，V4优化推荐算法<br>
52:16 V5/V6：进入大模型时代，推出推理专用版本<br>
56:05 团队演变：软件组话语权越来越重</p>

<p><strong>新星Groq</strong><br>
57:14 踩准每一次红利的编译器公司<br>
59:27 差异化定位：做小规模部署的低延迟优化<br>
01:01:59 AI算力芯片新战局</p>

<p><strong>【更正】</strong><br>
54:20 口误，Groq创始人Jonathan Ross，现为英伟达首席软件架构师</p>

<p><strong>【延伸阅读】</strong><br>
<a href="https://www.thepaper.cn/newsDetail_forward_31831042" rel="nofollow">《谷歌收获大单：与Anthropic达成数百亿美元合作，部署100万个TPU芯片》</a><br>
<a href="https://news.qq.com/rain/a/20260227A0243600" rel="nofollow">《不再单押英伟达，Meta斥资数十亿美元租用谷歌TPU》</a></p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【剪辑】</strong><br>
小师 Jacob<br>
<strong>【运营】</strong><br>
朱婕<br>
<strong>【BGM】</strong><br>
Virtuoso Violin - Rafael Krux<br>
Angular Pulse - Guy Copeland<br>
Top Flow - This Violin</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p>

<p><em>本期节目中嘉宾所表达观点均为其个人看法。<br>
本期节目不构成任何投资建议，投资有风险，入市需谨慎。</em></p><p>Special Guest: Henry Zhu.</p>]]>
  </content:encoded>
  <itunes:summary>
    <![CDATA[<p><img src="https://imagev2.xmcdn.com/storages/a723-audiofreehighqps/B7/79/GAqhfD0NByqOAAHpNQRBU__s.jpg" alt=""></p>

<p>在AI算力争霸时代，英伟达凭借GPU市值一路狂飙。但如今，它的蛋糕正在被一点点分食——2024年，苹果论文披露Apple Intelligence全部由TPU训练；2025年，Anthropic签下数十亿美元订单，购买TPU训练Claude；近期，Meta与谷歌签署数十亿美元协议，租用TPU跑Llama。<br>
TPU一直是谷歌低调的“自家武器”，在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗，人们才开始重新审视：这套从搜索推荐系统中长出来的定制芯片，究竟藏着多少秘密？<br>
本期播客，我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发，也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度，一层层揭开TPU的神秘面纱。<br>
我们将深入探讨：TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？</p>

<p><img src="https://imagev2.xmcdn.com/storages/53ac-audiofreehighqps/25/65/GAqhVp8NiJDXAALbYgR4uiFR.jpg" alt=""></p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
Henry Zhu，前Google TPU工程师，参与V6/V7/V8 TPU研发</p>

<p><strong>【你将听到】</strong><br>
<strong>TPU挑战GPU</strong><br>
03:06 架构对决：GPU像多个大厨，TPU像流水线接力<br>
06:41 TPU vs GPU：谁在模型训练上更强？<br>
10:20 TPU产能之困：HBM、封装与良率</p>

<p><strong>XLA软件黑盒</strong><br>
14:06 Anthropic为何率先下单百万部署？<br>
16:01 黑盒优化如何“榨干”硬件性能<br>
17:47 XLA与CUDA，两种生态之争<br>
19:53 苹果为什么能成为TPU大客户？</p>

<p><strong>“大模型客户”</strong><br>
20:45 Gemini成功背后，TPU做了什么？<br>
22:34 TPU是如何做MoE优化的？<br>
23:45 设计难点：如何押中两三年后的算法？<br>
26:05 TPU的转身：V6开始押注大模型预训练<br>
28:53 Transformer先发优势带来的旗鼓相当能持续多久？<br>
32:04 Meta的TPU托管服务：生态逐渐走向兼容</p>

<p><strong>供应链命门</strong><br>
36:08 拓扑通信架构如何为TPU打赢数据中心成本战<br>
38:27 博通（Broadcom）是谁？为什么它如此关键<br>
42:04 挑战GPU的机会：用户规模越大推理越快<br>
45:36 V7（Ironwood）之后：Gemini实现100%TPU训练<br>
48:15 一句话总结TPU优劣势</p>

<p><strong>TPU十年进化史</strong><br>
49:49 V1推理芯片试水，V2训练芯片旗舰，V4优化推荐算法<br>
52:16 V5/V6：进入大模型时代，推出推理专用版本<br>
56:05 团队演变：软件组话语权越来越重</p>

<p><strong>新星Groq</strong><br>
57:14 踩准每一次红利的编译器公司<br>
59:27 差异化定位：做小规模部署的低延迟优化<br>
01:01:59 AI算力芯片新战局</p>

<p><strong>【更正】</strong><br>
54:20 口误，Groq创始人Jonathan Ross，现为英伟达首席软件架构师</p>

<p><strong>【延伸阅读】</strong><br>
<a href="https://www.thepaper.cn/newsDetail_forward_31831042" rel="nofollow">《谷歌收获大单：与Anthropic达成数百亿美元合作，部署100万个TPU芯片》</a><br>
<a href="https://news.qq.com/rain/a/20260227A0243600" rel="nofollow">《不再单押英伟达，Meta斥资数十亿美元租用谷歌TPU》</a></p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【剪辑】</strong><br>
小师 Jacob<br>
<strong>【运营】</strong><br>
朱婕<br>
<strong>【BGM】</strong><br>
Virtuoso Violin - Rafael Krux<br>
Angular Pulse - Guy Copeland<br>
Top Flow - This Violin</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p>

<p><em>本期节目中嘉宾所表达观点均为其个人看法。<br>
本期节目不构成任何投资建议，投资有风险，入市需谨慎。</em></p><p>Special Guest: Henry Zhu.</p>]]>
  </itunes:summary>
</item>
  </channel>
</rss>
