<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" encoding="UTF-8" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:admin="http://webns.net/mvcb/" xmlns:atom="http://www.w3.org/2005/Atom/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:googleplay="http://www.google.com/schemas/play-podcasts/1.0" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:fireside="http://fireside.fm/modules/rss/fireside">
  <channel>
    <fireside:hostname>web02.fireside.fm</fireside:hostname>
    <fireside:genDate>Sun, 14 Jun 2026 09:25:46 -0500</fireside:genDate>
    <generator>Fireside (https://fireside.fm)</generator>
    <title>硅谷101 - Episodes Tagged with “Gpu”</title>
    <link>https://sv101.fireside.fm/tags/gpu</link>
    <pubDate>Wed, 25 Mar 2026 17:00:00 -0700</pubDate>
    <description>失败、背叛、不被理解，硅谷精神领袖一直都不是完美的存在；他们是科学家，创造者，行动派，他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目，是一档分享当下最新鲜的技术、知识与思想的科技播客。 公众账号：硅谷101 联系邮箱：podcast@sv101.net</description>
    <language>zh-cn</language>
    <itunes:type>episodic</itunes:type>
    <itunes:subtitle>这是一档分享当下最新鲜的技术、知识与思想的科技播客</itunes:subtitle>
    <itunes:author>硅谷101</itunes:author>
    <itunes:summary>失败、背叛、不被理解，硅谷精神领袖一直都不是完美的存在；他们是科学家，创造者，行动派，他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目，是一档分享当下最新鲜的技术、知识与思想的科技播客。 公众账号：硅谷101 联系邮箱：podcast@sv101.net</itunes:summary>
    <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
    <itunes:explicit>no</itunes:explicit>
    <itunes:keywords>tech, business, SiiconValley, 科技, 泓君, 硅谷101</itunes:keywords>
    <itunes:owner>
      <itunes:name>硅谷101</itunes:name>
      <itunes:email>liuhj60@gmail.com</itunes:email>
    </itunes:owner>
<itunes:category text="Technology"/>
<itunes:category text="Business"/>
<itunes:category text="Business">
  <itunes:category text="Entrepreneurship"/>
</itunes:category>
<item>
  <title>E230｜1万亿收入预期背后：英伟达的巅峰与软肋</title>
  <link>https://sv101.fireside.fm/244</link>
  <guid isPermaLink="false">d97446f1-d6e3-4894-89d1-dca0a362b10b</guid>
  <pubDate>Wed, 25 Mar 2026 17:00:00 -0700</pubDate>
  <author>硅谷101</author>
  <enclosure url="https://aphid.fireside.fm/d/1437767933/f0f20376-8faf-4940-b920-84af6c734e2d/d97446f1-d6e3-4894-89d1-dca0a362b10b.mp3" length="95572334" type="audio/mpeg"/>
  <itunes:episodeType>full</itunes:episodeType>
  <itunes:season>4</itunes:season>
  <itunes:author>硅谷101</itunes:author>
  <itunes:subtitle>本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起，</itunes:subtitle>
  <itunes:duration>1:06:21</itunes:duration>
  <itunes:explicit>no</itunes:explicit>
  <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
  <description>&lt;p&gt;&lt;img src="https://imagev2.xmcdn.com/storages/c4ce-audiofreehighqps/29/FA/GAqhI8INmcS2AAHpNQR_oxXw.jpg" alt=""&gt;&lt;/p&gt;

&lt;p&gt;本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起：&lt;br&gt;
&lt;strong&gt;1万亿&lt;/strong&gt;——这是黄仁勋预期到2027年底，Blackwell和Vera Rubin两个平台带来的订单收入。&lt;br&gt;
&lt;strong&gt;7块&lt;/strong&gt;——这是大会一次性发布的Vera Rubin新芯片数量。&lt;br&gt;
&lt;strong&gt;10倍、35倍&lt;/strong&gt;——这是Vera Rubin NVL72 AI机架系统，相比Blackwell，它的推理效率提升了10倍，每瓦Token产出性能是之前的35倍。&lt;br&gt;
但我们聊的远不止数字本身，也不只是芯片的故事。当推理拐点全面到来，算力狂奔的路上，芯片设计、代工产能、推理架构、软件生态、电力基建、云服务运营……这些环节都在被重新丈量。&lt;br&gt;
在这场串联起AI全产业链关键节点的线下对谈中，我们试图穿透英伟达庞大的AI生态帝国表象，看清它真正的护城河，以及那些潜伏在高速增长背后的软肋与隐忧。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【主播】&lt;/strong&gt;&lt;br&gt;
泓君，硅谷101创始人，播客主理人&lt;br&gt;
&lt;strong&gt;【嘉宾】&lt;/strong&gt;&lt;br&gt;
张璐，Fusion Fund创始管理合伙人&lt;br&gt;
Dr.Mark Ren, Agentrys创始人&amp;amp;CEO，前英伟达研究总监&lt;br&gt;
Dr.Zhibin Xiao, ZFLOW AI创始人&amp;amp;CEO，前CASPA主席与董事会顾问&lt;br&gt;
Alex Yeh，GMI Cloud创始人&amp;amp;CEO&lt;/p&gt;

&lt;p&gt;&lt;img src="https://imagev2.xmcdn.com/storages/50ad-audiofreehighqps/EE/F3/GKwRIW4NmdQWADbk8QR_pxN9.png" alt=""&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【你将听到】&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;万亿野心背后的产业现实&lt;/strong&gt;&lt;br&gt;
03:21 万亿目标背后，推理业务正成为英伟达关键收入来源&lt;br&gt;
05:50 供应链瓶颈：CoWoS产能成最大挑战，硬件周期非资金可突破&lt;br&gt;
09:03 七芯齐发的关键：英伟达全公司都在用 Coding Agent 做芯片&lt;br&gt;
10:10 Groq的优势：纯SRAM架构专攻低延迟&lt;br&gt;
15:43 推理芯片创业还有机会吗？关键：找英伟达短板&lt;br&gt;
19:07 未来数据中心是异构的，系统级优化比单芯片更重要&lt;br&gt;
21:25 OpenClaw引爆TOKEN消耗，英伟达NemoCloud能让人惊艳吗？&lt;br&gt;
24:27 SaaS面临挑战：未来软件公司卖的不是软件，是AI劳动力&lt;br&gt;
28:36 未来企业架构：CEO同时管员工和智能体，HR、财务都可外包&lt;br&gt;
30:07 英伟达芯片设计模型ChipNemo，硬件代码也能写，难点在于优化&lt;br&gt;
31:47 谷歌TPU系统能力强，但英伟达的护城河已从CUDA扩展到全栈基础设施&lt;br&gt;
35:28 英伟达的护城河：执行力与供应链&lt;br&gt;
36:14 未来挑战：垂直领域、边缘端与私有化部署的崛起、推理市场红利被分流、资本压力&lt;br&gt;
40:16 观众提问1： 英特尔是否有望成为代工第二源？&lt;br&gt;
42:56 观众提问2：CUDA护城河是否会被Coding Agent削弱？&lt;/p&gt;



&lt;p&gt;&lt;strong&gt;一线云服务商谈数据中心瓶颈&lt;/strong&gt;&lt;br&gt;
46:30 数据中心竞速：靠自发电与预制集装箱加速&lt;br&gt;
50:22 谁在引爆GPU云需求？模型训练、视频生成、AI Coding以及OpenClaw&lt;br&gt;
53:39 模块化、标准化、全套打包的AI工厂方案&lt;br&gt;
56:57 不止GPU缺货，数据中心核心配件供应趋紧&lt;br&gt;
58:42 运营GPU云的核心能力：先有卡，再稳得住，SLA是生死线&lt;br&gt;
01:01:04 GPU折旧比资本市场预估更耐久&lt;br&gt;
01:02:08 观众提问3：AI云服务商的差异化策略&lt;/p&gt;

&lt;p&gt;&lt;img src="https://imagev2.xmcdn.com/storages/121b-audiofreehighqps/DF/36/GKwRIRwNmcTMACQAOwR_ox4C.jpg" alt=""&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【监制】&lt;/strong&gt;&lt;br&gt;
泓君&lt;br&gt;
&lt;strong&gt;【后期】&lt;/strong&gt;&lt;br&gt;
Amei&lt;br&gt;
&lt;strong&gt;【运营】&lt;/strong&gt;&lt;br&gt;
朱婕&lt;br&gt;
&lt;strong&gt;【BGM】&lt;/strong&gt;&lt;br&gt;
Pulse Runner - Helmut Schenker&lt;br&gt;
Interstate 895 - Bonnie Grace&lt;br&gt;
Unfinished Stories - Lennon Hutton&lt;br&gt;
Seven Daughters - Fabien Tell&lt;br&gt;
AI sing-along recaps GTC keynote&lt;/p&gt;

&lt;p&gt;&lt;em&gt;本期节目不构成任何投资建议&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;&lt;img src="https://imagev2.xmcdn.com/storages/139a-audiofreehighqps/BF/FB/GKwRIW4NqiVHAAKfCwSGO-Sb.jpg" alt=""&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【在这里找到我们】&lt;/strong&gt;&lt;br&gt;
公众号：硅谷101&lt;br&gt;
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐&lt;br&gt;
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」&lt;br&gt;
联系我们：&lt;a href="mailto:podcast@sv101.net" rel="nofollow noopener"&gt;podcast@sv101.net&lt;/a&gt; Special Guests: Alex Yeh, Dr.Mark Ren, Dr.Zhibin Xiao, and 张璐.&lt;/p&gt;
</description>
  <itunes:keywords>英伟达, GPU, GTC, Groq, 推理芯片, AI数据中心, TOKEN经济</itunes:keywords>
  <content:encoded>
    <![CDATA[<p><img src="https://imagev2.xmcdn.com/storages/c4ce-audiofreehighqps/29/FA/GAqhI8INmcS2AAHpNQR_oxXw.jpg" alt=""></p>

<p>本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起：<br>
<strong>1万亿</strong>——这是黄仁勋预期到2027年底，Blackwell和Vera Rubin两个平台带来的订单收入。<br>
<strong>7块</strong>——这是大会一次性发布的Vera Rubin新芯片数量。<br>
<strong>10倍、35倍</strong>——这是Vera Rubin NVL72 AI机架系统，相比Blackwell，它的推理效率提升了10倍，每瓦Token产出性能是之前的35倍。<br>
但我们聊的远不止数字本身，也不只是芯片的故事。当推理拐点全面到来，算力狂奔的路上，芯片设计、代工产能、推理架构、软件生态、电力基建、云服务运营……这些环节都在被重新丈量。<br>
在这场串联起AI全产业链关键节点的线下对谈中，我们试图穿透英伟达庞大的AI生态帝国表象，看清它真正的护城河，以及那些潜伏在高速增长背后的软肋与隐忧。</p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
张璐，Fusion Fund创始管理合伙人<br>
Dr.Mark Ren, Agentrys创始人&amp;CEO，前英伟达研究总监<br>
Dr.Zhibin Xiao, ZFLOW AI创始人&amp;CEO，前CASPA主席与董事会顾问<br>
Alex Yeh，GMI Cloud创始人&amp;CEO</p>

<p><img src="https://imagev2.xmcdn.com/storages/50ad-audiofreehighqps/EE/F3/GKwRIW4NmdQWADbk8QR_pxN9.png" alt=""></p>

<p><strong>【你将听到】</strong><br>
<strong>万亿野心背后的产业现实</strong><br>
03:21 万亿目标背后，推理业务正成为英伟达关键收入来源<br>
05:50 供应链瓶颈：CoWoS产能成最大挑战，硬件周期非资金可突破<br>
09:03 七芯齐发的关键：英伟达全公司都在用 Coding Agent 做芯片<br>
10:10 Groq的优势：纯SRAM架构专攻低延迟<br>
15:43 推理芯片创业还有机会吗？关键：找英伟达短板<br>
19:07 未来数据中心是异构的，系统级优化比单芯片更重要<br>
21:25 OpenClaw引爆TOKEN消耗，英伟达NemoCloud能让人惊艳吗？<br>
24:27 SaaS面临挑战：未来软件公司卖的不是软件，是AI劳动力<br>
28:36 未来企业架构：CEO同时管员工和智能体，HR、财务都可外包<br>
30:07 英伟达芯片设计模型ChipNemo，硬件代码也能写，难点在于优化<br>
31:47 谷歌TPU系统能力强，但英伟达的护城河已从CUDA扩展到全栈基础设施<br>
35:28 英伟达的护城河：执行力与供应链<br>
36:14 未来挑战：垂直领域、边缘端与私有化部署的崛起、推理市场红利被分流、资本压力<br>
40:16 观众提问1： 英特尔是否有望成为代工第二源？<br>
42:56 观众提问2：CUDA护城河是否会被Coding Agent削弱？</p>



<p><strong>一线云服务商谈数据中心瓶颈</strong><br>
46:30 数据中心竞速：靠自发电与预制集装箱加速<br>
50:22 谁在引爆GPU云需求？模型训练、视频生成、AI Coding以及OpenClaw<br>
53:39 模块化、标准化、全套打包的AI工厂方案<br>
56:57 不止GPU缺货，数据中心核心配件供应趋紧<br>
58:42 运营GPU云的核心能力：先有卡，再稳得住，SLA是生死线<br>
01:01:04 GPU折旧比资本市场预估更耐久<br>
01:02:08 观众提问3：AI云服务商的差异化策略</p>

<p><img src="https://imagev2.xmcdn.com/storages/121b-audiofreehighqps/DF/36/GKwRIRwNmcTMACQAOwR_ox4C.jpg" alt=""></p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【后期】</strong><br>
Amei<br>
<strong>【运营】</strong><br>
朱婕<br>
<strong>【BGM】</strong><br>
Pulse Runner - Helmut Schenker<br>
Interstate 895 - Bonnie Grace<br>
Unfinished Stories - Lennon Hutton<br>
Seven Daughters - Fabien Tell<br>
AI sing-along recaps GTC keynote</p>

<p><em>本期节目不构成任何投资建议</em></p>

<p><img src="https://imagev2.xmcdn.com/storages/139a-audiofreehighqps/BF/FB/GKwRIW4NqiVHAAKfCwSGO-Sb.jpg" alt=""></p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow noopener">podcast@sv101.net</a></p><p>Special Guests: Alex Yeh, Dr.Mark Ren, Dr.Zhibin Xiao, and 张璐.</p>]]>
  </content:encoded>
  <itunes:summary>
    <![CDATA[<p><img src="https://imagev2.xmcdn.com/storages/c4ce-audiofreehighqps/29/FA/GAqhI8INmcS2AAHpNQR_oxXw.jpg" alt=""></p>

<p>本期播客是硅谷101在GTC 2026大会期间的线下特别录制，我们从老黄在Keynote上抛出的那几个大数字开始聊起：<br>
<strong>1万亿</strong>——这是黄仁勋预期到2027年底，Blackwell和Vera Rubin两个平台带来的订单收入。<br>
<strong>7块</strong>——这是大会一次性发布的Vera Rubin新芯片数量。<br>
<strong>10倍、35倍</strong>——这是Vera Rubin NVL72 AI机架系统，相比Blackwell，它的推理效率提升了10倍，每瓦Token产出性能是之前的35倍。<br>
但我们聊的远不止数字本身，也不只是芯片的故事。当推理拐点全面到来，算力狂奔的路上，芯片设计、代工产能、推理架构、软件生态、电力基建、云服务运营……这些环节都在被重新丈量。<br>
在这场串联起AI全产业链关键节点的线下对谈中，我们试图穿透英伟达庞大的AI生态帝国表象，看清它真正的护城河，以及那些潜伏在高速增长背后的软肋与隐忧。</p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
张璐，Fusion Fund创始管理合伙人<br>
Dr.Mark Ren, Agentrys创始人&amp;CEO，前英伟达研究总监<br>
Dr.Zhibin Xiao, ZFLOW AI创始人&amp;CEO，前CASPA主席与董事会顾问<br>
Alex Yeh，GMI Cloud创始人&amp;CEO</p>

<p><img src="https://imagev2.xmcdn.com/storages/50ad-audiofreehighqps/EE/F3/GKwRIW4NmdQWADbk8QR_pxN9.png" alt=""></p>

<p><strong>【你将听到】</strong><br>
<strong>万亿野心背后的产业现实</strong><br>
03:21 万亿目标背后，推理业务正成为英伟达关键收入来源<br>
05:50 供应链瓶颈：CoWoS产能成最大挑战，硬件周期非资金可突破<br>
09:03 七芯齐发的关键：英伟达全公司都在用 Coding Agent 做芯片<br>
10:10 Groq的优势：纯SRAM架构专攻低延迟<br>
15:43 推理芯片创业还有机会吗？关键：找英伟达短板<br>
19:07 未来数据中心是异构的，系统级优化比单芯片更重要<br>
21:25 OpenClaw引爆TOKEN消耗，英伟达NemoCloud能让人惊艳吗？<br>
24:27 SaaS面临挑战：未来软件公司卖的不是软件，是AI劳动力<br>
28:36 未来企业架构：CEO同时管员工和智能体，HR、财务都可外包<br>
30:07 英伟达芯片设计模型ChipNemo，硬件代码也能写，难点在于优化<br>
31:47 谷歌TPU系统能力强，但英伟达的护城河已从CUDA扩展到全栈基础设施<br>
35:28 英伟达的护城河：执行力与供应链<br>
36:14 未来挑战：垂直领域、边缘端与私有化部署的崛起、推理市场红利被分流、资本压力<br>
40:16 观众提问1： 英特尔是否有望成为代工第二源？<br>
42:56 观众提问2：CUDA护城河是否会被Coding Agent削弱？</p>



<p><strong>一线云服务商谈数据中心瓶颈</strong><br>
46:30 数据中心竞速：靠自发电与预制集装箱加速<br>
50:22 谁在引爆GPU云需求？模型训练、视频生成、AI Coding以及OpenClaw<br>
53:39 模块化、标准化、全套打包的AI工厂方案<br>
56:57 不止GPU缺货，数据中心核心配件供应趋紧<br>
58:42 运营GPU云的核心能力：先有卡，再稳得住，SLA是生死线<br>
01:01:04 GPU折旧比资本市场预估更耐久<br>
01:02:08 观众提问3：AI云服务商的差异化策略</p>

<p><img src="https://imagev2.xmcdn.com/storages/121b-audiofreehighqps/DF/36/GKwRIRwNmcTMACQAOwR_ox4C.jpg" alt=""></p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【后期】</strong><br>
Amei<br>
<strong>【运营】</strong><br>
朱婕<br>
<strong>【BGM】</strong><br>
Pulse Runner - Helmut Schenker<br>
Interstate 895 - Bonnie Grace<br>
Unfinished Stories - Lennon Hutton<br>
Seven Daughters - Fabien Tell<br>
AI sing-along recaps GTC keynote</p>

<p><em>本期节目不构成任何投资建议</em></p>

<p><img src="https://imagev2.xmcdn.com/storages/139a-audiofreehighqps/BF/FB/GKwRIW4NqiVHAAKfCwSGO-Sb.jpg" alt=""></p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow noopener">podcast@sv101.net</a></p><p>Special Guests: Alex Yeh, Dr.Mark Ren, Dr.Zhibin Xiao, and 张璐.</p>]]>
  </itunes:summary>
</item>
<item>
  <title>E228｜谷歌TPU能撼动英伟达吗？前TPU工程师首次揭秘</title>
  <link>https://sv101.fireside.fm/241</link>
  <guid isPermaLink="false">fd17090c-0d72-4c0d-aa3e-9b00bc062149</guid>
  <pubDate>Thu, 12 Mar 2026 17:00:00 -0700</pubDate>
  <author>硅谷101</author>
  <enclosure url="https://aphid.fireside.fm/d/1437767933/f0f20376-8faf-4940-b920-84af6c734e2d/fd17090c-0d72-4c0d-aa3e-9b00bc062149.mp3" length="99114212" type="audio/mpeg"/>
  <itunes:episodeType>full</itunes:episodeType>
  <itunes:season>4</itunes:season>
  <itunes:author>硅谷101</itunes:author>
  <itunes:subtitle>TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？</itunes:subtitle>
  <itunes:duration>1:06:46</itunes:duration>
  <itunes:explicit>no</itunes:explicit>
  <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
  <description>&lt;p&gt;&lt;img src="https://imagev2.xmcdn.com/storages/a723-audiofreehighqps/B7/79/GAqhfD0NByqOAAHpNQRBU__s.jpg" alt=""&gt;&lt;/p&gt;

&lt;p&gt;在AI算力争霸时代，英伟达凭借GPU市值一路狂飙。但如今，它的蛋糕正在被一点点分食——2024年，苹果论文披露Apple Intelligence全部由TPU训练；2025年，Anthropic签下数十亿美元订单，购买TPU训练Claude；近期，Meta与谷歌签署数十亿美元协议，租用TPU跑Llama。&lt;br&gt;
TPU一直是谷歌低调的“自家武器”，在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗，人们才开始重新审视：这套从搜索推荐系统中长出来的定制芯片，究竟藏着多少秘密？&lt;br&gt;
本期播客，我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发，也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度，一层层揭开TPU的神秘面纱。&lt;br&gt;
我们将深入探讨：TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？&lt;/p&gt;

&lt;p&gt;&lt;img src="https://imagev2.xmcdn.com/storages/53ac-audiofreehighqps/25/65/GAqhVp8NiJDXAALbYgR4uiFR.jpg" alt=""&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【主播】&lt;/strong&gt;&lt;br&gt;
泓君，硅谷101创始人，播客主理人&lt;br&gt;
&lt;strong&gt;【嘉宾】&lt;/strong&gt;&lt;br&gt;
Henry Zhu，前Google TPU工程师，参与V6/V7/V8 TPU研发&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【你将听到】&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;TPU挑战GPU&lt;/strong&gt;&lt;br&gt;
03:06 架构对决：GPU像多个大厨，TPU像流水线接力&lt;br&gt;
06:41 TPU vs GPU：谁在模型训练上更强？&lt;br&gt;
10:20 TPU产能之困：HBM、封装与良率&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;XLA软件黑盒&lt;/strong&gt;&lt;br&gt;
14:06 Anthropic为何率先下单百万部署？&lt;br&gt;
16:01 黑盒优化如何“榨干”硬件性能&lt;br&gt;
17:47 XLA与CUDA，两种生态之争&lt;br&gt;
19:53 苹果为什么能成为TPU大客户？&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;“大模型客户”&lt;/strong&gt;&lt;br&gt;
20:45 Gemini成功背后，TPU做了什么？&lt;br&gt;
22:34 TPU是如何做MoE优化的？&lt;br&gt;
23:45 设计难点：如何押中两三年后的算法？&lt;br&gt;
26:05 TPU的转身：V6开始押注大模型预训练&lt;br&gt;
28:53 Transformer先发优势带来的旗鼓相当能持续多久？&lt;br&gt;
32:04 Meta的TPU托管服务：生态逐渐走向兼容&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;供应链命门&lt;/strong&gt;&lt;br&gt;
36:08 拓扑通信架构如何为TPU打赢数据中心成本战&lt;br&gt;
38:27 博通（Broadcom）是谁？为什么它如此关键&lt;br&gt;
42:04 挑战GPU的机会：用户规模越大推理越快&lt;br&gt;
45:36 V7（Ironwood）之后：Gemini实现100%TPU训练&lt;br&gt;
48:15 一句话总结TPU优劣势&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;TPU十年进化史&lt;/strong&gt;&lt;br&gt;
49:49 V1推理芯片试水，V2训练芯片旗舰，V4优化推荐算法&lt;br&gt;
52:16 V5/V6：进入大模型时代，推出推理专用版本&lt;br&gt;
56:05 团队演变：软件组话语权越来越重&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;新星Groq&lt;/strong&gt;&lt;br&gt;
57:14 踩准每一次红利的编译器公司&lt;br&gt;
59:27 差异化定位：做小规模部署的低延迟优化&lt;br&gt;
01:01:59 AI算力芯片新战局&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【更正】&lt;/strong&gt;&lt;br&gt;
54:20 口误，Groq创始人Jonathan Ross，现为英伟达首席软件架构师&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【延伸阅读】&lt;/strong&gt;&lt;br&gt;
&lt;a href="https://www.thepaper.cn/newsDetail_forward_31831042" rel="nofollow noopener"&gt;《谷歌收获大单：与Anthropic达成数百亿美元合作，部署100万个TPU芯片》&lt;/a&gt;&lt;br&gt;
&lt;a href="https://news.qq.com/rain/a/20260227A0243600" rel="nofollow noopener"&gt;《不再单押英伟达，Meta斥资数十亿美元租用谷歌TPU》&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【监制】&lt;/strong&gt;&lt;br&gt;
泓君&lt;br&gt;
&lt;strong&gt;【剪辑】&lt;/strong&gt;&lt;br&gt;
小师 Jacob&lt;br&gt;
&lt;strong&gt;【运营】&lt;/strong&gt;&lt;br&gt;
朱婕&lt;br&gt;
&lt;strong&gt;【BGM】&lt;/strong&gt;&lt;br&gt;
Virtuoso Violin - Rafael Krux&lt;br&gt;
Angular Pulse - Guy Copeland&lt;br&gt;
Top Flow - This Violin&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;【在这里找到我们】&lt;/strong&gt;&lt;br&gt;
公众号：硅谷101&lt;br&gt;
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐&lt;br&gt;
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」&lt;br&gt;
联系我们：&lt;a href="mailto:podcast@sv101.net" rel="nofollow noopener"&gt;podcast@sv101.net&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;em&gt;本期节目中嘉宾所表达观点均为其个人看法。&lt;br&gt;
本期节目不构成任何投资建议，投资有风险，入市需谨慎。&lt;/em&gt; Special Guest: Henry Zhu.&lt;/p&gt;
</description>
  <itunes:keywords>TPU, 谷歌, Gemini, Ironwood, GPU, 英伟达, Groq, AI, 芯片</itunes:keywords>
  <content:encoded>
    <![CDATA[<p><img src="https://imagev2.xmcdn.com/storages/a723-audiofreehighqps/B7/79/GAqhfD0NByqOAAHpNQRBU__s.jpg" alt=""></p>

<p>在AI算力争霸时代，英伟达凭借GPU市值一路狂飙。但如今，它的蛋糕正在被一点点分食——2024年，苹果论文披露Apple Intelligence全部由TPU训练；2025年，Anthropic签下数十亿美元订单，购买TPU训练Claude；近期，Meta与谷歌签署数十亿美元协议，租用TPU跑Llama。<br>
TPU一直是谷歌低调的“自家武器”，在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗，人们才开始重新审视：这套从搜索推荐系统中长出来的定制芯片，究竟藏着多少秘密？<br>
本期播客，我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发，也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度，一层层揭开TPU的神秘面纱。<br>
我们将深入探讨：TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？</p>

<p><img src="https://imagev2.xmcdn.com/storages/53ac-audiofreehighqps/25/65/GAqhVp8NiJDXAALbYgR4uiFR.jpg" alt=""></p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
Henry Zhu，前Google TPU工程师，参与V6/V7/V8 TPU研发</p>

<p><strong>【你将听到】</strong><br>
<strong>TPU挑战GPU</strong><br>
03:06 架构对决：GPU像多个大厨，TPU像流水线接力<br>
06:41 TPU vs GPU：谁在模型训练上更强？<br>
10:20 TPU产能之困：HBM、封装与良率</p>

<p><strong>XLA软件黑盒</strong><br>
14:06 Anthropic为何率先下单百万部署？<br>
16:01 黑盒优化如何“榨干”硬件性能<br>
17:47 XLA与CUDA，两种生态之争<br>
19:53 苹果为什么能成为TPU大客户？</p>

<p><strong>“大模型客户”</strong><br>
20:45 Gemini成功背后，TPU做了什么？<br>
22:34 TPU是如何做MoE优化的？<br>
23:45 设计难点：如何押中两三年后的算法？<br>
26:05 TPU的转身：V6开始押注大模型预训练<br>
28:53 Transformer先发优势带来的旗鼓相当能持续多久？<br>
32:04 Meta的TPU托管服务：生态逐渐走向兼容</p>

<p><strong>供应链命门</strong><br>
36:08 拓扑通信架构如何为TPU打赢数据中心成本战<br>
38:27 博通（Broadcom）是谁？为什么它如此关键<br>
42:04 挑战GPU的机会：用户规模越大推理越快<br>
45:36 V7（Ironwood）之后：Gemini实现100%TPU训练<br>
48:15 一句话总结TPU优劣势</p>

<p><strong>TPU十年进化史</strong><br>
49:49 V1推理芯片试水，V2训练芯片旗舰，V4优化推荐算法<br>
52:16 V5/V6：进入大模型时代，推出推理专用版本<br>
56:05 团队演变：软件组话语权越来越重</p>

<p><strong>新星Groq</strong><br>
57:14 踩准每一次红利的编译器公司<br>
59:27 差异化定位：做小规模部署的低延迟优化<br>
01:01:59 AI算力芯片新战局</p>

<p><strong>【更正】</strong><br>
54:20 口误，Groq创始人Jonathan Ross，现为英伟达首席软件架构师</p>

<p><strong>【延伸阅读】</strong><br>
<a href="https://www.thepaper.cn/newsDetail_forward_31831042" rel="nofollow noopener">《谷歌收获大单：与Anthropic达成数百亿美元合作，部署100万个TPU芯片》</a><br>
<a href="https://news.qq.com/rain/a/20260227A0243600" rel="nofollow noopener">《不再单押英伟达，Meta斥资数十亿美元租用谷歌TPU》</a></p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【剪辑】</strong><br>
小师 Jacob<br>
<strong>【运营】</strong><br>
朱婕<br>
<strong>【BGM】</strong><br>
Virtuoso Violin - Rafael Krux<br>
Angular Pulse - Guy Copeland<br>
Top Flow - This Violin</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow noopener">podcast@sv101.net</a></p>

<p><em>本期节目中嘉宾所表达观点均为其个人看法。<br>
本期节目不构成任何投资建议，投资有风险，入市需谨慎。</em></p><p>Special Guest: Henry Zhu.</p>]]>
  </content:encoded>
  <itunes:summary>
    <![CDATA[<p><img src="https://imagev2.xmcdn.com/storages/a723-audiofreehighqps/B7/79/GAqhfD0NByqOAAHpNQRBU__s.jpg" alt=""></p>

<p>在AI算力争霸时代，英伟达凭借GPU市值一路狂飙。但如今，它的蛋糕正在被一点点分食——2024年，苹果论文披露Apple Intelligence全部由TPU训练；2025年，Anthropic签下数十亿美元订单，购买TPU训练Claude；近期，Meta与谷歌签署数十亿美元协议，租用TPU跑Llama。<br>
TPU一直是谷歌低调的“自家武器”，在过去十年里驱动着几乎全部核心产品。直到TPU训练的Gemini 3打了一场漂亮的翻身仗，人们才开始重新审视：这套从搜索推荐系统中长出来的定制芯片，究竟藏着多少秘密？<br>
本期播客，我们邀请到前谷歌TPU工程师Henry。他在2018年至2024年间深度参与了三代TPU的研发，也见证了大模型时代TPU的关键转型。他将从硬件架构、软件生态、生产供应链三个维度，一层层揭开TPU的神秘面纱。<br>
我们将深入探讨：TPU与GPU的架构有何根本不同？TPU的产能瓶颈卡在哪里？当谷歌开始向Anthropic、Meta开放TPU，它在软件生态上要迈过哪些坎？如果未来模型的底层范式发生改变，TPU还能押准方向吗？而最关键的问题是：TPU真的有机会撼动英伟达的霸主地位吗？</p>

<p><img src="https://imagev2.xmcdn.com/storages/53ac-audiofreehighqps/25/65/GAqhVp8NiJDXAALbYgR4uiFR.jpg" alt=""></p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
Henry Zhu，前Google TPU工程师，参与V6/V7/V8 TPU研发</p>

<p><strong>【你将听到】</strong><br>
<strong>TPU挑战GPU</strong><br>
03:06 架构对决：GPU像多个大厨，TPU像流水线接力<br>
06:41 TPU vs GPU：谁在模型训练上更强？<br>
10:20 TPU产能之困：HBM、封装与良率</p>

<p><strong>XLA软件黑盒</strong><br>
14:06 Anthropic为何率先下单百万部署？<br>
16:01 黑盒优化如何“榨干”硬件性能<br>
17:47 XLA与CUDA，两种生态之争<br>
19:53 苹果为什么能成为TPU大客户？</p>

<p><strong>“大模型客户”</strong><br>
20:45 Gemini成功背后，TPU做了什么？<br>
22:34 TPU是如何做MoE优化的？<br>
23:45 设计难点：如何押中两三年后的算法？<br>
26:05 TPU的转身：V6开始押注大模型预训练<br>
28:53 Transformer先发优势带来的旗鼓相当能持续多久？<br>
32:04 Meta的TPU托管服务：生态逐渐走向兼容</p>

<p><strong>供应链命门</strong><br>
36:08 拓扑通信架构如何为TPU打赢数据中心成本战<br>
38:27 博通（Broadcom）是谁？为什么它如此关键<br>
42:04 挑战GPU的机会：用户规模越大推理越快<br>
45:36 V7（Ironwood）之后：Gemini实现100%TPU训练<br>
48:15 一句话总结TPU优劣势</p>

<p><strong>TPU十年进化史</strong><br>
49:49 V1推理芯片试水，V2训练芯片旗舰，V4优化推荐算法<br>
52:16 V5/V6：进入大模型时代，推出推理专用版本<br>
56:05 团队演变：软件组话语权越来越重</p>

<p><strong>新星Groq</strong><br>
57:14 踩准每一次红利的编译器公司<br>
59:27 差异化定位：做小规模部署的低延迟优化<br>
01:01:59 AI算力芯片新战局</p>

<p><strong>【更正】</strong><br>
54:20 口误，Groq创始人Jonathan Ross，现为英伟达首席软件架构师</p>

<p><strong>【延伸阅读】</strong><br>
<a href="https://www.thepaper.cn/newsDetail_forward_31831042" rel="nofollow noopener">《谷歌收获大单：与Anthropic达成数百亿美元合作，部署100万个TPU芯片》</a><br>
<a href="https://news.qq.com/rain/a/20260227A0243600" rel="nofollow noopener">《不再单押英伟达，Meta斥资数十亿美元租用谷歌TPU》</a></p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【剪辑】</strong><br>
小师 Jacob<br>
<strong>【运营】</strong><br>
朱婕<br>
<strong>【BGM】</strong><br>
Virtuoso Violin - Rafael Krux<br>
Angular Pulse - Guy Copeland<br>
Top Flow - This Violin</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow noopener">podcast@sv101.net</a></p>

<p><em>本期节目中嘉宾所表达观点均为其个人看法。<br>
本期节目不构成任何投资建议，投资有风险，入市需谨慎。</em></p><p>Special Guest: Henry Zhu.</p>]]>
  </itunes:summary>
</item>
  </channel>
</rss>
