<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" encoding="UTF-8" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:admin="http://webns.net/mvcb/" xmlns:atom="http://www.w3.org/2005/Atom/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:googleplay="http://www.google.com/schemas/play-podcasts/1.0" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:fireside="http://fireside.fm/modules/rss/fireside">
  <channel>
    <fireside:hostname>web01.fireside.fm</fireside:hostname>
    <fireside:genDate>Wed, 29 Apr 2026 18:35:42 -0500</fireside:genDate>
    <generator>Fireside (https://fireside.fm)</generator>
    <title>硅谷101 - Episodes Tagged with “端到端”</title>
    <link>https://sv101.fireside.fm/tags/%E7%AB%AF%E5%88%B0%E7%AB%AF</link>
    <pubDate>Tue, 09 Sep 2025 16:00:00 -0700</pubDate>
    <description>失败、背叛、不被理解，硅谷精神领袖一直都不是完美的存在；他们是科学家，创造者，行动派，他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目，是一档分享当下最新鲜的技术、知识与思想的科技播客。
公众账号：硅谷101
联系邮箱：podcast@sv101.net
</description>
    <language>zh-cn</language>
    <itunes:type>episodic</itunes:type>
    <itunes:subtitle>这是一档分享当下最新鲜的技术、知识与思想的科技播客</itunes:subtitle>
    <itunes:author>硅谷101</itunes:author>
    <itunes:summary>失败、背叛、不被理解，硅谷精神领袖一直都不是完美的存在；他们是科学家，创造者，行动派，他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目，是一档分享当下最新鲜的技术、知识与思想的科技播客。
公众账号：硅谷101
联系邮箱：podcast@sv101.net
</itunes:summary>
    <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
    <itunes:explicit>no</itunes:explicit>
    <itunes:keywords>tech, business, SiiconValley, 科技, 泓君, 硅谷101</itunes:keywords>
    <itunes:owner>
      <itunes:name>硅谷101</itunes:name>
      <itunes:email>liuhj60@gmail.com</itunes:email>
    </itunes:owner>
<itunes:category text="Technology"/>
<itunes:category text="Business"/>
<itunes:category text="Business">
  <itunes:category text="Entrepreneurship"/>
</itunes:category>
<item>
  <title>E206｜临近机器人GPT-3时刻，具身智能开源模型的加速演进</title>
  <link>https://sv101.fireside.fm/216</link>
  <guid isPermaLink="false">ee64d94d-d209-4398-996b-10f84237ddd0</guid>
  <pubDate>Tue, 09 Sep 2025 16:00:00 -0700</pubDate>
  <author>硅谷101</author>
  <enclosure url="https://aphid.fireside.fm/d/1437767933/f0f20376-8faf-4940-b920-84af6c734e2d/ee64d94d-d209-4398-996b-10f84237ddd0.mp3" length="101877473" type="audio/mpeg"/>
  <itunes:episodeType>full</itunes:episodeType>
  <itunes:season>4</itunes:season>
  <itunes:author>硅谷101</itunes:author>
  <itunes:subtitle>我们距离全场景的通用机器人又还有多远？机器人公司又该如何平衡商业化与研发的节奏？</itunes:subtitle>
  <itunes:duration>1:10:44</itunes:duration>
  <itunes:explicit>no</itunes:explicit>
  <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
  <description>今年机器人模型领域最重要的突破，就是模型的通用性大幅提升，开始了泛化能力的探索，与此同时，这个行业依然面临着长尾问题、数据采集、缺乏统一维护平台等挑战，这期节目我们就来聊聊，业内将如何面对这些挑战？中国和美国的机器人发展路径又有何区别？
本期节目我们邀请了中国具身智能公司自变量机器人的CTO王昊，在这期节目上线时，他们刚开源了大规模真实数据训练的端到端具身基础模型WALL-OSS；以及来自美国具身智能公司Physical Intelligence的研究员柯丽一鸣（Kay Ke），她是π₀、π₀.₅论文作者。
在节目中，嘉宾们表示目前具身智能模型已达到了GPT-2的水平，在最近2到3年将优先在半结构化场景应用，那么我们距离全场景的通用机器人又还有多远？机器人公司又该如何平衡商业化与研发的节奏？
【主播】
泓君，硅谷101创始人，播客主理人
【嘉宾】
王昊，自变量机器人 (https://www.x2robot.com)CTO
柯丽一鸣（Kay Ke），Physical Intelligence (https://www.physicalintelligence.company/)研究员，π₀、π₀.₅论文作者
【硅谷101科技峰会】
《硅谷101》的年度科技大会又回来了，这是我们将有趣的技术干货与故事带到线下的第二年，用最好的内容让大家亲身感受前沿科技的酷炫和温度一直是硅谷101的目标。硅谷10月5日，期待与各位见面，从这里驶向未来！
欢迎点击前往 (https://luma.com/mtqq79ii)购票地址，输入粉丝专属折扣码“VALLEY101FANS”，享85折优惠。
【蚂蚁外滩大会】
硅谷101播客主理人泓君将主持9月11日～12日在上海举行的蚂蚁外滩大会，聊聊AI时代的全球趋势和创新最前沿，感兴趣的朋友欢迎点击领取 (https://www.inclusionconf.com/?sl=vNoLvmF9)硅谷101粉丝专属参会凭证。
【你将听到】
行业突破与泛化能力
05:36 2025年关键进展：模型通用性提升，开始泛化能力探索
07:38 何为模型泛化能力：从熟悉环境到陌生环境的能力一致性
11:44 泛化核心难点：长尾问题、数据采集与缺乏标准评测体系
16:04 如何评判具身智能模型能力：对比任务学习数据量与现实应用表现
数据挑战与硬件瓶颈
17:17 其他两大难点：数据质量与数量平衡、硬件维护缺乏统一平台
20:03 为何需要至少100万小时的数据，才能构成优秀的大模型？
23:06 人类VS机器人学习机制对比：人类的进化已包含了“预训练”
27:14 合成数据在机器人领域的应用：降低数据收集成本，但难以模拟现实物理交互
模型架构与技术路径
31:35 具身智能开源模型WALL-OSS发布：上万小时真实数据，补足当前开源模型的欠缺能力
35:36 WALL-OSS模型开源动机与优势：降低研究门槛，加速生态创新
38:03 架构之争：端到端统一训练VS分层系统设计，模型技术路径尚未统一
40:58 从VLA（视觉语言模型）出世后，具身智能模型路线开始走向趋同化
44:10 具身模型已达到GPT-2的水平，将在1～2年时间达到GPT-3水平
45:31 中美机器人技术路径区别：美国自上而下、先做大模型，中国从现实需求出发、双轨并行
52:31 抓到耗子的都是好猫：算法与操控的难度平衡
54:12 模型高频控制的意义：对未来情况做决策，但更高频率无意义
58:13 视觉难以对未来做精确的预测和建模，但能弥补触觉缺失与力的反馈
01:00:20 传感器比想象更成熟，但机器人还是依赖视觉作为主要训练参数
商业化与落地前景
01:01:31 家用机器人预测：2～3年内进入半结构化场景，5～10年全场景使用
01:05:29 如何平衡商业化与研发：尽可能服务于开放式场景，提高公司组织能力
01:08:43 现实部署的机器人量越大、场景越多样，数据反馈和模型迭代效果将越好
【节目中提到的相关公司和术语】
* Physical Intelligence (PI)：美国具身智能公司，推出了π₀、π₀.₅模型
* 自变量机器人：中国具身智能公司，开源了端到端具身基础模型WALL-OSS
* RT-2：Robotics Transformer 2，谷歌DeepMind推出的新一代AI学习模型
* Genie3：谷歌世界模型的第3代，是DeepMind首个支持“实时交互”的世界模型
* VLA：Vision-Language-Action，视觉-语言-动作模型架构
* Covariant Robotics：一家专注于机器人大脑软件开发的硅谷公司
* 长程任务：Long-Horizon Task，包含一系列连续步骤、需要机器人进行多步推理、规划并执行，最终才能完成的复杂任务
【监制】
泓君
【后期】
AMEI
【运营】
王梓沁、孙泽平
【BGM】
Ever Forward - Francis Wells
Mixed Emotions - Arthur Benson
Supine - Peter Sandberg
【在这里找到我们】
公众号：硅谷101
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」
联系我们：podcast@sv101.net Special Guests: 柯丽一鸣 and 王昊.
</description>
  <itunes:keywords>机器人,大模型,具身智能,GPT,端到端</itunes:keywords>
  <content:encoded>
    <![CDATA[<p>今年机器人模型领域最重要的突破，就是模型的通用性大幅提升，开始了泛化能力的探索，与此同时，这个行业依然面临着长尾问题、数据采集、缺乏统一维护平台等挑战，这期节目我们就来聊聊，业内将如何面对这些挑战？中国和美国的机器人发展路径又有何区别？<br>
本期节目我们邀请了中国具身智能公司自变量机器人的CTO王昊，在这期节目上线时，他们刚开源了大规模真实数据训练的端到端具身基础模型WALL-OSS；以及来自美国具身智能公司Physical Intelligence的研究员柯丽一鸣（Kay Ke），她是π₀、π₀.₅论文作者。<br>
在节目中，嘉宾们表示目前具身智能模型已达到了GPT-2的水平，在最近2到3年将优先在半结构化场景应用，那么我们距离全场景的通用机器人又还有多远？机器人公司又该如何平衡商业化与研发的节奏？</p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
王昊，<a href="https://www.x2robot.com" rel="nofollow">自变量机器人</a>CTO<br>
柯丽一鸣（Kay Ke），<a href="https://www.physicalintelligence.company/" rel="nofollow">Physical Intelligence</a>研究员，π₀、π₀.₅论文作者</p>

<p><strong>【硅谷101科技峰会】</strong><br>
《硅谷101》的年度科技大会又回来了，这是我们将有趣的技术干货与故事带到线下的第二年，用最好的内容让大家亲身感受前沿科技的酷炫和温度一直是硅谷101的目标。硅谷10月5日，期待与各位见面，从这里驶向未来！<br>
欢迎<a href="https://luma.com/mtqq79ii" rel="nofollow">点击前往</a>购票地址，输入粉丝专属折扣码“VALLEY101FANS”，享85折优惠。</p>

<p><strong>【蚂蚁外滩大会】</strong><br>
硅谷101播客主理人泓君将主持9月11日～12日在上海举行的蚂蚁外滩大会，聊聊AI时代的全球趋势和创新最前沿，感兴趣的朋友欢迎<a href="https://www.inclusionconf.com/?sl=vNoLvmF9" rel="nofollow">点击领取</a>硅谷101粉丝专属参会凭证。</p>

<p><strong>【你将听到】</strong><br>
<strong>行业突破与泛化能力</strong><br>
05:36 2025年关键进展：模型通用性提升，开始泛化能力探索<br>
07:38 何为模型泛化能力：从熟悉环境到陌生环境的能力一致性<br>
11:44 泛化核心难点：长尾问题、数据采集与缺乏标准评测体系<br>
16:04 如何评判具身智能模型能力：对比任务学习数据量与现实应用表现</p>

<p><strong>数据挑战与硬件瓶颈</strong><br>
17:17 其他两大难点：数据质量与数量平衡、硬件维护缺乏统一平台<br>
20:03 为何需要至少100万小时的数据，才能构成优秀的大模型？<br>
23:06 人类VS机器人学习机制对比：人类的进化已包含了“预训练”<br>
27:14 合成数据在机器人领域的应用：降低数据收集成本，但难以模拟现实物理交互</p>

<p><strong>模型架构与技术路径</strong><br>
31:35 具身智能开源模型WALL-OSS发布：上万小时真实数据，补足当前开源模型的欠缺能力<br>
35:36 WALL-OSS模型开源动机与优势：降低研究门槛，加速生态创新<br>
38:03 架构之争：端到端统一训练VS分层系统设计，模型技术路径尚未统一<br>
40:58 从VLA（视觉语言模型）出世后，具身智能模型路线开始走向趋同化<br>
44:10 具身模型已达到GPT-2的水平，将在1～2年时间达到GPT-3水平<br>
45:31 中美机器人技术路径区别：美国自上而下、先做大模型，中国从现实需求出发、双轨并行<br>
52:31 抓到耗子的都是好猫：算法与操控的难度平衡<br>
54:12 模型高频控制的意义：对未来情况做决策，但更高频率无意义<br>
58:13 视觉难以对未来做精确的预测和建模，但能弥补触觉缺失与力的反馈<br>
01:00:20 传感器比想象更成熟，但机器人还是依赖视觉作为主要训练参数</p>

<p><strong>商业化与落地前景</strong><br>
01:01:31 家用机器人预测：2～3年内进入半结构化场景，5～10年全场景使用<br>
01:05:29 如何平衡商业化与研发：尽可能服务于开放式场景，提高公司组织能力<br>
01:08:43 现实部署的机器人量越大、场景越多样，数据反馈和模型迭代效果将越好</p>

<p><strong>【节目中提到的相关公司和术语】</strong></p>

<ul>
<li>Physical Intelligence (PI)：美国具身智能公司，推出了π₀、π₀.₅模型</li>
<li>自变量机器人：中国具身智能公司，开源了端到端具身基础模型WALL-OSS</li>
<li>RT-2：Robotics Transformer 2，谷歌DeepMind推出的新一代AI学习模型</li>
<li>Genie3：谷歌世界模型的第3代，是DeepMind首个支持“实时交互”的世界模型</li>
<li>VLA：Vision-Language-Action，视觉-语言-动作模型架构</li>
<li>Covariant Robotics：一家专注于机器人大脑软件开发的硅谷公司</li>
<li>长程任务：Long-Horizon Task，包含一系列连续步骤、需要机器人进行多步推理、规划并执行，最终才能完成的复杂任务</li>
</ul>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【后期】</strong><br>
AMEI<br>
<strong>【运营】</strong><br>
王梓沁、孙泽平<br>
<strong>【BGM】</strong><br>
Ever Forward - Francis Wells<br>
Mixed Emotions - Arthur Benson<br>
Supine - Peter Sandberg</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p><p>Special Guests: 柯丽一鸣 and 王昊.</p>]]>
  </content:encoded>
  <itunes:summary>
    <![CDATA[<p>今年机器人模型领域最重要的突破，就是模型的通用性大幅提升，开始了泛化能力的探索，与此同时，这个行业依然面临着长尾问题、数据采集、缺乏统一维护平台等挑战，这期节目我们就来聊聊，业内将如何面对这些挑战？中国和美国的机器人发展路径又有何区别？<br>
本期节目我们邀请了中国具身智能公司自变量机器人的CTO王昊，在这期节目上线时，他们刚开源了大规模真实数据训练的端到端具身基础模型WALL-OSS；以及来自美国具身智能公司Physical Intelligence的研究员柯丽一鸣（Kay Ke），她是π₀、π₀.₅论文作者。<br>
在节目中，嘉宾们表示目前具身智能模型已达到了GPT-2的水平，在最近2到3年将优先在半结构化场景应用，那么我们距离全场景的通用机器人又还有多远？机器人公司又该如何平衡商业化与研发的节奏？</p>

<p><strong>【主播】</strong><br>
泓君，硅谷101创始人，播客主理人<br>
<strong>【嘉宾】</strong><br>
王昊，<a href="https://www.x2robot.com" rel="nofollow">自变量机器人</a>CTO<br>
柯丽一鸣（Kay Ke），<a href="https://www.physicalintelligence.company/" rel="nofollow">Physical Intelligence</a>研究员，π₀、π₀.₅论文作者</p>

<p><strong>【硅谷101科技峰会】</strong><br>
《硅谷101》的年度科技大会又回来了，这是我们将有趣的技术干货与故事带到线下的第二年，用最好的内容让大家亲身感受前沿科技的酷炫和温度一直是硅谷101的目标。硅谷10月5日，期待与各位见面，从这里驶向未来！<br>
欢迎<a href="https://luma.com/mtqq79ii" rel="nofollow">点击前往</a>购票地址，输入粉丝专属折扣码“VALLEY101FANS”，享85折优惠。</p>

<p><strong>【蚂蚁外滩大会】</strong><br>
硅谷101播客主理人泓君将主持9月11日～12日在上海举行的蚂蚁外滩大会，聊聊AI时代的全球趋势和创新最前沿，感兴趣的朋友欢迎<a href="https://www.inclusionconf.com/?sl=vNoLvmF9" rel="nofollow">点击领取</a>硅谷101粉丝专属参会凭证。</p>

<p><strong>【你将听到】</strong><br>
<strong>行业突破与泛化能力</strong><br>
05:36 2025年关键进展：模型通用性提升，开始泛化能力探索<br>
07:38 何为模型泛化能力：从熟悉环境到陌生环境的能力一致性<br>
11:44 泛化核心难点：长尾问题、数据采集与缺乏标准评测体系<br>
16:04 如何评判具身智能模型能力：对比任务学习数据量与现实应用表现</p>

<p><strong>数据挑战与硬件瓶颈</strong><br>
17:17 其他两大难点：数据质量与数量平衡、硬件维护缺乏统一平台<br>
20:03 为何需要至少100万小时的数据，才能构成优秀的大模型？<br>
23:06 人类VS机器人学习机制对比：人类的进化已包含了“预训练”<br>
27:14 合成数据在机器人领域的应用：降低数据收集成本，但难以模拟现实物理交互</p>

<p><strong>模型架构与技术路径</strong><br>
31:35 具身智能开源模型WALL-OSS发布：上万小时真实数据，补足当前开源模型的欠缺能力<br>
35:36 WALL-OSS模型开源动机与优势：降低研究门槛，加速生态创新<br>
38:03 架构之争：端到端统一训练VS分层系统设计，模型技术路径尚未统一<br>
40:58 从VLA（视觉语言模型）出世后，具身智能模型路线开始走向趋同化<br>
44:10 具身模型已达到GPT-2的水平，将在1～2年时间达到GPT-3水平<br>
45:31 中美机器人技术路径区别：美国自上而下、先做大模型，中国从现实需求出发、双轨并行<br>
52:31 抓到耗子的都是好猫：算法与操控的难度平衡<br>
54:12 模型高频控制的意义：对未来情况做决策，但更高频率无意义<br>
58:13 视觉难以对未来做精确的预测和建模，但能弥补触觉缺失与力的反馈<br>
01:00:20 传感器比想象更成熟，但机器人还是依赖视觉作为主要训练参数</p>

<p><strong>商业化与落地前景</strong><br>
01:01:31 家用机器人预测：2～3年内进入半结构化场景，5～10年全场景使用<br>
01:05:29 如何平衡商业化与研发：尽可能服务于开放式场景，提高公司组织能力<br>
01:08:43 现实部署的机器人量越大、场景越多样，数据反馈和模型迭代效果将越好</p>

<p><strong>【节目中提到的相关公司和术语】</strong></p>

<ul>
<li>Physical Intelligence (PI)：美国具身智能公司，推出了π₀、π₀.₅模型</li>
<li>自变量机器人：中国具身智能公司，开源了端到端具身基础模型WALL-OSS</li>
<li>RT-2：Robotics Transformer 2，谷歌DeepMind推出的新一代AI学习模型</li>
<li>Genie3：谷歌世界模型的第3代，是DeepMind首个支持“实时交互”的世界模型</li>
<li>VLA：Vision-Language-Action，视觉-语言-动作模型架构</li>
<li>Covariant Robotics：一家专注于机器人大脑软件开发的硅谷公司</li>
<li>长程任务：Long-Horizon Task，包含一系列连续步骤、需要机器人进行多步推理、规划并执行，最终才能完成的复杂任务</li>
</ul>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【后期】</strong><br>
AMEI<br>
<strong>【运营】</strong><br>
王梓沁、孙泽平<br>
<strong>【BGM】</strong><br>
Ever Forward - Francis Wells<br>
Mixed Emotions - Arthur Benson<br>
Supine - Peter Sandberg</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p><p>Special Guests: 柯丽一鸣 and 王昊.</p>]]>
  </itunes:summary>
</item>
  </channel>
</rss>
