<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" encoding="UTF-8" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:admin="http://webns.net/mvcb/" xmlns:atom="http://www.w3.org/2005/Atom/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:googleplay="http://www.google.com/schemas/play-podcasts/1.0" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:fireside="http://fireside.fm/modules/rss/fireside">
  <channel>
    <fireside:hostname>web01.fireside.fm</fireside:hostname>
    <fireside:genDate>Sat, 02 May 2026 13:52:22 -0500</fireside:genDate>
    <generator>Fireside (https://fireside.fm)</generator>
    <title>硅谷101 - Episodes Tagged with “Manus”</title>
    <link>https://sv101.fireside.fm/tags/manus</link>
    <pubDate>Fri, 25 Jul 2025 17:00:00 -0700</pubDate>
    <description>失败、背叛、不被理解，硅谷精神领袖一直都不是完美的存在；他们是科学家，创造者，行动派，他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目，是一档分享当下最新鲜的技术、知识与思想的科技播客。
公众账号：硅谷101
联系邮箱：podcast@sv101.net
</description>
    <language>zh-cn</language>
    <itunes:type>episodic</itunes:type>
    <itunes:subtitle>这是一档分享当下最新鲜的技术、知识与思想的科技播客</itunes:subtitle>
    <itunes:author>硅谷101</itunes:author>
    <itunes:summary>失败、背叛、不被理解，硅谷精神领袖一直都不是完美的存在；他们是科学家，创造者，行动派，他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目，是一档分享当下最新鲜的技术、知识与思想的科技播客。
公众账号：硅谷101
联系邮箱：podcast@sv101.net
</itunes:summary>
    <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
    <itunes:explicit>no</itunes:explicit>
    <itunes:keywords>tech, business, SiiconValley, 科技, 泓君, 硅谷101</itunes:keywords>
    <itunes:owner>
      <itunes:name>硅谷101</itunes:name>
      <itunes:email>liuhj60@gmail.com</itunes:email>
    </itunes:owner>
<itunes:category text="Technology"/>
<itunes:category text="Business"/>
<itunes:category text="Business">
  <itunes:category text="Entrepreneurship"/>
</itunes:category>
<item>
  <title>E201｜OpenAI挑战通用型AI Agent，聊聊Agent的底层架构、AGI转折点与RL人才分布</title>
  <link>https://sv101.fireside.fm/211</link>
  <guid isPermaLink="false">aa07ca42-2e0c-4009-8e2f-9fca346bfaad</guid>
  <pubDate>Fri, 25 Jul 2025 17:00:00 -0700</pubDate>
  <author>硅谷101</author>
  <enclosure url="https://aphid.fireside.fm/d/1437767933/f0f20376-8faf-4940-b920-84af6c734e2d/aa07ca42-2e0c-4009-8e2f-9fca346bfaad.mp3" length="114590897" type="audio/mpeg"/>
  <itunes:episodeType>full</itunes:episodeType>
  <itunes:season>4</itunes:season>
  <itunes:author>硅谷101</itunes:author>
  <itunes:subtitle>多维度测评ChatGPT Agent使用体验，并深入拆解Agent的四大底层设计逻辑、探讨强化学习的训练路径，以及我们迎接“超级智能时刻”所面临的技术挑战。</itunes:subtitle>
  <itunes:duration>1:19:34</itunes:duration>
  <itunes:explicit>no</itunes:explicit>
  <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
  <description>美国时间7月17日，OpenAI终于迎来了它的“Agent时刻”——通用型ChatGPT Agent正式发布。它整合了深度研究工具Deep Research与执行工具Operator，可一站式完成复杂任务，但仍存在速度慢、个性化不足等短板。
ChatGPT Agent的技术本质是“浏览器+沙盒”的混合架构，与Manus、Genspark形成技术路线差异。在底层架构层面，浏览器（Browser-based）代理虽堪称“万能”，但运行速度较慢；沙盒（Sandbox）代理高效，但无法联网操作、工具库受限；而工作流集成（Workflow API）速度快、结果精准。在训练方法层面，强化学习（RL）被视为AGI从“执行者”向“创新者”跨越的重要路径，但当前面临的验证泛化与训练不稳定难题，如同两道枷锁锁住了这扇进阶之门。
强化学习能否成为通用AI爆发的关键引擎？AGI实现技术跃迁的分水岭究竟在哪？在把Agent产品化和商业化的道路上，又如何平衡模型能力与用户体验？本期《硅谷101》，主播泓君对话Pokee.ai创始人朱哲清，多维度测评ChatGPT Agent使用体验，并深入拆解Agent的四大底层设计逻辑、探讨强化学习的训练路径，以及我们迎接“超级智能时刻”所面临的技术挑战。
【主播】
泓君Jane，硅谷101创始人，播客主理人
【嘉宾】
朱哲清，Pokee.ai创始人，前MetaAI应用强化学习团队负责人，斯坦福强化学习博士（X：@ZheqingZhu）
【101 Weekly新节目预告】
硅谷101上线了一版更加轻量级的音视频节目「101Weekly」，每周由我们的三位主播复盘三个商业热点事件，每期10分钟左右，并请来行业专家来一手分析解读，希望这每周的30分钟，帮助大家轻松了解一周新闻大事件，点击收听 (https://www.xiaoyuzhoufm.com/podcast/686add4193fd2d72b8d5d777)。
音频版：Fireside (https://sv101.fireside.fm/)｜小宇宙 (https://www.xiaoyuzhoufm.com/podcast/686add4193fd2d72b8d5d777)｜苹果播客｜Spotify
视频版：BiliBIli (https://space.bilibili.com/508452265?spm_id_from=333.337.0.0)｜Youtube (https://www.youtube.com/@TheValley101)｜视频号｜抖音
【你将听到】
ChatGPT Agent首发体验与技术拆解
00:21 拆解AI Agent技术路径：什么是“聪明机器的大脑”？
02:12  ChatGPT Agent一手实测：浏览器操作如超人 VS 速度慢如蜗牛
04:26 视觉能力加持：Action体验有提升，但仍需等待
05:45 旅行规划场景：支付环节仍需人类介入，信任门槛尚未跨越 
08:11 “全部推翻重来”：缺乏个性化机制、记不住反馈细节
10:07 ChatGPT Agent“打通搜索与执行”的本质：Deep Research + Operator的“拼贴工程”
通用型Agent技术路径对比
12:31 通用Agent技术类比：Operator最早专注Browser操作，如今叠加Sandbox后，在通用Agent里表现最强
14:52 四大技术方向优劣势对比：
  15:40 浏览器为主：通用性强，但速度慢、体验差、成本高
  17:21 开放虚拟机：本地运行快，但访问互联网等外部服务不易
  17:37 大模型+虚拟机：GensPark模式，相对环节更封闭
  18:46 Workflow+工具集成：Pokee模式，交付好但不是所有任务都能做
20:23 Manus模式：Browser-based，Sandbox强，全能但慢
22:28 Genspark模式：标化工作流，牺牲通用性换取速度与稳定性
23:41 Pokee模式：速度快成本低，但范围受限
26:52 B端客户还是C端客户，适用场景与底层技术逻辑完全不同
29:36 Agent将重塑互联网入口，传统门户流量将大幅下滑
32:03 MCP无人维护：2万个协议中，真正可用的不到200个
33:47 Agent时代的广告逻辑大变：反而更有利于创作者？
强化学习与AGI的五个层次
38:52 强化学习适用场景：目标明确、机制清晰但数据稀缺
41:50 新兴路径：强化学习预训练（RL Pretraining）
44:40 一个非共识：验证（Verification）方向的泛化性，可能产出人类所不拥有的知识
46:51 AGI五级路径中，“执行者”(L3) 与“创新者”(L4) 间存在巨大技术鸿沟，核心在于验证能力
50:37 强化学习预训练的致命弱点：给出的解决方案可能“人类都看不懂”
52:43 强化学习（RLHF） Vs 监督学习微调（SFT）：效果×2，但成本×10
Meta收购ScaleAI背后的逻辑
54:08 Meta收购Scale：多模态数据仍然是瓶颈
56:46 多模态数据的最大挑战：数据复杂 + 维度多 → 主观标准难统一
57:59 AI的核心问题：短期算力，中期数据，长期人才
59:10 如何让Agent调用更好用？自研模型
01:03:33 平衡模型能力与用户体验：模型能力决定下限，产品细节决定上限
强化学习的人才大本营
01:05:42 RL奠基人、2024年图灵奖得主Richard Sutton：想法极具前瞻性，且坚持原则
01:07:47 模型可塑性挑战：AI的“灾难性遗忘”亟待解决
01:09:56 奖励函数设计难：强化学习中如何设定“道德且有效”的多目标激励
01:11:47 RL核心研究圈：学术界与业界均高度集中
    学术界：OpenAI早期团队，Peter Abbeel, Sergey Levine , Richard Sutton
    业界：以David Silver为代表的DeepMind员工、以John Langford为代表的微软员工等
01:12:50 从AlphaGo开始，伦敦成为强化学习研究的重要中心
01:15:28 如何像投资人销售过于超前的想法：只说一个非共识
01:16:58 市场正在分化，技术路径选择是创业公司活下来的核心
【节目中提到的AI Agent】
OpenAI相关：
ChatGPT Agent｜Operator｜Deep Research
其他：
Manus｜Genspark｜Perplexity｜Claude Agent｜Fellou｜Flowise｜Zapier｜UIPath｜Replicate
【节目提到的相关术语】
MCP / Model Context Protocol（模型上下文协议）
A2A（Agent-to-Agent Protocol）
SDK（软件开发工具包）
API（应用程序接口）
Vision Model
Browser-based Agent
Sandbox（沙盒环境）
Virtual Machine (VM)
Token Consumption（Token消耗）
Tool Calling：调用第三方工具或API完成任务
Workflow-based Agent
Reinforcement Learning / RL（强化学习）
RL Fine-tuning / RLFT（强化学习微调）
RL Pre-training（强化学习预训练）
Verification（验证机制）
Ground Truth（基准真值）
Hallucination（幻觉）
Human Feedback（人类反馈）
Supervised Fine-tuning / SFT (监督式微调)
Human Readability（可读性）
Catastrophic Forgetting（灾难性遗忘）
Benchmark Score（基准分数）
ICML（International Conference on Machine Learning）：机器学习顶级学术会议
【相关节目】
E200｜投资人视角深聊：AI Agent的核心壁垒与投资逻辑 (https://www.xiaoyuzhoufm.com/episode/68783d4733e162b18f8c4b9d)
E195｜从工具到伙伴：七位AI Agent深度使用者的思考 (https://www.xiaoyuzhoufm.com/episode/684775cbcdecf72d4ca2fcc5)
E191｜小而美的机会来了，聊聊这轮AI Agent进化新范式 (https://www.xiaoyuzhoufm.com/episode/68268151d231129fe37b2503)
【监制】
泓君
【后期】
AMEI
【Shownotes】
陈思扬
【运营】
王梓沁
【BGM】
Simple Pleasantries - Arthur Benson
Anticipating a New Day - Stationary Sign
【在这里找到我们】
公众号：硅谷101
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」
联系我们：podcast@sv101.net Special Guest: 朱哲清.
</description>
  <itunes:keywords>强化学习,AGI,AI Agent,OpenAI,Manus,Pokee,Genspark,MCP</itunes:keywords>
  <content:encoded>
    <![CDATA[<p>美国时间7月17日，OpenAI终于迎来了它的“Agent时刻”——通用型ChatGPT Agent正式发布。它整合了深度研究工具Deep Research与执行工具Operator，可一站式完成复杂任务，但仍存在速度慢、个性化不足等短板。</p>

<p>ChatGPT Agent的技术本质是“浏览器+沙盒”的混合架构，与Manus、Genspark形成技术路线差异。在底层架构层面，浏览器（Browser-based）代理虽堪称“万能”，但运行速度较慢；沙盒（Sandbox）代理高效，但无法联网操作、工具库受限；而工作流集成（Workflow API）速度快、结果精准。在训练方法层面，强化学习（RL）被视为AGI从“执行者”向“创新者”跨越的重要路径，但当前面临的验证泛化与训练不稳定难题，如同两道枷锁锁住了这扇进阶之门。</p>

<p>强化学习能否成为通用AI爆发的关键引擎？AGI实现技术跃迁的分水岭究竟在哪？在把Agent产品化和商业化的道路上，又如何平衡模型能力与用户体验？本期《硅谷101》，主播泓君对话Pokee.ai创始人朱哲清，多维度测评ChatGPT Agent使用体验，并深入拆解Agent的四大底层设计逻辑、探讨强化学习的训练路径，以及我们迎接“超级智能时刻”所面临的技术挑战。</p>

<p><strong>【主播】</strong><br>
泓君Jane，硅谷101创始人，播客主理人</p>

<p><strong>【嘉宾】</strong><br>
朱哲清，Pokee.ai创始人，前MetaAI应用强化学习团队负责人，斯坦福强化学习博士（X：@ZheqingZhu）</p>

<p><strong>【101 Weekly新节目预告】</strong><br>
硅谷101上线了一版更加轻量级的音视频节目「101Weekly」，每周由我们的三位主播复盘三个商业热点事件，每期10分钟左右，并请来行业专家来一手分析解读，希望这每周的30分钟，帮助大家轻松了解一周新闻大事件，<a href="https://www.xiaoyuzhoufm.com/podcast/686add4193fd2d72b8d5d777" rel="nofollow">点击收听</a>。<br>
音频版：<a href="https://sv101.fireside.fm/" rel="nofollow">Fireside</a>｜<a href="https://www.xiaoyuzhoufm.com/podcast/686add4193fd2d72b8d5d777" rel="nofollow">小宇宙</a>｜苹果播客｜Spotify<br>
视频版：<a href="https://space.bilibili.com/508452265?spm_id_from=333.337.0.0" rel="nofollow">BiliBIli</a>｜<a href="https://www.youtube.com/@TheValley101" rel="nofollow">Youtube</a>｜视频号｜抖音</p>

<p><strong>【你将听到】</strong><br>
<strong>ChatGPT Agent首发体验与技术拆解</strong><br>
00:21 拆解AI Agent技术路径：什么是“聪明机器的大脑”？<br>
02:12  ChatGPT Agent一手实测：浏览器操作如超人 VS 速度慢如蜗牛<br>
04:26 视觉能力加持：Action体验有提升，但仍需等待<br>
05:45 旅行规划场景：支付环节仍需人类介入，信任门槛尚未跨越 <br>
08:11 “全部推翻重来”：缺乏个性化机制、记不住反馈细节<br>
10:07 ChatGPT Agent“打通搜索与执行”的本质：Deep Research + Operator的“拼贴工程”</p>

<p><strong>通用型Agent技术路径对比</strong><br>
12:31 通用Agent技术类比：Operator最早专注Browser操作，如今叠加Sandbox后，在通用Agent里表现最强<br>
14:52 四大技术方向优劣势对比：<br>
  15:40 浏览器为主：通用性强，但速度慢、体验差、成本高<br>
  17:21 开放虚拟机：本地运行快，但访问互联网等外部服务不易<br>
  17:37 大模型+虚拟机：GensPark模式，相对环节更封闭<br>
  18:46 Workflow+工具集成：Pokee模式，交付好但不是所有任务都能做<br>
20:23 Manus模式：Browser-based，Sandbox强，全能但慢<br>
22:28 Genspark模式：标化工作流，牺牲通用性换取速度与稳定性<br>
23:41 Pokee模式：速度快成本低，但范围受限<br>
26:52 B端客户还是C端客户，适用场景与底层技术逻辑完全不同<br>
29:36 Agent将重塑互联网入口，传统门户流量将大幅下滑<br>
32:03 MCP无人维护：2万个协议中，真正可用的不到200个<br>
33:47 Agent时代的广告逻辑大变：反而更有利于创作者？</p>

<p><strong>强化学习与AGI的五个层次</strong><br>
38:52 强化学习适用场景：目标明确、机制清晰但数据稀缺<br>
41:50 新兴路径：强化学习预训练（RL Pretraining）<br>
44:40 一个非共识：验证（Verification）方向的泛化性，可能产出人类所不拥有的知识<br>
46:51 AGI五级路径中，“执行者”(L3) 与“创新者”(L4) 间存在巨大技术鸿沟，核心在于验证能力<br>
50:37 强化学习预训练的致命弱点：给出的解决方案可能“人类都看不懂”<br>
52:43 强化学习（RLHF） Vs 监督学习微调（SFT）：效果×2，但成本×10</p>

<p><strong>Meta收购ScaleAI背后的逻辑</strong><br>
54:08 Meta收购Scale：多模态数据仍然是瓶颈<br>
56:46 多模态数据的最大挑战：数据复杂 + 维度多 → 主观标准难统一<br>
57:59 AI的核心问题：短期算力，中期数据，长期人才<br>
59:10 如何让Agent调用更好用？自研模型<br>
01:03:33 平衡模型能力与用户体验：模型能力决定下限，产品细节决定上限</p>

<p><strong>强化学习的人才大本营</strong><br>
01:05:42 RL奠基人、2024年图灵奖得主Richard Sutton：想法极具前瞻性，且坚持原则<br>
01:07:47 模型可塑性挑战：AI的“灾难性遗忘”亟待解决<br>
01:09:56 奖励函数设计难：强化学习中如何设定“道德且有效”的多目标激励<br>
01:11:47 RL核心研究圈：学术界与业界均高度集中<br>
    学术界：OpenAI早期团队，Peter Abbeel, Sergey Levine , Richard Sutton<br>
    业界：以David Silver为代表的DeepMind员工、以John Langford为代表的微软员工等<br>
01:12:50 从AlphaGo开始，伦敦成为强化学习研究的重要中心<br>
01:15:28 如何像投资人销售过于超前的想法：只说一个非共识<br>
01:16:58 市场正在分化，技术路径选择是创业公司活下来的核心</p>

<p><strong>【节目中提到的AI Agent】<br>
OpenAI相关：</strong><br>
ChatGPT Agent｜Operator｜Deep Research</p>

<p><strong>其他：</strong><br>
Manus｜Genspark｜Perplexity｜Claude Agent｜Fellou｜Flowise｜Zapier｜UIPath｜Replicate</p>

<p><strong>【节目提到的相关术语】</strong><br>
MCP / Model Context Protocol（模型上下文协议）<br>
A2A（Agent-to-Agent Protocol）<br>
SDK（软件开发工具包）<br>
API（应用程序接口）<br>
Vision Model<br>
Browser-based Agent<br>
Sandbox（沙盒环境）<br>
Virtual Machine (VM)<br>
Token Consumption（Token消耗）<br>
Tool Calling：调用第三方工具或API完成任务<br>
Workflow-based Agent<br>
Reinforcement Learning / RL（强化学习）<br>
RL Fine-tuning / RLFT（强化学习微调）<br>
RL Pre-training（强化学习预训练）<br>
Verification（验证机制）<br>
Ground Truth（基准真值）<br>
Hallucination（幻觉）<br>
Human Feedback（人类反馈）<br>
Supervised Fine-tuning / SFT (监督式微调)<br>
Human Readability（可读性）<br>
Catastrophic Forgetting（灾难性遗忘）<br>
Benchmark Score（基准分数）<br>
ICML（International Conference on Machine Learning）：机器学习顶级学术会议</p>

<p><strong>【相关节目】</strong><br>
<a href="https://www.xiaoyuzhoufm.com/episode/68783d4733e162b18f8c4b9d" rel="nofollow">E200｜投资人视角深聊：AI Agent的核心壁垒与投资逻辑</a><br>
<a href="https://www.xiaoyuzhoufm.com/episode/684775cbcdecf72d4ca2fcc5" rel="nofollow">E195｜从工具到伙伴：七位AI Agent深度使用者的思考</a><br>
<a href="https://www.xiaoyuzhoufm.com/episode/68268151d231129fe37b2503" rel="nofollow">E191｜小而美的机会来了，聊聊这轮AI Agent进化新范式</a></p>

<p><strong>【监制】</strong><br>
泓君</p>

<p><strong>【后期】</strong><br>
AMEI</p>

<p><strong>【Shownotes】</strong><br>
陈思扬</p>

<p><strong>【运营】</strong><br>
王梓沁</p>

<p><strong>【BGM】</strong><br>
Simple Pleasantries - Arthur Benson<br>
Anticipating a New Day - Stationary Sign</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p><p>Special Guest: 朱哲清.</p>]]>
  </content:encoded>
  <itunes:summary>
    <![CDATA[<p>美国时间7月17日，OpenAI终于迎来了它的“Agent时刻”——通用型ChatGPT Agent正式发布。它整合了深度研究工具Deep Research与执行工具Operator，可一站式完成复杂任务，但仍存在速度慢、个性化不足等短板。</p>

<p>ChatGPT Agent的技术本质是“浏览器+沙盒”的混合架构，与Manus、Genspark形成技术路线差异。在底层架构层面，浏览器（Browser-based）代理虽堪称“万能”，但运行速度较慢；沙盒（Sandbox）代理高效，但无法联网操作、工具库受限；而工作流集成（Workflow API）速度快、结果精准。在训练方法层面，强化学习（RL）被视为AGI从“执行者”向“创新者”跨越的重要路径，但当前面临的验证泛化与训练不稳定难题，如同两道枷锁锁住了这扇进阶之门。</p>

<p>强化学习能否成为通用AI爆发的关键引擎？AGI实现技术跃迁的分水岭究竟在哪？在把Agent产品化和商业化的道路上，又如何平衡模型能力与用户体验？本期《硅谷101》，主播泓君对话Pokee.ai创始人朱哲清，多维度测评ChatGPT Agent使用体验，并深入拆解Agent的四大底层设计逻辑、探讨强化学习的训练路径，以及我们迎接“超级智能时刻”所面临的技术挑战。</p>

<p><strong>【主播】</strong><br>
泓君Jane，硅谷101创始人，播客主理人</p>

<p><strong>【嘉宾】</strong><br>
朱哲清，Pokee.ai创始人，前MetaAI应用强化学习团队负责人，斯坦福强化学习博士（X：@ZheqingZhu）</p>

<p><strong>【101 Weekly新节目预告】</strong><br>
硅谷101上线了一版更加轻量级的音视频节目「101Weekly」，每周由我们的三位主播复盘三个商业热点事件，每期10分钟左右，并请来行业专家来一手分析解读，希望这每周的30分钟，帮助大家轻松了解一周新闻大事件，<a href="https://www.xiaoyuzhoufm.com/podcast/686add4193fd2d72b8d5d777" rel="nofollow">点击收听</a>。<br>
音频版：<a href="https://sv101.fireside.fm/" rel="nofollow">Fireside</a>｜<a href="https://www.xiaoyuzhoufm.com/podcast/686add4193fd2d72b8d5d777" rel="nofollow">小宇宙</a>｜苹果播客｜Spotify<br>
视频版：<a href="https://space.bilibili.com/508452265?spm_id_from=333.337.0.0" rel="nofollow">BiliBIli</a>｜<a href="https://www.youtube.com/@TheValley101" rel="nofollow">Youtube</a>｜视频号｜抖音</p>

<p><strong>【你将听到】</strong><br>
<strong>ChatGPT Agent首发体验与技术拆解</strong><br>
00:21 拆解AI Agent技术路径：什么是“聪明机器的大脑”？<br>
02:12  ChatGPT Agent一手实测：浏览器操作如超人 VS 速度慢如蜗牛<br>
04:26 视觉能力加持：Action体验有提升，但仍需等待<br>
05:45 旅行规划场景：支付环节仍需人类介入，信任门槛尚未跨越 <br>
08:11 “全部推翻重来”：缺乏个性化机制、记不住反馈细节<br>
10:07 ChatGPT Agent“打通搜索与执行”的本质：Deep Research + Operator的“拼贴工程”</p>

<p><strong>通用型Agent技术路径对比</strong><br>
12:31 通用Agent技术类比：Operator最早专注Browser操作，如今叠加Sandbox后，在通用Agent里表现最强<br>
14:52 四大技术方向优劣势对比：<br>
  15:40 浏览器为主：通用性强，但速度慢、体验差、成本高<br>
  17:21 开放虚拟机：本地运行快，但访问互联网等外部服务不易<br>
  17:37 大模型+虚拟机：GensPark模式，相对环节更封闭<br>
  18:46 Workflow+工具集成：Pokee模式，交付好但不是所有任务都能做<br>
20:23 Manus模式：Browser-based，Sandbox强，全能但慢<br>
22:28 Genspark模式：标化工作流，牺牲通用性换取速度与稳定性<br>
23:41 Pokee模式：速度快成本低，但范围受限<br>
26:52 B端客户还是C端客户，适用场景与底层技术逻辑完全不同<br>
29:36 Agent将重塑互联网入口，传统门户流量将大幅下滑<br>
32:03 MCP无人维护：2万个协议中，真正可用的不到200个<br>
33:47 Agent时代的广告逻辑大变：反而更有利于创作者？</p>

<p><strong>强化学习与AGI的五个层次</strong><br>
38:52 强化学习适用场景：目标明确、机制清晰但数据稀缺<br>
41:50 新兴路径：强化学习预训练（RL Pretraining）<br>
44:40 一个非共识：验证（Verification）方向的泛化性，可能产出人类所不拥有的知识<br>
46:51 AGI五级路径中，“执行者”(L3) 与“创新者”(L4) 间存在巨大技术鸿沟，核心在于验证能力<br>
50:37 强化学习预训练的致命弱点：给出的解决方案可能“人类都看不懂”<br>
52:43 强化学习（RLHF） Vs 监督学习微调（SFT）：效果×2，但成本×10</p>

<p><strong>Meta收购ScaleAI背后的逻辑</strong><br>
54:08 Meta收购Scale：多模态数据仍然是瓶颈<br>
56:46 多模态数据的最大挑战：数据复杂 + 维度多 → 主观标准难统一<br>
57:59 AI的核心问题：短期算力，中期数据，长期人才<br>
59:10 如何让Agent调用更好用？自研模型<br>
01:03:33 平衡模型能力与用户体验：模型能力决定下限，产品细节决定上限</p>

<p><strong>强化学习的人才大本营</strong><br>
01:05:42 RL奠基人、2024年图灵奖得主Richard Sutton：想法极具前瞻性，且坚持原则<br>
01:07:47 模型可塑性挑战：AI的“灾难性遗忘”亟待解决<br>
01:09:56 奖励函数设计难：强化学习中如何设定“道德且有效”的多目标激励<br>
01:11:47 RL核心研究圈：学术界与业界均高度集中<br>
    学术界：OpenAI早期团队，Peter Abbeel, Sergey Levine , Richard Sutton<br>
    业界：以David Silver为代表的DeepMind员工、以John Langford为代表的微软员工等<br>
01:12:50 从AlphaGo开始，伦敦成为强化学习研究的重要中心<br>
01:15:28 如何像投资人销售过于超前的想法：只说一个非共识<br>
01:16:58 市场正在分化，技术路径选择是创业公司活下来的核心</p>

<p><strong>【节目中提到的AI Agent】<br>
OpenAI相关：</strong><br>
ChatGPT Agent｜Operator｜Deep Research</p>

<p><strong>其他：</strong><br>
Manus｜Genspark｜Perplexity｜Claude Agent｜Fellou｜Flowise｜Zapier｜UIPath｜Replicate</p>

<p><strong>【节目提到的相关术语】</strong><br>
MCP / Model Context Protocol（模型上下文协议）<br>
A2A（Agent-to-Agent Protocol）<br>
SDK（软件开发工具包）<br>
API（应用程序接口）<br>
Vision Model<br>
Browser-based Agent<br>
Sandbox（沙盒环境）<br>
Virtual Machine (VM)<br>
Token Consumption（Token消耗）<br>
Tool Calling：调用第三方工具或API完成任务<br>
Workflow-based Agent<br>
Reinforcement Learning / RL（强化学习）<br>
RL Fine-tuning / RLFT（强化学习微调）<br>
RL Pre-training（强化学习预训练）<br>
Verification（验证机制）<br>
Ground Truth（基准真值）<br>
Hallucination（幻觉）<br>
Human Feedback（人类反馈）<br>
Supervised Fine-tuning / SFT (监督式微调)<br>
Human Readability（可读性）<br>
Catastrophic Forgetting（灾难性遗忘）<br>
Benchmark Score（基准分数）<br>
ICML（International Conference on Machine Learning）：机器学习顶级学术会议</p>

<p><strong>【相关节目】</strong><br>
<a href="https://www.xiaoyuzhoufm.com/episode/68783d4733e162b18f8c4b9d" rel="nofollow">E200｜投资人视角深聊：AI Agent的核心壁垒与投资逻辑</a><br>
<a href="https://www.xiaoyuzhoufm.com/episode/684775cbcdecf72d4ca2fcc5" rel="nofollow">E195｜从工具到伙伴：七位AI Agent深度使用者的思考</a><br>
<a href="https://www.xiaoyuzhoufm.com/episode/68268151d231129fe37b2503" rel="nofollow">E191｜小而美的机会来了，聊聊这轮AI Agent进化新范式</a></p>

<p><strong>【监制】</strong><br>
泓君</p>

<p><strong>【后期】</strong><br>
AMEI</p>

<p><strong>【Shownotes】</strong><br>
陈思扬</p>

<p><strong>【运营】</strong><br>
王梓沁</p>

<p><strong>【BGM】</strong><br>
Simple Pleasantries - Arthur Benson<br>
Anticipating a New Day - Stationary Sign</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜荔枝FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p><p>Special Guest: 朱哲清.</p>]]>
  </itunes:summary>
</item>
<item>
  <title>E191｜小而美的机会来了，聊聊这轮AI Agent进化新范式</title>
  <link>https://sv101.fireside.fm/200</link>
  <guid isPermaLink="false">5bc119f9-a795-4016-9431-025a536c6941</guid>
  <pubDate>Thu, 15 May 2025 17:00:00 -0700</pubDate>
  <author>硅谷101</author>
  <enclosure url="https://aphid.fireside.fm/d/1437767933/f0f20376-8faf-4940-b920-84af6c734e2d/5bc119f9-a795-4016-9431-025a536c6941.mp3" length="92433930" type="audio/mpeg"/>
  <itunes:episodeType>full</itunes:episodeType>
  <itunes:season>4</itunes:season>
  <itunes:author>硅谷101</itunes:author>
  <itunes:subtitle>进入2025年，AI Agent仿佛按下了加速键：从OpenAI推出自助浏览器Operator，到Manus爆火出圈并获7500万美元融资。究竟是什么引爆了这轮AI Agent的热潮？</itunes:subtitle>
  <itunes:duration>1:04:11</itunes:duration>
  <itunes:explicit>no</itunes:explicit>
  <itunes:image href="https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6"/>
  <description>进入2025年，AI Agent仿佛按下了加速键：从OpenAI推出自助浏览器Operator，到Manus爆火出圈并获7500万美元融资。究竟是什么引爆了这轮AI Agent的热潮？
代码能力的提升为AI Agent的奠定了基础，RFT（强化学习微调）带来了大模型的“AlphaGo”时刻，嘉宾甚至都感叹“时代变了，开发产品成本低得有点恐怖”。但通用AI Agent是否真的是未来？数据壁垒、用户认知成本以及网络效应的缺失，都可能成为其发展的桎梏。 或许，更具前景的是那些深耕垂直领域的“小而美”的Agent？本期节目，我们将一同探讨AI Agent的核心技术、热门产品体验、创业机会与挑战，以及AI Agent的未来将走向何方？
【主播】
泓君Jane，硅谷101创始人，播客主理人
【嘉宾】
陶芳波，MindVerse心识宇宙创始人
侯泰羽（Kolento Hou），纽约大学本科应用心理学，AI产品经理
【你将听到】
RFT推动的Agent热潮
00:05 AI Agent进展大事件以及爆发三大核心原因
04:55 机器学习视角下的Agent进化
06:36 RFT（强化学习微调）技术促使Agent在2025年具有智能
08:10 大语言模型的AlphaGo时刻：不仅具有思考能力，还根据环境反馈调整学习
11:04 过去半年新趋势：Agent在环境中完成任务
14:27 OpenAI Operator买菜的体验：速度慢、准确率不高
17:32 内化工作流：新一代Agent能做出临场反应
20:55 创造虚拟环境：Scrapybara帮我买秋裤
22:39 Cursor与Windsurf编程Agent为何出圈？
26:11 AI创业门槛降低，可以做平台上那些小而美的Agent
Manus
32:53 Manus擅长广度，Deep Research擅长深度
38:05 Agent爆火背后的秘密：Sonnet 3.5代码质量的提升
40:57 比训练更重要？Evaluation的三代进化
44:02 SFT更便宜，RFT效果更优，行业会如何选择？
45:41 通用型Agent的双刃剑
垂类AI Agent推荐
48:45 在关键场景请求人类对齐：Replit和Fellou的优秀交互体验
50:13 最看好Cursor，有成为通用Agent的潜力
52:25 Vantel：每周帮保险经纪人省10小时的保险垂类Agent
53:29 Sweetspot：换了八九个邮箱也要用的，辅助申请资助类Agent
54:23 Gamma：秒杀Canva的PPT设计类Agent
行业快与慢
57:48 做的200多个Agent中，商业化成功的案例
59:20 “越做发现问题越多”：离普通人每天使用Agent仍有距离
1:00:39 MCP的生态建设需以年为单位
【相关名词解释】
RFT：Reinforcement Fine-Tuning，强化学习微调
SFT：Supervised Fine-Tuning，监督学习微调
MCP：Model Context Protocol，模型上下文协议
【监制】
泓君
【后期】
AMEI
【运营】
孙泽平、Meisi、王梓沁
【BGM】
Anticipating a New Day - Stationary Sign
City Phases STEMS INSTRUMENTS - John Abbot
Hidden Agenda
Clockmaker's Daydream - 369
【在这里找到我们】
公众号：硅谷101
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜网易云音乐｜QQ音乐
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」
联系我们：podcast@sv101.net Special Guests: Kolento and 陶芳波.
</description>
  <itunes:keywords>Agent, AI, 智能体,Manus,机器学习</itunes:keywords>
  <content:encoded>
    <![CDATA[<p>进入2025年，AI Agent仿佛按下了加速键：从OpenAI推出自助浏览器Operator，到Manus爆火出圈并获7500万美元融资。究竟是什么引爆了这轮AI Agent的热潮？<br>
代码能力的提升为AI Agent的奠定了基础，RFT（强化学习微调）带来了大模型的“AlphaGo”时刻，嘉宾甚至都感叹“时代变了，开发产品成本低得有点恐怖”。但通用AI Agent是否真的是未来？数据壁垒、用户认知成本以及网络效应的缺失，都可能成为其发展的桎梏。 或许，更具前景的是那些深耕垂直领域的“小而美”的Agent？本期节目，我们将一同探讨AI Agent的核心技术、热门产品体验、创业机会与挑战，以及AI Agent的未来将走向何方？</p>

<p><strong>【主播】</strong><br>
泓君Jane，硅谷101创始人，播客主理人</p>

<p><strong>【嘉宾】</strong><br>
陶芳波，MindVerse心识宇宙创始人<br>
侯泰羽（Kolento Hou），纽约大学本科应用心理学，AI产品经理</p>

<p><strong>【你将听到】</strong><br>
<strong>RFT推动的Agent热潮</strong><br>
00:05 AI Agent进展大事件以及爆发三大核心原因<br>
04:55 机器学习视角下的Agent进化<br>
06:36 RFT（强化学习微调）技术促使Agent在2025年具有智能<br>
08:10 大语言模型的AlphaGo时刻：不仅具有思考能力，还根据环境反馈调整学习<br>
11:04 过去半年新趋势：Agent在环境中完成任务<br>
14:27 OpenAI Operator买菜的体验：速度慢、准确率不高<br>
17:32 内化工作流：新一代Agent能做出临场反应<br>
20:55 创造虚拟环境：Scrapybara帮我买秋裤<br>
22:39 Cursor与Windsurf编程Agent为何出圈？<br>
26:11 AI创业门槛降低，可以做平台上那些小而美的Agent</p>

<p><strong>Manus</strong><br>
32:53 Manus擅长广度，Deep Research擅长深度<br>
38:05 Agent爆火背后的秘密：Sonnet 3.5代码质量的提升<br>
40:57 比训练更重要？Evaluation的三代进化<br>
44:02 SFT更便宜，RFT效果更优，行业会如何选择？<br>
45:41 通用型Agent的双刃剑</p>

<p><strong>垂类AI Agent推荐</strong><br>
48:45 在关键场景请求人类对齐：Replit和Fellou的优秀交互体验<br>
50:13 最看好Cursor，有成为通用Agent的潜力<br>
52:25 Vantel：每周帮保险经纪人省10小时的保险垂类Agent<br>
53:29 Sweetspot：换了八九个邮箱也要用的，辅助申请资助类Agent<br>
54:23 Gamma：秒杀Canva的PPT设计类Agent</p>

<p><strong>行业快与慢</strong><br>
57:48 做的200多个Agent中，商业化成功的案例<br>
59:20 “越做发现问题越多”：离普通人每天使用Agent仍有距离<br>
1:00:39 MCP的生态建设需以年为单位</p>

<p><strong>【相关名词解释】</strong><br>
RFT：Reinforcement Fine-Tuning，强化学习微调<br>
SFT：Supervised Fine-Tuning，监督学习微调<br>
MCP：Model Context Protocol，模型上下文协议</p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【后期】</strong><br>
AMEI<br>
<strong>【运营】</strong><br>
孙泽平、Meisi、王梓沁</p>

<p><strong>【BGM】</strong><br>
Anticipating a New Day - Stationary Sign<br>
City Phases STEMS INSTRUMENTS - John Abbot<br>
Hidden Agenda<br>
Clockmaker&#39;s Daydream - 369</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p><p>Special Guests: Kolento and 陶芳波.</p>]]>
  </content:encoded>
  <itunes:summary>
    <![CDATA[<p>进入2025年，AI Agent仿佛按下了加速键：从OpenAI推出自助浏览器Operator，到Manus爆火出圈并获7500万美元融资。究竟是什么引爆了这轮AI Agent的热潮？<br>
代码能力的提升为AI Agent的奠定了基础，RFT（强化学习微调）带来了大模型的“AlphaGo”时刻，嘉宾甚至都感叹“时代变了，开发产品成本低得有点恐怖”。但通用AI Agent是否真的是未来？数据壁垒、用户认知成本以及网络效应的缺失，都可能成为其发展的桎梏。 或许，更具前景的是那些深耕垂直领域的“小而美”的Agent？本期节目，我们将一同探讨AI Agent的核心技术、热门产品体验、创业机会与挑战，以及AI Agent的未来将走向何方？</p>

<p><strong>【主播】</strong><br>
泓君Jane，硅谷101创始人，播客主理人</p>

<p><strong>【嘉宾】</strong><br>
陶芳波，MindVerse心识宇宙创始人<br>
侯泰羽（Kolento Hou），纽约大学本科应用心理学，AI产品经理</p>

<p><strong>【你将听到】</strong><br>
<strong>RFT推动的Agent热潮</strong><br>
00:05 AI Agent进展大事件以及爆发三大核心原因<br>
04:55 机器学习视角下的Agent进化<br>
06:36 RFT（强化学习微调）技术促使Agent在2025年具有智能<br>
08:10 大语言模型的AlphaGo时刻：不仅具有思考能力，还根据环境反馈调整学习<br>
11:04 过去半年新趋势：Agent在环境中完成任务<br>
14:27 OpenAI Operator买菜的体验：速度慢、准确率不高<br>
17:32 内化工作流：新一代Agent能做出临场反应<br>
20:55 创造虚拟环境：Scrapybara帮我买秋裤<br>
22:39 Cursor与Windsurf编程Agent为何出圈？<br>
26:11 AI创业门槛降低，可以做平台上那些小而美的Agent</p>

<p><strong>Manus</strong><br>
32:53 Manus擅长广度，Deep Research擅长深度<br>
38:05 Agent爆火背后的秘密：Sonnet 3.5代码质量的提升<br>
40:57 比训练更重要？Evaluation的三代进化<br>
44:02 SFT更便宜，RFT效果更优，行业会如何选择？<br>
45:41 通用型Agent的双刃剑</p>

<p><strong>垂类AI Agent推荐</strong><br>
48:45 在关键场景请求人类对齐：Replit和Fellou的优秀交互体验<br>
50:13 最看好Cursor，有成为通用Agent的潜力<br>
52:25 Vantel：每周帮保险经纪人省10小时的保险垂类Agent<br>
53:29 Sweetspot：换了八九个邮箱也要用的，辅助申请资助类Agent<br>
54:23 Gamma：秒杀Canva的PPT设计类Agent</p>

<p><strong>行业快与慢</strong><br>
57:48 做的200多个Agent中，商业化成功的案例<br>
59:20 “越做发现问题越多”：离普通人每天使用Agent仍有距离<br>
1:00:39 MCP的生态建设需以年为单位</p>

<p><strong>【相关名词解释】</strong><br>
RFT：Reinforcement Fine-Tuning，强化学习微调<br>
SFT：Supervised Fine-Tuning，监督学习微调<br>
MCP：Model Context Protocol，模型上下文协议</p>

<p><strong>【监制】</strong><br>
泓君<br>
<strong>【后期】</strong><br>
AMEI<br>
<strong>【运营】</strong><br>
孙泽平、Meisi、王梓沁</p>

<p><strong>【BGM】</strong><br>
Anticipating a New Day - Stationary Sign<br>
City Phases STEMS INSTRUMENTS - John Abbot<br>
Hidden Agenda<br>
Clockmaker&#39;s Daydream - 369</p>

<p><strong>【在这里找到我们】</strong><br>
公众号：硅谷101<br>
收听渠道：Apple Podcast｜Spotify｜小宇宙｜喜马拉雅｜蜻蜓FM｜网易云音乐｜QQ音乐<br>
其他平台：YouTube｜Bilibili 搜索「硅谷101播客」<br>
联系我们：<a href="mailto:podcast@sv101.net" rel="nofollow">podcast@sv101.net</a></p><p>Special Guests: Kolento and 陶芳波.</p>]]>
  </itunes:summary>
</item>
  </channel>
</rss>
