106: 与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need

106: 与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need

132分钟 ·
播放数18341
·
评论数80

「两瓶茅台的价格体验未来,很划算(Devin 最低月订阅费 500 美元)」

2 月下旬,我与真格基金管理合伙人戴雨森长聊了一次 AI。

上周,真格投资的 Monica 发布的 Agent 产品 Manus,虽然还在内测阶段,就引起了大量关注。在聊这期时,雨森提到了 Monica 即将会发布一款 Agent 产品,那时候我们还不知道 Manus 将会席卷社交媒体。

当我们把一个任务交给 Manus,过了十几分钟收到完成的结果时,似乎真的感受到了一点 attention is not all you need 的未来。

带来这些变化的起点,是去年至今的两个重要节点:o1 和 R1。它们分别带来了两个对 AI 全行业的影响:

  • 一是 o1 在大语言模型中引入强化学习,开启 Pretraining(预训练)Scaling Laws 之外的 Post-training(后训练)和 test-time-computing(即推理阶段的计算)阶段的新 Scaling Laws,让模型推理能力大幅提升。我们之前在第 80 期节目中也有详细讨论 o1,当时业界还普遍猜测 o1 用到了蒙特卡洛树搜索等方法。

  • 二是与 o1 同为推理模型的 DeepSeek R1 强势开源,以极低的成本,和后续引发的巨大全民影响力,让很多人重估了大模型行业当前的最重要课题:提升模型能力。R1 的开源和同期发布了详细技术报告另一个推理模型的 Kimi-k1.5 ,也明确告诉整个领域,一些方向是“此路不通”,他们都没有使用蒙特卡洛树搜索等方法。

这期节目,我们从 o1 和 R1 开始聊,二者一同带来的推理能力的提升、成本的下降,和同期模型编程能力与工具使用能力的提升,开启了 Agent 在 2025 年的应用前景。

雨森详细分享了他对 Agent 机会的当前观察,以及在 DeepSeek 带来的开源生态的变化中,大小 AI 公司的新动作和调整。

本期嘉宾:
戴雨森:真格基金管理合伙人,投资了 Kimi(月之暗面)、与爱为舞、无问芯穹、Genspark 等 AI 项目。

时间线:
- OpenAI o系列与 DeepSeek R 系列的启发
01:36 o1 证明 RL(强化学习)在后训练阶段和推理时间的 Scaling Law 潜力,为 Agent 产品形态奠定基础
04:24 DeepSeek-R1 启发:开源+RL+专注的胜利;本土年轻团队的力量;技术提升带来魔法体验,涌现商业模式

- 详聊 AI Agent
14:25 3 个能力提升带来 Agent 爆发机会:推理+编程+工具使用;凡是 RL 进入的领域,往往导致人类迅速超过人类,“我把这叫李世石时刻”
18:11 Attention is not all you need,“工作的 Scaling Law”:从“注意力经济”到“无需注意力”的范式转变,Agent 帮你干活
34:07 Agent 产品形态推演:从写(分析类)到读(操作),到 Agent 指挥 Agent 干活(多 Agent 协同);一个例子:Manus 为了获得凤凰城地铁时刻表,在找不到公开信息的情况下给相关部门写邮件。
45:44 Agent 机会属于谁?模型公司自己做,还是应用公司?
53:02 Agent 成本:成本下降、速度变快是必然;200 美元一个月的 ChatGPT-pro,500 美金一个月的Devin,两瓶茅台的价格体验未来,很划算

- 开源带来的格局重塑
58:18 DeepSeek 强势开源下:字节与腾讯的不同动作
01:10:39 DeepSeek 长期的商业价值?
01:14:53 开源并非必选项
01:19:39 阿里的节奏:开源、开放
01:28:34 对六小虎:DeepSeek 的“清场效应”;对更多应用公司,加速从“黑莓时代”到“iPhone”时代
01:35:45 对算力需求:总需求变大没争议,但算力结构的变化可能导致英伟达市值调整

- 为更快到来的 AGI 的未雨绸缪
01:44:59 一生中见证多次指数增长,历史罕见
01:51:32 希望 AI 普惠,但也有可能走向反面
01:54:40 戴雨森个人为 AGI 做的准备
02:04:01 最近的阅读推荐:A Brief History of Intelligence(作者:Max Bennet)、《第一只眼》(作者:Andrew Parker)

相关链接:
3 位连续创业者打造 Manus,应用潮里有更多 “underdog” 的机会(文末附 Manus、Open Manus 实测)
晚点聊 99:MiniMax创始人闫俊杰:做大模型,千万别套用移动互联网的逻辑
晚点聊 100:硅谷怎么看 DeepSeek?与 FusionFund 创始人张璐聊开源、Agent 和除了 AI
晚点聊 102:DeepSeek 启动开源周,大模型开源到底在开什么?
晚点聊 103:用 Attention 串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进

附录(本期中提及的一些 AI 产品):
Devin:由 Cognition 开发的自动化编程助手 Agent。
DeepResearch:OpenAI 2025 年 2月发布的为智能研究 Agent,支持深度信息检索与报告生成。
Manus:本期中提及的 Monica.im 当时即将发布的 Agent 产品,支持多任务自主执行。
ComputerUse:Anthropic 2024 年 11 月发布的通用计算机助手 Agent,允许 AI 操作计算机完成任务。
Cursor:由 Cursor 团队开发的 AI 编程助手。
Perplexity:由Perplexity AI 开发的 AI 搜索引擎,能提供深度搜索、信息整合和答案生成。

剪辑制作:甜食

本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q

☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

展开Show Notes
置顶
2 月下旬和雨森聊的一期。当时就预告了一下真格投资的 Monica 可能会发 Agent 产品了。
Attention is not All you need——Agent 会解放更多人类的注意力,让你不再用盯着某些工作。这确实也是我们自己测试 Manus、OpenManus 和使用一些 AI Agent 产品的感受。
这也对人提出一个新课题:怎么给出清晰的工作“brief”/prompt。

*shownotes 里--相关链接--部分有我们自己测试的 Manus 的例子,也有 Monica 三位合伙人的创业故事。
曼祺_MatchQ
:
一些联想:这几期是和 “Attention”杠上了。 密集地和人机器和人的注意力后,我发现 Attention 本身挺有意思。 在 AI 系统里,注意力机制的问题是计算复杂度和显存开销; 而在人这里,注意力的背后是时间有限,心流难求。注意力其实是对“时间”和记忆的更本质的表达。“吾生也有涯,而知也无涯”。AI 未来会帮助人更接近“无涯”吗? 再往下想,AI 解放一部分注意力确实很省事,但会不会顺带“解放”了人因为长久注意和实际做某事才习得的经验? 如果一个孩子从小就在 AI 工具高度发达的环境里成长,他会怎么成长?——这也是本期聊到的一个延展话题:以前是几代人赶上一次技术爆炸,现在是一代人就几次技术爆炸。 进化很慢的人性能抗住吗?
Never_B1aL
Never_B1aL
2025.3.10
感觉现在的媒体有点过度营销了,首先Manus做的agent并不是什么新的创新,完全抄了Devin,但是类似的agent形态目前为止暂时还没跑通PMF,之前Devin出来的时候也是自称全球第一个AI程序员,并且定价500美金,后路过两个月后很多人深度使用后都放弃了,为什么,因为用户预期很高,但是agent做不到,20个任务中只能3个任务成功,其他都失败或者不确定,目前阶段还需要观察
陈蝶衣:清醒的
庄明浩
庄明浩
2025.3.09
yusen看到manus爆火一定非常开心 不是投资人看自己deal的那种开心 是某种预判被验证的那种开心
曼祺_MatchQ
:
对,他之前就是 Devin 深度使用者。 有一个小故事我在评论区分享一下,上周我们聊(不在这个播客里),他提到 Manus 发布第一天,他在旧金山一个会场和周围人展示 Manus,一个印度小哥看到手机界面就来问这是 Manus 吗?他是一家湾区 AI 公司的联创,他们公司内当天就在讨论这个产品了。 这也 cue 到了这期聊到的 R1 的一个启发:技术变化→魔法般的体验→传播与影响→商业模式涌现。 今年我们肯定不止会看到 Manus,一大波 Agent 已来或在路上😄 还有,Manus 发的那个半夜,阿里 QwQ 32B 也发了,这么小,这么强。 流浪地球之后不是上海堡垒,是流浪地球2。技术发展更有迹可循一点。
kamu
kamu
2025.3.10
动不动要么是kill time,要么是save time……我想说fxxk,人真正要的是enjoy time…自动驾驶可以从A点带到B点,AI可以帮忙很好完成工作,但是都无法替代跑个5公里,打2小时网球,完整弹一首音乐的那种体验……
曼祺_MatchQ
:
save time 后,希望我们能 enjoy time,不过这其实是一种需要悉心保护的本能。
RookieStar:人其实是在与time相处的迷茫中度过一生的,kill save enjoy,没有对比就没有深刻体会。如果人生来就是enjoy time的状态,其实TA可能并不能体验到什么叫真正的enjoy
4条回复
HD239810j
HD239810j
2025.3.09
西方夸人声音好听的时候喜欢说「被天使吻过的嗓子」 。我一直不以为然,因为天使自己的声音显然更好听,为什么不直接夸「天使般的嗓音」呢?
听到小晚说话以后我懂了,在天使的智慧面前,再好听的声音也暗淡无光。
唉,不该在睡前听的,今晚没法睡了。
yusen:加上我魔鬼声音的陪衬
pseudo_inv:Sorry,小晚是宋玮吧。。。
3条回复
0x2077
0x2077
2025.3.11
12:49 能帮用户省时间(提高单位信息的价值密度 )的产品会在ai时代诞生
0x2077:33:16 现在对话框的产品形态不能很好发挥模型的威力
0x2077:27:04 传统:钱投出去 人招进来 各种监管 内耗且不高效;ai时代:钱通过购买算力获得生产力 钱的效用更加直接 智力劳动可货币化 更能扩展出更强大的人机社会,劳动结果可资产化 更可诞生价值传输网络
21:09 具体来说应该是其他行业的move 37 出现的时刻可能不是很远了
小逸Louie
小逸Louie
2025.3.10
54:59 未来已来,只是尚未均匀分布,这句话出自科幻小说家,赛博朋克之父,威廉.吉布森

谢谢曼祺,小晚和雨森的这期播客,评论区也印证了这句话
曼祺_MatchQ
:
前天还在重温《银翼杀手》里的经典片段:All those moments will be lost in time, like tears in rain, time to die.(虽然这台词不是原书里的)
生而为猫奴:经典的灵光乍现
fang2hou
fang2hou
2025.3.10
devin其实海外挺多小公司都用上了,毕竟小公司很多本来都是找的学生兼职程序员,devin很多时候能替代这些低端工种了。但起个新项目啥的是做不了的,只有很简单的事情才能有点效率提升,因为一个复杂任务如果要很多轮对话才能扭正过来的话,让有经验的程序员直接开着cursor和copilot写往往更快。(扭正需求往往也需要有经验的程序员才行,所以效率提升也就那样)日本的话可能创造价值也就是和500刀对等,欧美可能小赚但明显还有非常大的发展空间
五里坨
五里坨
2025.3.10
06:26 我觉得吧,这个顶多能说明vc信源不行。rl国内实验室共识9月份就有了,不能说看到12月份的成果才开始做。
奇诺比奥
奇诺比奥
2025.3.12
我是一个广告策划,之前一直觉得服务于大品牌的营销策划案是AI取代不了的(定制化设计、繁杂需求的精细解读),最近突然意识到其实任何工作都没有任何护城河,借着deepseek的大势,我也开始试着在注意力玩法之外使用AI。这期节目让我学到很多,嘉宾讲得连我这样的小白都听得懂。希望多来!
一样嗯
一样嗯
2025.3.09
第一 改logo啦?
曼祺_MatchQ
:
好,让我来看看谁还没发现改 logo 了 😄
迷失的贵族:馊主意 不如以前好看了
谢谢
airecreation
airecreation
2025.3.13
34:58 mark,读写操作,对llm新的视角
Alex_wToP
Alex_wToP
2025.3.13
2:04:36 A Brief History of Intelligence - 作者 Max Bennett
_Lyn_
_Lyn_
2025.3.10
听雨森聊这些,还蛮让人享受的。有见解,有思考。
潦草学者
潦草学者
2025.3.14
雨森的思维似乎太过于依赖通过类比人脑智能来理解人工智能,这个思路不一定是对的。
曼祺_MatchQ
:
接下来会发的有一期会展开讨论这个,(自然界的)智能和机器智能。
阿互
阿互
2025.3.10
爬了一趟山听完了,挺有价值的
小沢光子
小沢光子
2025.3.09
新logo好看耶
黎蔓蔓
黎蔓蔓
2025.3.14
55:08 未来已来,它只是没有均匀分布!用这个podcast的小伙伴都已来到了未来吧😄