本期是「此话当真」与「晚点聊 LateTalk」的一期串台节目。
「两瓶茅台的价格体验未来,很划算(Devin 最低月订阅费 500 美元)。」
2 月下旬,真格基金管理合伙人戴雨森与晚点的「晚点」的创始人小晚、曼祺畅聊了一次 AI。
推理成本的快速下降,和算力需求大幅提升正同步发生。在这次聊天后的 DeepSeek 开源周中,DeepSeek 用 24 小时的时机数据揭示了效率优化可以做到多么极致;而更便宜的推理,又会带来更多应用机会。
这些变化的起点,是去年至今的两个重要节点:o1 和 R1。它们分别带来了两个对 AI 全行业的影响:
- 一是 o1 在大语言模型中引入强化学习,开启 Pretraining(预训练)Scaling Laws 之外的 Post-training(后训练)和 test-time-computing(即推理阶段的计算)阶段的新 Scaling Laws,让模型推理能力大幅提升。我们之前在第 80 期节目中也有详细讨论 o1,当时业界还普遍猜测 o1 用到了蒙特卡洛树搜索等方法。
- 二是与 o1 同为推理模型的 DeepSeek R1 强势开源,以极低的成本,和后续引发的巨大全民影响力,让很多人重估了大模型行业当前的最重要课题:提升模型能力。R1 的开源和同期发布了详细技术报告另一个推理模型的 Kimi-k1.5 ,也明确告诉整个领域,一些方向是“此路不通”,他们都没有使用蒙特卡洛树搜索等方法。
这期节目,我们从 o1 和 R1 开始聊,二者一同带来的推理能力的提升、成本的下降,和同期模型编程能力与工具使用能力的提升,开启了 Agent 在 2025 年的应用前景。
雨森详细分享了他对 Agent 机会的当前观察,以及在 DeepSeek 带来的开源生态的变化中,大小 AI 公司的新动作和调整。
【主持人 & 嘉宾】
小晚:「晚点」创始人
曼祺:「晚点」科技报道负责人
戴雨森:真格基金管理合伙人,投资了 Kimi(月之暗面)、与爱为舞、无问芯穹、Genspark 等 AI 项目
【时间轴】
OpenAI o 系列与 DeepSeek R 系列的启发
01:46 o1 证明 RL(强化学习)在后训练阶段和推理时间的 Scaling Law 潜力,为 Agent 产品形态奠定基础
04:34 DeepSeek-R1 启发:开源 + RL + 专注的胜利;本土年轻团队的力量;技术提升带来魔法体验,涌现商业模式
详聊 AI Agent
14:35 3 个能力提升带来 Agent 爆发机会:推理 + 编程 + 工具使用;凡是 RL 进入的领域,往往导致人类迅速超过人类,「我把这叫李世石时刻」
18:21 Attention is not all you need,「工作的 Scaling Law」:从「注意力经济」到「无需注意力」的范式转变,Agent 帮你干活
34:17 Agent 产品形态推演:从写(分析类)到读(操作),到 Agent 指挥 Agent 干活(多 Agent 协同);一个例子:Manus 为了获得凤凰城地铁时刻表,在找不到公开信息的情况下给相关部门写邮件。
45:54 Agent 机会属于谁?模型公司自己做,还是应用公司?
53:12 Agent 成本:成本下降、速度变快是必然;200 美元一个月的 ChatGPT-pro,一瓶茅台的价格体验未来,也很划算
开源带来的格局重塑
58:28 DeepSeek 强势开源下:字节与腾讯的不同动作
01:10:49 DeepSeek 长期的商业价值?
01:15:03 开源并非必选项
01:19:49 阿里的节奏:开源、开放
01:28:44 对六小虎:DeepSeek 的「清场效应」;对更多应用公司,加速从「黑莓时代」到「iPhone」时代
01:35:55 对算力需求:总需求变大没争议,但算力结构的变化可能导致英伟达市值调整
为更快到来的 AGI 的未雨绸缪
01:45:09 一生中见证多次指数增长,历史罕见
01:51:42 希望 AI 普惠,但也有可能走向反面
01:54:50 戴雨森个人未 AGI 做的准备
02:04:11 最近的阅读推荐:A Brief History of Intelligence(作者:Max Bennet)、《第一只眼》(作者:Andrew Parker)
【附录】
Devin:由 Cognition 开发的自动化编程助手 Agent。
DeepResearch:OpenAI 2025 年 2月发布的为智能研究 Agent,支持深度信息检索与报告生成。
Manus:本期中提及的 Monica.im 当时即将发布的 Agent 产品,支持多任务自主执行。
ComputerUse:Anthropic 2024 年 11 月发布的通用计算机助手 Agent,允许 AI 操作计算机完成任务。
Cursor:由 Cursor 团队开发的 AI 编程助手。
Perplexity:由 Perplexity AI 开发的 AI 搜索引擎,能提供深度搜索、信息整合和答案生成。
【Staff】
监制:Jiamin、Wendi
后期:Keyone Studio
【关于真格】
《此话当真》是一档由真格基金出品的泛商业类播客,真格基金投资团队将在此和各领域的领军人物一起分享最新热点和行业洞察。
真格基金创立于 2011 年,是国内最早的天使投资机构之一。自创立伊始,真格基金一直积极在人工智能、芯片与半导体、机器人与硬件、医疗健康、企业服务、新能源、跨境出海、消费生活等领域寻找最优秀的创业团队和引领时代的投资机会。
真格,你的创业第一站!
【联系我们】
公众号:真格基金(ID: zhenfund)
官网链接:www.zhenfund.com
邮箱:media@zhenfund.com
你可以通过小宇宙、苹果Podcast、喜马拉雅收听我们。
如对节目有任何的建议与期待,也欢迎大家在留言中互动~