与 Koji 的 2025 开年对谈:AI 关键之年,Agent 开启元年

与 Koji 的 2025 开年对谈:AI 关键之年,Agent 开启元年

100分钟 ·
播放数1507
·
评论数7

2025 开年第一周,本期是「此话当真」与「十字路口」的串台特别节目。雨森 和 Koji 一起回顾了 AI 在过去一年的飞速发展,还展望了 2025 年 AI 创业领域的重大机遇。

站在 2025 年初,雨森和 Koji 都感到无比兴奋,认为我们正在亲历科技史上的重要时刻。这份兴奋源自两个重大事件:Devin 的问世,以及 OpenAI 发布的 o3。

正因如此,我们满怀乐观地迎接 2025 年,坚信这将是充满希望的一年。

半年前,在「十字路口」,雨森曾打了一个比方:大模型还是小学生,不该急着让它去打工。如今,随着真正可用的 Agent 产品 Devin 的发布,雨森认为 AI 编程领域完成了重要进化——从「我问你答」,到「我问你写」,再到「我问你做」。这个突破不仅代表 AI 编程领域的重大进展,更预示着一批充满潜力的 AI 垂直领域创业机会。

希望大家新年快乐,拥有爱和希望。

【主持人】

戴雨森:真格基金管理合伙人,投资了包括月之暗面在内的多家头部 AI 公司

Koji:「十字路口」主播,新世相/躺岛的联合创始人

【时间轴】

话题一:对新一年AI产业的整体观察?

  • 2024年,AI的重要进展
    02:19 用一个字形容2024年的感受:「快」
    10:06 未来已来,但尚未均匀分布
    11:58 AI 应用落地新要件:幻觉减少、编程能力提高、计算机使用
    14:35 AI是属于00后创业者的时代吗?新一代创业者身上的共性?
  • 从去年到今年,AI 行业的认知革新
    17:03 超预期的进展:预训练进入瓶颈、Agent落地加速、大模型成本下
    20:50 新的产品形态,将在「强化学习」和「上下文语境」中诞生
    26:30 AI编程发展四段论:ChatGPT → Github Copilot → Cursor → Devin
    30:22 为什么鼓励 AI 出海?鼓励什么样的人出海?
    32:45 给中国创业者的出海建议:想清楚「做什么」+「如何推广」

话题二:未来,AI产品发展与创业机会

  • Devin 为何如此令人兴奋?
    37:02 Devin 使用初体验:月薪500美金的全能「实习生」
    40:37 从 Devin 中,体验到了怎样的未来?
    42:36 新范式的特征:异步体验、云端虚拟机、知识积累、任务收费
    54:47 「Cursor 是程序员的Copilot,Devin 是老板们的 Scaling Law。」
  • 2025年的展望
    01:05:08 对AI保持乐观:人、模型、产品,PMF 磨合仍需耐心
    01:11:27 2025年,什么应用方向更容易落地?创业边界在哪里?
    01:17:16 暗含潜力的新技术浪潮:Agent、可拓展个性化、o3
    01:30:08 生成式 AI Native 的大机会长成什么样子?
    01:33:30 2025年,投资人的共识与非共识

【延伸阅读】

Devin

OpenAI o3:

【提到产品】

  • ChatGPT
  • Github Copilot
  • Cursor
  • Windsurf
  • Bolt.new
  • Websim.ai
  • Devin
  • NotebookLM

【Staff】

监制:Wendi、Zoe
后期:Keyone Studio

【关于真格】

《此话当真》是一档由真格基金出品的泛商业类播客,真格基金投资团队将在此和各领域的领军人物一起分享最新热点和行业洞察。

真格基金创立于 2011 年,是国内最早的天使投资机构之一。自创立伊始,真格基金一直积极在人工智能、芯片与半导体、机器人与硬件、医疗健康、企业服务、新能源、跨境出海、消费生活等领域寻找最优秀的创业团队和引领时代的投资机会。

真格,你的创业第一站!

【联系我们】

公众号: 真格基金(ID: zhenfund)
官网链接:www.zhenfund.com
邮箱:media@zhenfund.com

你可以通过小宇宙、苹果Podcast、喜马拉雅收听我们。
如对节目有任何的建议与期待,也欢迎大家在留言中互动~

展开Show Notes
听到一个小时,做了许多记录,结合我们现在自己的项目,感兴趣朋友可以交流

00后ai创业独特优势:年轻,国际化视野,国内国外一起走,ai 原生
但没经过互联网的流程,包括推广运营商业化等方面经验不足,需要老司机

18:10 互联网数据是化石燃料,被我们消耗的差不多了。但关键在于,人类脑子里尚未被提取的知识,以及ai合成的数据

23:00 目前用ai都是一问一答,没有之前聊天的上下文,用户个性记录等等,输出出来的东西当然质量不高
所以,如何在产品设计中,让用户无痛输入自身更多的,更高质量的信息,并被ai理解存储,是最重要的事之一
一问一答还是非常原始的方式

22:30 现在ai回答都是系统一,几秒钟就答出来
如果系统一系统二结合?有些很复杂的问题,思考20分钟给你答案?
现在这是逐渐能做到的

25:00 context上下文的应用特别特别特别重要,甚至是最重要的,谁能真正把用户深度高质量数据获取到,存储好,应用好,结合新的产品形态,就是王炸

27:00 这个比喻很有意思,现在一问一答,就像是只能写一封邮件的笔友一样。这个上限太低了

32:00 工程师和市场类型的执行能力特别重要,但定义关键问题的能力同样特别重要
对用户和需求的洞察,技术发展趋势的洞察,人性洞察

34:00 巧妙的做营销,利用自己产品的特性。非必要不投流,真知道用户是谁,为什么用,用户在哪,精准kol性价比极高

37:00 新视角
人类过往的工具就是两种
一种是需要持续注意力的(比如锤子,电脑)
一种是重复机械的(洗衣机)

Devin是第一个真正像真人实习生一样,既不需要你持续注意力,又能解决复杂问题的。在体验过程中,有很多细节会让你有启发,感觉未来产品就是这样的

55:40
未来会有产品经理型的ai,调度很多程序员ai去做事情
那我反问:未来是不是教练型以人为本的ai,慢慢就会成为所有ai的上游?
能力逐渐扩展,数据逐渐丰富时

56:00
工作的规模效应(scaling law)
有钱有算力,就能堆叠更多的生产力工作效率
当执行本身变成不是一个稀缺资源时,【做什么】就变成一个极其重要的问题,未来每个人都需要有【老板意识】,知道要做什么

管理AI agent比管理人容易多了,需要的就是钱和算力
未来企业就是两方面:少数最顶尖人才的吸纳,大量AI Agent的协调调度

1:04:00
看到亮点而不是问题,看到未来更多可能性而不是今天值得批评的点
批评者往往正确,建造者成功
我们现在要服务的是前者,是Prosumer
叶安杰Alger
叶安杰Alger
19小时前
1:37:14 技术进步解锁更多应用机会
你问我答——你问我做的进步,agent
预测下一个action,cursor,与sonnet

移动互联网成熟期,产品特别容易使用。
技术早期,使用好产品是需要学习的
绝大多数人用ai,还没有把模型里的智能很好用出来的
模型中压缩大量大量智能,但是如何提问能更好提取更高质量的智能

我们还没有变成很好的提问者

原本使用者使用的目的是为了更好的赚钱,这使得prosumer能支付费用的

哪几个方向能做
1. 首先能帮客户赚到钱的,客户能付钱
2. 能提升10倍生产力的工具
3. 满足人性基本需求(黄色)

移动互联网的产品都是杀时间
针对普通人的陪伴,很难和抖音竞争的

现在有100个团队在做智能眼镜

25年会出现很多agent产品
(改变组织结构,改变原有工作流)

浪潮式的机会
1. agent要素:异步,工具使用,能规划,按照工作量付费
卖工作结果,而不是过程?

2. 可扩展的个性化(scalable personalization)
能否按照你的个性化需求生成你想要的东西
个性化是可以scale up的
(bolt.new,输入生成网站)

已有的软件开发是集中化,每人都一样的
现在或许可以实时生成

对精英人类的benchmark(ai能否通过)
o3就是为了解决人类没解决的前沿问题的

多端到多端的多模态输入输出,很重要
每个模态有每个模态最适合消费的形式
(比如,把三体变成适合视频消费的内容)

同时接收多端,同时发送多端

随着技术扩散,我们用新技术解决老问题
比如电子邮件,解决发邮件
门户网站,解决看新闻
电子商务,解决卖货
随着进一步扩张
人都上网了才有社交网络,信息上网了才有搜索引擎,买卖家物流等准备了才有电商


AI与AI的互动,有什么逻辑?
如何管理agent群

ai时代的商业化?
(互联网都是广告的商业模式)
比如ai会直接略过广告,广告没有意义的

杀时间的,留存很高的,靠投放起量的toc应用。没必要找字节跳动
HD154910y
HD154910y
1 天前
哪个benchmark?swe?github task benchmark那段
good_luck
good_luck
1 天前
49:31 有一段仿佛感觉一个rpa的解决方案工程师在推广rpa产品
1:05:38 非常有insights
02:32 来了!首发
豆丶
豆丶
2天前
来了