EP 53. AI Agent会取代程序员吗?硬核对话硅谷顶尖研究员与AI独角兽:软件开发的未来,Agent的技术本质

EP 53. AI Agent会取代程序员吗?硬核对话硅谷顶尖研究员与AI独角兽:软件开发的未来,Agent的技术本质

167分钟 ·
播放数16377
·
评论数77

今年上半年 AI 领域最大的热点,除了 OpenAI 的 Sora 之外,当然就是——AI程序员!与 Github Copilot 的代码补全不同,AI Agent 公司 Cognition Labs 和其产品 Devin,宣称世界上第一位“AI 软件工程师”,拥有全栈技能,通过一个指令就能完成整个开发过程。可以端到端构建和部署程序。成立不到半年,估值就高达 20 亿美金!相应的,从Princeton SWE-agent, 到开源项目OpenDevin 这些直接竞争者,到Replit, Augment 等独角兽玩家,都纷纷进入这个领域。这是新的泡沫,还是不远的未来?

Hello World, who is OnBoard!?

这一期我们邀请的三位来自硅谷的嘉宾,在这个领域都太有发言权了!有著名的软件开发云平台独角兽 Replit 的 AI 产品核心成员,有 Agent 领域数个奠基之作的顶尖研究员,还有 ex-Google Deepmind, 现任明星 AI 编程辅助独角兽公司 Augment 的早期核心研究员。

借着小酒,我们长达两个多小时的对话,畅聊了你最关心的话题:

AI 会取代工程师吗?

AI取代了一部分软件开发需求之后,会如何重塑软件开发?

Devin 是否能代表 AI Agent 应用开发的方向?

Agent 产品未来还会迎来怎样的提升?基础大模型的边界在哪里?

最后,生成式 AI 对个人职业和社会会产生怎样的深远影响?

这或许是市面上你能听到的对于这个话题最深入的讨论(之一?!)——还有,结尾有来自 Princeton 高材生的彩蛋!

Enjoy!

嘉宾介绍:

  • 李珎:Replit AI 团队负责 AI Coding agent,ex- startup 创始人, ex- Googler。Replit 成立于 2016 年,是一个基于浏览器的 IDE,允许用户在多种编程语言中编写、运行和分享代码。2023 年$97.4M 的 B 轮,投资人包括 A16Z,Khosla Ventures、Coatue 等,估值 $1.16B
  • 姚顺雨:普林斯顿大学博士,清华大学获学士。他在Agent 领域发表了一系列非常有影响力的论文:从有奠基意义的 ReAct,Tree of Thoughts, 到成为行业标准的基于 GitHub 的代码能力评估数据集 SWE-Bench,到首个开源AI 程序开发 agent 项目 SWE-agent,是绝对的天才研究员!
  • 赵宇哲:Augment 任 AI 研究员,曾在Google Brain(现Google Deepmind)任 Staff Research Engineer,主要研究方向是语言模型预训练,指令训练,神经检索和检索增强语言模型。Augment 成立于 2022 年,是一家为提供企业级全栈式 AI 编程助手的初创公司,由硅谷著名老牌风投 Sutter Hill Ventures 孵化(Snowflake也诞生于此),并在最新一轮获得由Index Ventures、Lightspeed Venture Partners 和 Google 前 CEO Eric Schmidt 等领投的 2.5 亿美金融资,估值接近 10 亿美金。

OnBoard! 主持

  • Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学
  • 高宁:前美元 VC 投资人,Global SaaS 社区及服务组织 Linkloud 联创,公众号我思锅我在 (ID: thinkxcloud) 主理人。| 即刻:High寧

我们都聊了什么

03:30 三位嘉宾背景、如何进入AI领域以及最近常用的AI产品。

20:26 Replit是如何设计AI产品的,背后逻辑是什么?

28:58 Replit需要训练Coding专属模型的原因是什么?

34:04 训练代码或数学等专属模型的目的是什么?

37:50 现在Coding模型跟基础大模型的能力相比有什么差异?

40:51 Coding模型的训练方法对基础大模型的训练还有什么启发?

45:26 为什么Replit当初选择构建自己的IDE,以及对后来AI功能设计的影响在哪里?

51:01 为什么Augment选择以插件的形态服务专业程序员,以及难点在哪里?

55:27 为什么RAG能更好理解企业级Codebase的需求?

58:13 使用RAG的过程中最有挑战的地方在哪里,以及如何保证准确率?

63:38 Augment如何将服务企业的产品标准化?

67:04 为什么短时间内具有更长Context的大模型仍无法替代RAG?

69:57 为什么没有针对Coding能力好的Benchmark,以及SWE-Bench诞生的背景?

73:48 什么是SWE-Agent,以及Agent解决了什么问题?

78:50 为什么SWE-Agent或Devin相比RAG的准确率有很大提升?

81:33 SWE-Agent跟Devin的差异在哪里?

83:12 往后这类Coding agent的准确率提升会在哪里?

86:50 回顾Agent领域的发展,其中有哪些重要里程碑?

93:01 是否有必要训练针对Agent的大模型?

98:37 Replit是如何探索Coding agent的?

102:03 对Devin印象最深刻的是什么,还有什么是不知道的?

105:43 Devin现在的用户画像可能是谁?

109:45 为什么Coding agent能力提升不仅在大模型上,还需在产品化上?

116:46 顺雨最新一篇解决奥数问题的研究对Coding模型有什么启发?

120:31 现在基础大模型的能力提升还在哪里,还有哪些是我们不知道的?

122:15 大模型是否具备System 2的慢思考能力,以及我们如何实现?

127:13 关于Multi-agent,Replit在做怎样的探索?

131:13 如何定义Multi-agent系统,什么情况下需要?

135:08 要实现Multi-agent环境,具体会面临什么挑战?

137:31 展望未来,AI编程究竟会如何重塑软件开发流程?

145:45 基于语言模型的Agent带来的社会影响有哪些,人类真的会被替代吗?

158:56 最后,快问快答:今年研究的小目标、业余爱好和短期内AI最期待的事件?

165:14 彩蛋!来自顺雨的一段RAP,欢迎来到“宇宙中心”!

我们提到的公司或产品

我们提到的论文或文章

欢迎我们的微信公众号,了解更多中美软件、AI与创业投资的干货内容!

M小姐研习录 (ID: MissMStudy)

我思锅我在(ID: Thinkxcloud)

欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。

OnBoard! 终于成立听友群啦!新年新气象,加入Onboard听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes, 发送你的姓名、公司和职位,小助手会拉你进群。期待你来!

展开Show Notes
内容很好,但就是嘉宾的声音听不太清,得非常非常集中才能听清在说什么
周声:开启设置中的人声增强
Ben_uGTu:同感,听不太清楚
8条回复
至少给每个嘉宾配个收音的麦克吧,好像不止一次了,这声音质量太差了,都要听不下去了。准备找个模型翻成文本总结来看了
骁霖
骁霖
2024.5.16
能不能不用Mac电脑录制声音,用一个简单的录音设备效果就会好很多,这个声音质量听着很辛苦。因为我同事与客户开会就喜欢用Mac电脑录音,听着效果是完全一样的,非常辛苦才能听清内容。建议去买一个会议麦克,效果好太多了
Alan42
Alan42
2024.5.17
听不清是容易走神🥺
HD636422z
HD636422z
2024.5.22
开头提到的好用的AI产品是Perplexity吗?
linusturing:是的
HD249687n
HD249687n
2024.5.15
太棒了!非常高质量的访谈如果有show note summary就更好了
NLive
:
小宇宙能不能出个 ai 总结哈哈😂
NLive
:
嗯嗯 我们这几天稍晚有点忙 这周马上处理请求 感谢等待!
3条回复
AI-Nate
AI-Nate
2024.5.18
Rap很棒啊!👍
oliviak
oliviak
2024.5.16
音质效果确实一般,内容真好,但要在家里安静的听
Jasmine_O1aJ
Jasmine_O1aJ
2024.5.26
58:51 这里是重点
Jasmine_O1aJ:学术界retrieval,标注hard
红咕宁
红咕宁
2024.5.19
1:29:52 第一件事 action space,然后是decision making。目前action space 大多not well defined.
Jasmine_O1aJ:所以coding比较好定义?想听更多的例子
Wendy_1
Wendy_1
2024.5.22
嘉宾说的这个搜索工具是什么?
汤不热啊
汤不热啊
2024.6.04
来了
李得水
李得水
2024.5.30
Program language 确实需要进化,期待自然语言编程早日实现
十月Angel
十月Angel
2024.5.20
声音啥都听不清,简直是听力练习,太嘈杂了
halfong
halfong
2024.5.19
这期录音似乎有些问题..听得费力
Damon_NWGA
Damon_NWGA
2024.5.19
嘉宾声音听不清
Eric0112
Eric0112
2024.5.18
音质太差了,这么优秀的受访者有点可惜。看能否用一些ai工具净化一下音效?
AI-Nate
AI-Nate
2024.5.17
24:00 说的主要功能都是MS Copilot的功能,在VS加插件可以实现了。是有其他特别的地方吗?
郭振_uoSa
郭振_uoSa
2024.5.16
嘉宾的声音确实很不清楚
Kyle0812
Kyle0812
2024.5.19
加了小助手,说要加群没回复,后面直接把我删掉了,姿态这么高的?
NLive
:
没有删,最近小助手有点忙,我们尽快处理,感谢等待