EP 36. 对话Deepmind, 英伟达大语言模型专家(上):AI Agent智能体与开源LLM的应用、挑战与未来

EP 36. 对话Deepmind, 英伟达大语言模型专家(上):AI Agent智能体与开源LLM的应用、挑战与未来

74分钟 ·
播放数9371
·
评论数31

承诺大家的大波AI上新来啦!这次的嘉宾是Monica一直期待的重磅组合,能听到AI领域如此一线的核心从业者的分享,真是太难得了。这次在硅谷创新腹地,毗邻 Stanford 的 Palo Alto 线下录制, 不知不觉就聊了近三个小时,我们分成上下期,方便大家收听!

Hello World, who is OnBoard!?

两位AI研究者都在OpenAI 工作过。Nvidia 资深研究员 Jim Fan,是Twitter 上AI领域的顶尖KOL,连亚马逊的创始人 Jeff Bezos 都在关注,几乎每一条twitter 分析都是必读文章。戴涵俊是Google Deepmind 的资深研究员,更是Google 大语言模型的深度参与者。再次来串台的硅谷上市公司华人高管,硅谷徐老师, 持续高质量输出。

上期的内容,我们围绕最近AI领域最火的话题,Generative Agents(生成式智能体)。两位AI研究员都对这个领域有最一线的研究和实践经验,我们深入探讨了从AutoGPT开始,Generative Agents 从技术到应用,都有哪些新的进展、技术和场景的挑战,由此延伸到开源与闭源大语言模型的竞争格局。

跟EP35 Monica 与另一位AI研究员符尧的访谈对比听听就发现,Generative Agents 这个前沿领域,显然还有很多尚未有共识的地方。

下一期,我们会讨论更多AI领域核心话题,包括多模态模型,机器人应用落地,AI对saas的影响,LLM发展史,未来畅想等等,更是不容错过。赶紧关注Onboard!

几位嘉宾都是长期在美国工作生活,夹杂英文在所难免,不接受抱怨。Enjoy!

嘉宾介绍

Jim Fan(推特:@DrJimFan),Nvidia 高级 AI 研究科学家,曾在OpenAI工作,Stanford PhD 李飞飞实验室

戴涵俊(推特:@hanjundai),Google Deepmind 资深研究员,深度参与 Google 大语言模型项目,曾在OpenAI工作,Georgia Tech PhD

硅谷徐老师(推特:@h0wie_xu),硅谷连续创业者、人工智能高管、斯坦福商学院客座讲师,「科技早知道」主播 |微信公众号:硅谷云| AI博客:howiexu.substack.com

主持:Monica(推特:Monica_XieY):美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号:M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学

在粗糙简陋的 studio 顺利完成3小时录制!

Hanjun 的霸气车牌!

我们都聊了什么

02:50 几位嘉宾自我介绍,最近看到了什么有意思的AI项目

05:51 Hanjun @Google Deepmind: 最近发表的 speculative decoding 工作如何提升模型速度

09:14 Jim Fan @Nvidia: 为什么AI agents 是值得关注的方向,基于agents 有什么应用

12:42 什么是 AI agents? 好的 Agents 需要怎样的核心能力

16:54 企业场景落地 AI Agents 应用,主要有哪些挑战?

25:18 AI Agents 目前落地的挑战,是由底层基础模型的能力决定的吗?

35:56 如何看待目前 AI Agents 不同的实现方式?Adept AI 的形态会被取代吗?

39:57 未来工具使用更多是 AI agents 来完成,对于应用生态意味着什么?

48:18 Llama 2 开源对于LLM生态意味着什么?底层基础模型会赢家通吃吗?

56:58 如何理解开源和闭源模型的壁垒?

68:24 我们需要领域专有模型吗?

我们提到的内容

重点词汇

  • RLHF (Reinforcement Learning with Human Feedback): 人类反馈的强化学习 - 一种AI模型通过人类反馈与传统的强化学习结合来学习的方法。
  • Fine tuning: 微调 - 在特定的数据集上进一步训练预训练的机器学习模型,使其适应特定任务的过程。
  • Hallucination: 幻觉 - 在AI中,指的是模型生成不在输入中的信息,可能导致输出不准确。
  • Multi-modal model: 多模态模型 - 能够理解和处理多种类型数据(如文本、图像和声音)的模型。
  • Embodied AI: 具体化的人工智能 - 通过物理或虚拟的身体与环境互动的AI系统,例如机器人或虚拟代理。
  • Quantization: 量化 - 限制用于表示数字的位数的过程,有助于减小机器学习模型的大小并加速计算。
  • Mixture-of-experts (MoE): 专家混合模型 - 一种机器学习方法,其中模型的不同部分专门处理不同类型的数据或任务。
  • Inference: 推断 - 已训练的AI模型基于所提供的数据预测结果的过程。
  • Reasoning: 推理能力 - AI系统根据信息或一组事实得出结论的能力。
  • NPC (Non-Player Character): 非玩家角色
  • RPA (Robotic Process Automation): 机器人流程自动化
  • First class citizen: 一等公民

欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!

M小姐研习录 (ID: MissMStudy)

大家的点赞、评论、转发是对我们最好的鼓励!

如果你能在小宇宙上点个赞,Apple Podcasts 上给个五星好评,就能让更多的朋友看到我们努力制作的内容,打赏请我们喝杯咖啡,就给你比心!

有任何心得和建议,也欢迎在评论区跟我们互动~

展开Show Notes
余智敏
余智敏
2023.8.20
23:34 碎碎念思考随手记。刚才提到的病娇女友主要是在本文上有灵活性,有"多样"的体验,但是如果只是从不同解法的层面,例如最近很火热的《博德之门3》这样的游戏闯关方式也非常多元,同一关可以欺骗不用战斗,战斗也可以有不同的方式,官方提到游戏拥有大约 17000 种可能的剧情结局。只是文本多样性没有直接调用llm那么多,另外是掷色子加了随机性,但是核心玩法还是固定的。所以还是回到刚才那个问题,ai给游戏增加的能是什么,应该是什么,为什么一定要有ai first的游戏,只是多样性个性化的体验,是否是在一定程度的加成即可,亦或是其他结合方式
莫妮卡同学
:
课代表你好!
余智敏:hhhh播客质量太高了!!!真的内容好到忍不住暂停写笔记!
汤不热啊
汤不热啊
2023.8.17
霸气的车牌🤩
王强_Andy
王强_Andy
2023.8.20
1:02:58 开源强在生态和应用,但闭源模型如果有代际升级,会碾压开源。当然开源的基础模型应该也会进步。
余智敏
余智敏
2023.8.20
33:45 写代码能力从function到file的跨越障碍在哪里?还需要多久?一个维度是context长度。模型能力的维度,有效数据获得了很大提升,因此对模型debug能力的提升很乐观。原因是早期训练模型的数据缺失,很难找到大量有效的debug前后内容,但是有了copilot之后,用户会反馈这个过程,因为训练数据得到了很大的提升。
0-_Wahj
0-_Wahj
2023.10.06
不好意思,想问问houlusenation是什么意思呀?(我听的,不知道怎么拼写😂
0-_Wahj:我找到了哈哈!hallucination!幻觉哈哈
WillFu
WillFu
2023.8.17
非常高质量的一期!ai agent应用举例希望听到很多,今天听的比较点到即止。
晓风暮笛
晓风暮笛
2023.8.17
在科技早知道听完了,明天在onboard听下半部分😂
木同1996
木同1996
2024.2.19
27:09 Agent 的能力在模型本身
RXsk
RXsk
2023.8.20
高质量 希望继续
王强_Andy
王强_Andy
2023.8.20
车牌🐂🐂🐂
00:37 首当其冲,用词不当了
余智敏
余智敏
2023.8.20
56:39 llma2的价值不在于本身的能力,而且开源目前相对收敛到这个模型,所有人基于他进行模型优化,生态逐步完善
余智敏
余智敏
2023.8.20
19:02 autoGPT在实操层面应用由于通常调用比较多latency会是非常大的问题,也导致目前实际落地的成功应用很少
MJKLeeway
MJKLeeway
2023.8.19
精彩干货满满 👍
五里坨
五里坨
2023.8.17
07:18 这周正好在企图实现 speculate,摸鱼听播客,吓得我一激灵。
2024年9月考古,可能嘉宾没想到开源模型跟闭源模型的差距真的在减少,可能因为训练侧的scaling law已经scale不上去了
MarcusWanye
MarcusWanye
2023.11.28

cleare
cleare
2023.9.27
cute车牌
condenser
condenser
2023.9.17
越听越感觉openai像个外星文明,时不时抛个demo给人类乐呵乐呵(或者看人类乐呵乐呵)
character ai 做的远不算 agent,因为没有决策