年初火爆一时的斯坦福 Smallville「虚拟小镇」,现在宣布正式开源。硅谷人正在 all-in(全力投入) AI 智能体,希望能够创造出一个真实存在,又让人惊喜的「西部世界」,甚至让 AI 智能体们走入寻常人家,为人类的生活和工作效率带来巨大提升。
本期「科技早知道」与「OnBoard!」串台,由硅谷徐老师和合作主播 Monica 共同主持,邀请了曾在 OpenAI 工作和实习,从事 AI 智能体、大模型研究领域的两位大牛参与录制。他们分别是英伟达高级 AI 研究科学家 Jim Fan,和谷歌 DeepMind 研究员戴涵俊。
AI 智能体何时能够进入我们的生活,面临哪些挑战?为什么当今的大模型更像是「炼金术」? Llama 2 为何刚一发布就刺激大量创新出现? 在 AI 研究的道路上,如何避免被「贫穷限制了想象」?如果你想通过硅谷 AI 一线精英从业者那里了解未来即将发生的事情,这期节目一定不能错过。
(考虑到节目时间总长,分为上下两期发布。上半期昨天已经发布,你现在听到的是下半期。由于话题专业性和嘉宾表达习惯,在本期节目中你可能会听到更多英文术语,请听友见谅。不明白的可以在小宇宙上留言提问,我们会尽力回答!)
主要话题
01:35 多模态模型是怎样工作的?为什么 Llama 2 对于大模型生态带来巨大推动?
16:28 要能够处理多模态模型的数据,有哪些核心的难点?
19:59 对于 Jim 和涵俊,在 OpenAI 实习和工作的哪些印象最深刻?
21:32 2016 年,GPT/ChatGPT 的「影子」在 OpenAI 内部浮现
27:47 当学术界被「贫穷」限制了想象:OpenAI 开创一种新的模型训练思维模式,让学术界自然语言研究大牛都觉得传统模式要完蛋了
34:32 做大语言模型,最被高估和低估的挑战是什么?
40:18 10-15 年后,纯语言模型的智商可能已经超越人了
46:40 普通人练就 critical thinking 本领,才能更好迎接 AI 时代的到来
60:19 Jim 被贝索斯关注的时候在想什么?
61:40 涵俊、Jim 和徐老师的结尾寄语
本期人物
Jim Fan,英伟达高级 AI 研究科学家,曾在 OpenAI 实习,博士期间就读于斯坦福大学。
戴涵俊,Google DeepMind 研究员,曾在 OpenAI 工作,博士期间就读于乔治亚理工大学。
硅谷徐老师,硅谷连续创业者、人工智能高管、斯坦福商学院客座讲师,「科技早知道」主播 |推特:@H0wie_Xu| 微信公众号:硅谷云 | AI 英文博客:howiexu.substack.com
Monica,播客节目 Onboard! 主理人,美元 VC 投资人,前 AWS 硅谷团队+AI 创业公司打工人,公众号:M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学
延伸阅读
往期节目
- AI Agent 智能体 真相和未来 | 硅谷徐老师对话英伟达、DeepMind大模型专家(上)
- 超级独角兽 Databricks 联合创始人:从对决 Snowflake,到人类如何与 AI 共存 | S7E21 硅谷徐老师
- 通用人工智能离我们多远,大模型专家访谈 |S7E11 硅谷徐老师 x OnBoard!
- AI大神贾扬清离职阿里后首次受访:创业为什么不做大模型|硅谷徐老师 S7E07
加入我们
声动活泼正在招聘「节目监制」和「声音设计师」,查看详细讯息请 点击链接 。如果你正准备在相关领域发挥专长、贡献能量,请联系我们。
欢迎加入声动胡同会员计划
成为声动活泼会员,支持我们独立而无畏地持续创作,并让更多人听到这些声音。
支付 ¥365/年 成为声动胡同常住民。加入后,你将会在「声动胡同」里体验到专属内容、参与社群活动,和听友们一起「声动活泼」。
在此之前,也欢迎你成为声动胡同闲逛者 ,免费体验会员内容、感受社群氛围。
了解更多会员计划详情,我们在声动胡同等你。
幕后制作
监制:杜晨、闻晓(实习)、刘灿、东君
后期:迪卡普里鑫、六工(实习)
运营:瑞涵、Babs
设计:饭团
商务合作
声动活泼商务合作咨询
关于声动活泼
用声音碰撞世界。声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声东击西、What's Next|科技早知道、声动早咖啡、商业WHY酱、跳进兔子洞、反潮流俱乐部、泡腾 VC、吃喝玩乐了不起
如果你想获取热门节目文字稿,请添加微信公众号 声动活泼
如果想与我们交流,欢迎到即刻找到我们
也期待你给我们写邮件交流,邮箱地址是:ting@sheng.fm
如果你喜欢我们的节目,欢迎 打赏 支持,或把我们的节目推荐给朋友
Special Guests: Jim Fan, Monica, and 戴涵俊.
听完后的一些思考碎片:
1. 现在依旧在非常非常早期的阶段。大半年前就在考虑具体应用场景,但更多是自己打消了自己的念头:要么是对比现有方案并未产生实际价值,也没必要增加噱头;要么需要若干系统的联动乃至涉及数据安全问题,因此直到现在也没在业务中用上。不过后来也就释然了,没必要拿着锤子去找钉子,把它放进工具箱能够打开思路就好。
2. 工地上的对话机器人发布后,一开始感到兴奋,因为终于可以合规的使用专有数据来喂养了,期望是有飞一般的进步。但体验了一阵后感到非常悲观:即使 Temperature = 0、Prompt 严格强调、把涉及到的 FAQ 逐条列出扔给小助手作为知识库,问答机器人还是会出现文不对题、发散、瞎说的问题(当然也有知识库本身的问题)。不觉得这样有什么增量价值,最大的好处可能是省去了现有智能客服的编程过程。但一旦出问题,黑盒逻辑都无法排查……
3. 直到把过去写过的若干文档导入生成了自己的小助手后,才意识到它的价值。一方面是降低了创造的门槛,哪怕只是导入也是令人兴奋的过程,在工地提供了方便环境的情况下应该更积极的去尝试发现场景;另一方面是认识到当下的能力和局限,并不是我所幻想那样的,实际应用中有太多问题需要解决,罗马不是一天建成的(同样的感受也出现在体验 ChatGPT Plugins 后的失落感。写到这里,又想起来了高估短期低估长期的话了)。
4. 物理世界太复杂,哪怕是与现实结合的软件系统当下也不可能完整回溯物理世界。现在统计到的数据只是简化世界的九牛一毛,是远远不够的。我也不认可所有的行为都需要准确量化收益。如果完全都靠数据量化了,那理论上这个公司/业务应该一直赢下去才对,甚至完全都不需要人来做决策了。
5. 至少电子游戏很吸引人的一点是对现实世界反馈机制的简化:付出就有回报。
6. 当下能做的依旧是各种层次的 Exposure。假设真是以十年为维度来观察的话,那现在更应该或者为其准备了。如果回到 2013 年,是怎么也想不到今天情况的,但在跟随内心上还是抓住了主线,所以下一个十年还是继续吧。抱怨过 90、00 后所赶上的时代红利不如 70、80 后,虽然会面临更多意想不到的恐惧,但接下来应该会更加激动人心吧。