大模型只是起点:朝向多智能体和人类紧密协作的未来

大模型只是起点:朝向多智能体和人类紧密协作的未来

61分钟 ·
播放数9644
·
评论数9

在OpenAI的YouTube官方账号里,一个小红人追着小蓝人玩捉迷藏游戏的视频有最高的点击率。

在强化学习算法下,小红和小蓝这些AI小人在虚拟世界里面不停玩游戏,一开始的小蓝只会躲,在日夜重复玩了上万轮之后,它们开始发现策略、学会协作、甚至反制。

第一期节目,我们邀请到了清华大学交叉信息研究院助理教授吴翼,他也是捉迷藏游戏的团队成员之一。在2022年回国任教前,他曾在OpenAI工作了一年半的时间。在他现在的办公室里,有意思的AI实验还在发生,有的训练AI玩游戏,有的指挥机器狗追小球,而这些共同的目的是想做一个能与人交互的通用AI

在本期播客,你将听到:学术界与工业界之间、中美公司之间研究AI的区别在哪里?为什么将游戏作为AI的研究对象?机器人的GPT-3时刻是什么?ChatGPT对机器人有什么帮助?如何考虑AI的安全与对齐?

【主持人】戴雨森 真格基金管理合伙人

【嘉宾】吴翼 清华大学交叉信息研究院助理教授

【时间轴】

01:59 打游戏,指挥机器狗追小球,吴翼的团队正在做什么

03:42 ChatGPT不能把事情全做完,它只是起点

10:46 OpenAI的研究方式不同于传统的学术界和工业界

11:53 如何看待OpenAI从非盈利组织转为盈利性公司?

14:45 字节会做出中国领先的大模型吗?

17:38 AI喜欢研究游戏,因为游戏是足够复杂的模拟世界

30:31 机器人的GPT-3时刻:机械手拧魔方

38:28 AI可以写小说、玩游戏,但做不到给你递一杯咖啡

50:27 给大模型加一些不确定性,防止它自信地胡说八道

55:11 未来人们的工作可能都在为AI创造数据

58:40 吴翼最近在筹备的创业团队

【相关资料】

吴翼清华主页

Multi-Agent Hide and Seek

这个小AI后来学会了一些奇技淫巧,我们看到以后就第二次地崩溃了 | 吴翼 一席第811位讲者

【节目制作】

后期:虫二

【联系我们】

公众号:真格基金(ID: zhenfund)

收听渠道:小宇宙|Apple Podcast|喜马拉雅

邮箱:media@zhenfund.com

如对节目有任何的建议与期待,也欢迎大家在留言中互动~

展开Show Notes
41:33 这就是为什么在建筑机器人赛道能做抹灰机器人的只有蔚建,但能做喷腻子的有一堆。但如果深入看过建筑工艺的话,就会发现,在二次结构和装修环节用机器人的话,喷漆可以,喷腻子算是个伪命题,因为喷完,还要再刮一遍,不然工艺水平和人做得差太远,没法验收。
这种娓娓道来,信息质量又高的对话真好,听着舒服,收货满满,灰常👍~
大家好
智子公社
智子公社
2023.5.31
超人工智能时代,人的最大价值是生产原始数据,这点与智子公社节目里的观点不谋而合
有类似这种开源项目推荐吗
Charles_Zhang
Charles_Zhang
2023.12.07
23:02 LLM 是否可以解决长时间的谋略问题?目前最新的工作已经可以让 LLM 玩星际争霸 full game(不只是 SMAC) 击败 hard 模式的对手,也有工作成功用 LLM 玩文明的游戏。
Jinming0216
Jinming0216
2023.6.04
跟大佬学习
花小撒
花小撒
2023.6.03
启发
给雨森大佬子打call!