Vol.21 对话无限光年漆远:AGI 的标准是打造「AI 的爱因斯坦」,Scaling Law 不通往 AGIAI局内人 | AGI Insider

Vol.21 对话无限光年漆远:AGI 的标准是打造「AI 的爱因斯坦」,Scaling Law 不通往 AGI

115分钟 ·
播放数4710
·
评论数17

OpenAI 反复强调的 Scaling Law 原则已被业界广泛接受,「照着 Scaling Law 咱就往里砸钱」似乎已经是大模型厂商的主流路径之一。Scaling Law 真的是通往 AGI 唯一的路吗?

无限光年创始人漆远认为,通往 AGI 不能只靠 Scaling Law。从学界到业界,回归学界后如今再次出来创业,漆远教授对于当下的 AGI,有着更深刻的理解。

为什么说 Scaling Law 还不足够?AGI 的标准到底应该是什么?为什么说 AGI 的标准之一是打造「AI 爱因斯坦」?为什么我们需要「灰盒大模型」?

在 Founder Park 直播间,极客公园创始人&总裁张鹏与无限光年创始人漆远聊了聊 AGI 的落地和未来。

本期播客为直播对话的剪辑版,剪辑/后期:孟获。

嘉宾介绍

漆远|复旦大学教授、上海科学智能研究院院长、无限光年创始人。

时间轴

00:05:08 漆远的前半生:学术出身—进入阿里—重回学界—再次创业

00:09:31 研究 AI 好多年,漆远怎么看大模型浪潮?

00:11:47 学界的贫穷限制了对 Scaling Law 的想象?

00:23:50 「AGI = AI 的爱因斯坦」的3层解读

00:31:13 牛顿更像大语言模型,爱因斯坦更像 AGI

00:33:40 为啥不能全部押宝在 Scaling Law 上?

00:39:55 实现 AGI 要把语言模型和逻辑推理结合

00:50:07 世界不只黑和白,AI 落地需要「灰盒大模型」

00:54:08 RAG 就是打补丁?大模型的黑盒是 Transformer 造成的吗?

01:08:21 Scaling Law 还有红利,但自回归架构不可能吞噬宇宙

01:14:51 有的场景有黑盒就够了

01:22:51 国内视频生成跟国外差距大吗?视频生成是下个风口吗?

01:29:28 跟马斯克学「造火箭」:技术创新和产品落地二合一

01:39:24 都做一模一样的 RAG,最后一定会价格战

01:46:34 又一波技术浪潮,年轻人怎么选方向?

相关阅读:

对话无限光年创始人漆远:Scaling Law 不通往 AGI,AI 落地需要「灰盒大模型」

关于我们

这里是极客公园旗下的科技创业者社区 Founder Park 出品的 AGI 系列播客节目。

「AI局内人」,国绕 AGI 相关领域的技术发展、产品方向以及新的商业模式进行探讨和交流。

Founder Park 正在搭建 Al Native 的产品交流群,群内聚集着致力于在大模型相关领域创业的创业者、产品经理、研发工程师、对大模型技术和场景应用开发进展感兴趣的学者及投资人。

对 Founder Park 的更多内容感兴趣,欢迎关注公众号「Founder Park」。

展开Show Notes
主持人太抢话了 显得自己很会的样子
林司风:嘉宾几次尝试都插不进来,听得我急死了😅
HD1022796h
HD1022796h
2024.7.10
希望主持人不要老是不合时宜地打断嘉宾
语言是交流的工具,不是思考的工具
YTrip
YTrip
2024.8.05
主持人能不能设一个max_tokens
万户:直播的时候有时候怕观众听不明白会多做一些解释,这个之后在剪辑播客的时候我们会精简一下。
史文字
史文字
2024.12.18
51:52 这个提供了很多不同的思路有意思
LiamZ
LiamZ
2024.8.27
统计➕逻辑
概率到概率,概率加逻辑
Lennox_
Lennox_
2024.7.16
领域大模型是不是一个伪命题
MrRice
MrRice
2024.7.14
52:14 知识与数据共同驱动
漆远老师提到的“语言不是用来思考”的文章链接能发一下吗?Google了一下,未果
万户:我们找一下,找到了回复你!
傀儡师:https://www.nature.com/articles/s41586-024-07522-w
3条回复
TartarusRid
TartarusRid
2024.7.10
40:26 套用系统1和系统2的说法的话,目前的LLM都是系统1,而以前的ALPHAGO这类系统是系统2,前面说了很多的牛顿等,都是系统2,所以这里就是要将系统1和系统2结合起来。
但,这个观点我记得23年初就有人提出过了,问题不是想法,而是可实现的方案。
HD807299s
HD807299s
2024.7.10
1:16:46 所以世界模型或者空间智能的训练需要立体视觉?