76. 王小川返场谈o1与强化学习:摸到了一条从快思考走向慢思考的路张小珺Jùn|商业访谈录

76. 王小川返场谈o1与强化学习:摸到了一条从快思考走向慢思考的路

39分钟 ·
播放数27409
·
评论数24

在过去两集节目中,关于OpenAI o1和AGI范式转移,我们先是推出了一集预言,之后推出了一集解析。在一个新范式来临的临界点上,我们希望听到更多来自业界不同视角的声音。哪怕这些声音是切片的、冲突的,我们都希望当做一种记忆和留存收集起来。

今天这期是王小川的返场。

王小川在创业开始就关注到强化学习并且很早开始公开谈论。他曾说,大模型代表快思考,它叫“学”;强化学习是慢思考,它叫“思”。“学”和“思”两个系统最终会走向融合。除了o1,王小川也聊了聊强化学习在一个特定场景——医疗——中的应用。

我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)
  • 01:30 大模型是“学而不思则罔”,强化学习是“思而不学则殆”
  • 03:45 Sam Altman被宫斗下课与强化学习大神Noam Brown的动态
  • 05:45 OpenAI o1是范式升级,摸到了一条从快思考走向慢思考的道路
  • (DIKW模型:Data – Information – Knowledge – Wisdom)
  • 08:18 怎么看o1隐藏思维过程,有人破解o1思维链会被警告要封号?
  • 09:04 从以语言为核心走向思维链,分两阶段运行增加泛化性
  • 11:38 强化学习 vs 监督学习
  • 16:39 除了数学和代码以外,医疗是可以用强化学习提升的领域
  • 19:55 之前做强化学习实验没有CoT(思维链),今天更强调CoT了
  • 22:16 复现o1 vs 复现GPT-4
  • 26:30 未来几年将从强化学习范式走向写代码解决问题新范式
  • 28:35 做“水涨船高的应用”,不只是“沿途下蛋的应用”
  • 31:35 创业公司要走出大厂射程,在射程内你是没什么好活的

【更多信息】

联络我们:微博@张小珺-Benita,小红书@张小珺jùn

更多信息欢迎关注公众号:张小珺

展开Show Notes
这一期内容没有之前充实
明兰璎珞
明兰璎珞
2024.10.05
今天听了好几期播客,这个嘉宾的回答太水了
传说中的三骑士:你好,其他几期能推荐给我吗,感谢🙏
花音玥
花音玥
2024.9.28
COT是什么意思啊
蘸盐:chain of thought,思维链,在复杂任务里加上推理过程
DM48-S
DM48-S
2024.10.10
深入浅出 基本把O1背后的技术逻辑讲明白了 代码会是大模型下一步核心能力的预测 不知道会不会成真
边打工边听老板的podcast哈哈哈
HD534980z
HD534980z
2024.10.12
音质太差了
不明道
不明道
2024.9.25
小川总把未来产品方向说清楚了,LLM的未来是要变成超级人类,有丰富的知识,会沟通,会思考!那么人力资源最贵的地方就是现在应该着力打造新应用的地方!医生、顾问…小川总给力💪
今天另一档播客晚点聊的嘉宾讲了一个观点,训练大模型就好比造一个上树去摘果子的梯子。市场上不需要那么多梯子,人们只选那个最长的梯子。因此,现在国内大模型第一梯队的六小强都很尴尬。新出一个开源版本,他们过去花去上月时间数千张卡训练的模型就废了,还得重新训练。真不知能撑到什么时候。而第一梯队的三大家,百度,字节,阿里虽然钱多多,技术上也一样面临同样边际效益小的问题,他们会觉得与其自己训练大模型再被废掉,不如就做公有云卖卡。总之训练基座模型不是个好生意。再有,OpenAI O1 的推出就像当初 GPTs 推出时,立刻创业公司死一半一样,也是让那些只套壳,靠一点 prompt engineering 来创业的公司立刻死掉了。
尊介
尊介
7小时前
王小川总是说思考,大模型不会思考……觉得一些例子和实践高度不够,细节不多,典型的管理者思维和工作模式,下被员工忽悠,上有赶不上顶尖水平。
Julia_Scott
Julia_Scott
2024.11.03
21:16 训练医疗很好理解,但还是不太明白,为啥要花这么大的力气优先训练现代社会使用率较低的诗词能力🤯
国内公司除了月暗踏踏实实地follow,其他的有点嘴硬。。
o1 等于验证了之前的思路,感觉小川一直很有自己的节奏和判断,之前就强调要以语言为核心+强化学习,没有跟风去搞文生图文生视频那些
fang2hou
fang2hou
2024.9.27
感觉强化学习这两年也没啥大发展啊,不是很懂为啥总是单独拿出来说。就算不谈技术,数据量上去之后要控制人工标注成本的话,走强化学习也属于必经之路
AI-Nate
AI-Nate
2024.9.26
34:42 主持人问了一个比较尴尬的问题,因为还没有答案。
HBDL1998
HBDL1998
2024.9.27
天天追在openai屁股后面分析,国内自己有思路么?
HD636852u
HD636852u
2024.9.29
饭要一口一口吃,事要一点一点来,创业者还是得接地气一些,当下做到哪里就解决哪里的问题,不要造过于抽象的概念,不要想太多过于遥远的问题,抽象概念解决不了问题
是一心啊
是一心啊
2024.9.25

AI-Nate
AI-Nate
2024.9.26
18:24 国内大模型公司是要将抄作业进行到底了😅,选错方向的几率实在太高了,但是还是得有人去试。加油!
Danielsun
Danielsun
2024.9.26
方便问一下,开头和结尾的背景音乐是什么呢?好治愈的声音
乔治_n84B
乔治_n84B
2024.9.25
太肝了吧博主