86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路张小珺Jùn|商业访谈录

86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路

92分钟 ·
播放数24029
·
评论数120

今天这集是我和广密【全球大模型季报】第5集,是2024年Q4季报,也是我们录制的第二次跨年特辑。

提前和大家见面啦:)

这次你会发现,我们的聊天篇幅开始从大模型技术转向对大模型产品的探讨。很大概率来说,产品会是2025年AI的最大趋势之一。AI产品会如何落地?产品形态又会如何演变?

广密带来了最新猜想。他提出,过去半年他最强烈的认知变化是,不管国外的ChatGPT、Anthropic、xAI、Perplexity,还是国内的豆包、Kimi,甚至是做Coding相关的Cursor、Devin……虽然各个产品的产品形态不一,从不同路径发散,但最后会殊途同归。他们最终很可能收敛到同一个叙事之下,争夺同一片领地。

很开心转眼之间,【全球大模型季报】已经陪伴大家1年,明年仍然希望这个系列能持续地帮大家了解最前沿的AGI动态并带来认知进化。

本集是《张小珺Jùn|商业访谈录》和《海外独角兽》的串台节目。
我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯。
02:33 Part 1: OpenAI
  • ChatGPT本质是奔着“下一个Google”方向去了,如何beat Google是最大的牌
  • 一定要逛计算机历史博物馆,理解“计算架构+信息分发”演变的主线逻辑
  • Google也是从Yahoo边缘市场撑大做起来,伟大公司是从边缘市场起来
  • 小红书非常有意思,融合了搜索+推荐+问答+做任务一体化
  • 这些产品最终的最终会变成任务引擎、任务容器,是下一个Google
  • 电商过去最核心的是GMV,订单转化率,AI时代我感觉是任务完成率
  • Chatbot对话形态大概率不是提取智能最有效的交互方式,模型如何更主动?
  • 可能的一个产品形态是个人助理或者超级助理
  • Context非常核心,绝大多数人都还没意识到,是一条关键的暗线
  • 如果AI的生成能力增强了,未来会生成的是什么?Mobile最大增量是内容,LLM最大增量新型软件
  • 既然这些LLM产品想成为Google已经变成了一张明牌,你觉得Google有能力阻止这件事发生吗?
  • “下一个Google”的产品,会是一家垄断吗?
  • 微软和OpenAI同床异梦,微软可能会投资Anthropic
51:04 Part 2: 硅谷其他AI公司和产品
  • Anthropic:得Coding,得开发者,得API消耗,有机会得生态,做OS
  • Anthropic比较专注Agent,怎么让Agent更快落地是更高优先级
  • Killer App长期要有竞争力,要端到端垂直整合能力,向下优化,优化成本、模型架构、模型大小、调整模型数据分布、甚至向下优化推理芯片
  • xAI:还是注定要成功,但是upside还有多少不太确定
  • Perplexity:更像是一个信息处理的Agent
  • Cursor:Coding产品形态要快速迭代,之前补全下一个代码,Cursor补全下一个Action,明年可能端到端生成软件
  • Devin:第一个真正意义上做长距离复杂任务的Agent,明年最具有商业价值的是long horizon Agent(长期规划智能体)
  • Mistral:已经不用再关注了,他们内部也正式放弃预训练了
01:02:24 Part 3: 对2025/2026关键预言性判断
  • 1/ Long horizon task 是下个重点,重要核心圈子几个大佬级人物都在重点做
  • 2/ 产品形态的探索,全新的交互界面
  • 3/ AI商业模式的探索,今天商业模式还是移动梦网时代
  • 4/ 高质量+scalable的数据,尤其是各个垂直行业里面,有没有几千条甚至上万条,任务+Reward数据,要高水平专家标注
  • 5/ GPT-5/4.5 Orion:提升能有多大
  • 6/ O1后面天花板走到哪:大规模scale RL/o1之后会怎么样,会不会很快遇到瓶颈
  • 7/ 假设Coding能力明年提升10倍,软件开发范式怎么改变
  • 8/ Context很重要,大家都还不够重视
  • 创业公司没法同时做好这么多,得找锋利的切入点,一根针捅破天
01:11:11 Part 4: 再谈Scaling Law
  • Ilya最近提的pretrain data wall(预训练数据壁垒)是什么?
  • 后训练中有一个关键问题是奖励模型(reward model),整个地球上没有一个reward model衡量所有人,你相信会未来有吗?
  • O1系列天花板会卡在哪?这条路通往AGI吗?
  • Scaling Law关键阻碍不是算力,不是算法,是data问题
  • ChatGPT有数据飞轮吗?未来会出现吗?哪些产品里有高价值数据?
01:22:19 Part 5: 复盘2024
  • 回顾一下,能定义2024年全球大模型产业的关键时刻?
  • 全球大模型又狂卷一年,卷出了什么?
  • 今天想要进入决赛圈,条件是什么?
  • 哪些去年的判断你今天更坚信了,哪些去年的判断你今天认知有改变?
  • Mega7巨头里面最看好哪个?
  • 硅谷人才在流向哪几家公司?
  • 明年如果只投一个方向,投什么?
  • 这一轮大的机会,我总结是这3个……
  • 2024关键词?2025关键词?

【全球大模型季报】系列

2023年:口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观

2024年Q1:和广密聊AGI大基建时代:电+芯片=产出智能

2024年Q2:口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态

2024年Q3:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL

【更多信息】

联络我们:微博@张小珺-Benita,小红书@张小珺jùn

更多信息欢迎关注公众号:张小珺

展开Show Notes
张小珺
张小珺
2024.12.22
置顶
大模型季报年终特辑来啦!“如果一个季度只收听一期关于全球大模型的播客,听这期就够了。”🗞️🗞️
kamu
kamu
2024.12.23
感觉嘉宾聊的都是现象没有触及问题的本质。

从信息流通的角度,信息流通有三个方向:
1、信息生产越来越容易;
2、人与人沟通越来越容易;
3、接收的信息越来越优质。

移动互联网尤其是短视频形态的出现让信息生产已经几乎没有任何门槛了,人人成为自媒体在历史上第一次在现实中成为可能,但是移动时代的兴趣推荐算法却形成了新的问题:
1、用户感兴趣的内容不代表是优质的内容;
2、个体兴趣形成的割裂让人与人沟通形成了障碍。

也就是说移动时代没有很好地解决人与人沟通和优质内容获取的问题。

AI 会对现有内容分发机制产生颠覆,当然 AI 会进一步加速内容生产和流通的效率。

AI以概率为底层逻辑的目的是“寻求共识”,现有以个人兴趣为底层逻辑的内容分发的目的是“寻求自我”;

AI会颠覆掉移动时代的内容分发机制,让知识更普惠,以“共识”为基础而不是以“兴趣”,“兴趣”以“共识”为基础,而不是被虚假信息或者某个网红带偏,当然这是积极的一面,因为在大部分的常识领域AI提供的答案只能是确定而唯一的,不可能是千人千面。

再说一下,商业模式的问题,不能以移动时代的商业模式来套 AI 时代,因为内容分发机制产生变化了。

回顾一下传统媒体时代的商业模式:订阅+广告
移动时代:完全依赖广告
AI 时代以“优质内容”分发为基础的机制为什么不会回到:订阅+广告的模式呢?
小宇宙听友:+1 Dance around concepts,90 mins wasted🤷‍♂️
涔涔_MBwq:移动互联网前电视广播网页等成本极高、移动互联网时代仅软件成本在互联网公司这边硬件(手机)和内容成本来自个体、ai大模型时代拥有算力和历史知识的模型训练成本收口了大量的信息的
8条回复
Guangmi
Guangmi
2024.12.22
字节和微信是内容容器,LLM产品是任务容器
kamu:感谢广密大度点赞我的吐槽,其实,这期播客我也学习到很多很有收获……
Aa_8Xcx:小红书也是
4条回复
JZ_LI65
JZ_LI65
2024.12.22
超喜欢这个系列!小珺问得好,广密答的也精彩。即能回顾发展脉络,又能展望未来方向。真是干货满满!
X时代Erwin
X时代Erwin
2024.12.22
什么时候邀请马斯克这小子来谈谈
HD87741n:马斯克一般般,要是能把乔布斯请过来就真牛逼了
杨能昆AI:那把牛顿也叫上吧
5条回复
HD1022550r
HD1022550r
2024.12.22
作为一个一年的回顾,国内只提了一点字节。。。qwen和deepseek都不配被提到一下吗?
好奇的风风:豆包六千万月活,国内其它的ChatBot的用户体量相比起来都可以忽略不计了。只要后面不出现技术代差,国内格局基本已经定了吧,字节一家独大,腾讯由于微信的存在理论上还有后手,其它家应该没法在这个赛道有效竞争了
dj3H:之前说过,人才密度,卡的数量。
6条回复
ll_3ZN1
ll_3ZN1
2024.12.23
缺少真正的洞察,还是在给当前媒体上热门的趋势加注解
庄明浩
庄明浩
2024.12.22
季度更新来了
雷鑫_AZsM
雷鑫_AZsM
2024.12.22
很受启发,这么看AI的下一代killer APP应该是基于服务的推荐引擎(从信息推荐的字节、商品推荐的拼多多到服务推荐的任务引擎)
AIboy1993
AIboy1993
2024.12.23
有一个问题啊,用户几个亿,为什么不看一下用户画像?像抖音这样的app,即使是村头大爷大妈都能玩,但是下沉用户拿gpt用来干嘛?
JoyceCheng
JoyceCheng
2024.12.22
背景ost是社交网络点大赞 ,很应ai现在的高速和未知
瞎说设计
瞎说设计
2024.12.25
其实说像Google不如说是一个ios系统的新的交互范式
瞎说设计:这个播客做的真好,我竟然想出来冒泡
瞎说设计:整体来说,类比思维方法去推演,不一定能回答agent的百亿问题
4条回复
maxim28
maxim28
2024.12.25
这一期质量好高
有道_ENFn
有道_ENFn
2024.12.22
和广密聊的每一期质量都好高!
黑胡椒黑
黑胡椒黑
2024.12.26
1:11:39 现在人类的智商不一定比1-2百年的先人的智商高,而是因为有了大量知识、文化的积累、传承,让我们比先人更先进,但不是一定是人类是智商提升了多少
巾陆:印证了人类没啥进步,进步的是工具,工具的进步是自然规律。
陈不撕
陈不撕
2024.12.22
从替代搜索引擎的角度来看,是大模型不可避免的幻觉问题更可怕,还是人为的竞价更可怕……如果AI搜索引擎的商业模式和以前一样的话,那后者的风险也要叠加到前者上。
ada_6gZw
ada_6gZw
2024.12.23
反复提到的k lab是什么意思啊?
Richardt:kill app
sonit还是sonic
XWJ_6iB7:sonnet?
HD242945p:sonnet
期待李想的播客上线😀还有记得梦秋姐返场~我妈妈那天在我车里听了,她觉得讲得很好。
JASting
JASting
2024.12.28
09:19 perplexity最大创新是定义了搜索的形态,AI帮你使用搜索引擎,用户可以抓住一个话题一直追问和互动。