Vol.13 张鹏对谈月之暗面杨植麟:大模型创业需要新的组织范式AI局内人 | AGI Insider

Vol.13 张鹏对谈月之暗面杨植麟:大模型创业需要新的组织范式

87分钟 ·
播放数10364
·
评论数29

月之暗面 Moonshot AI 是一家神秘且特别的大模型创业公司。

公司目前只发布了一款产品,基于千亿大模型的 chatbot 产品 Kimi Chat。发布之初,就打出了「长文本」、「自研闭源」、「toC」等清晰的标签。

创始人杨植麟饱受期待,他毕业于 CMU,师从苹果 AI 负责人 Ruslan Salakhutdinov,曾在 Meta 和 Google Brain 任职,是 Transformer-XL 与 XLNet 等爆款论文的第一作者。被多家头部 VC 寄予厚望,他本人对于大模型技术发展、行业未来将如何演变等话题也有着独特的见解。

时间轴:

00:04:20 月之暗面名字的由来

00:09:06 当初为什么投身做大模型?

00:17:43 OpenAI是通向AGI的好的组织样板吗?

00:23:46 组织形式不同,带来的涌现也不同

00:28:46 大模型的技术路线可能确定,但实现方式仍是未知的

00:33:35 为什么选择长文本作为突破?

00:39:20 如何看待大模型的开源和闭源?

00:03:52 为什么大模型创业这么坚定 toC 的路线?

00:45:53 如何定义AGI时代的super-app?

00:49:40 AI Native的super-app 开发范式会如何变化?

01:03:05 AGI时代需要怎样的产品经理?

01:13:05 开源能力也不错,为什么月之暗面要端到端的做应用?

01:16:23 AGI时代的「场景摩尔定律」

相关阅读:

月之暗面杨植麟:大模型需要新的组织范式,场景摩尔定律能催生 Super App

关于我们

这里是极客公园旗下的科技创业者社区FounderPark出品的AGI 系列播客节目「AI局内人」,围绕 AGI 相关领域的技术发展、产品方向以及新的商业模式进行探讨和交流。

Founder Park 正在搭建AI Native 的产品交流群,群内聚集着致力于在大模型相关领域创业的创业者、产品经理、研发工程师、对大模型技术和场景应用开发进展感兴趣的学者及投资人。

扫码添加社群助手,拉你进群:

展开Show Notes
张宝_2024
张宝_2024
2024.2.10
杨总思路清晰,每个问题回答得恰到好处,给主持人和听众的体验都很好。
作为一个面向大众市场的C端免费产品,kimi运营人员在社群认真回答每个群内用户的问题。还没有看到其他类似的产品有这样的做法。
JASting
JASting
2024.3.12
54:19 新的开发范式是前端变成语言UI,后端变成大语言模型。这两端已经确定,所以今天的创业机会主要在于前端和后端之间,即数据。新的范式是“用数据来定义产品”。对应产品经理职责变成定义两个数据集开发产品,一个训练数据一个测试数据。训练数据决定模型能力,测试数据决定研发团队考核。
RAMEET
RAMEET
2024.1.15
听了几遍
桑尼尼尼
桑尼尼尼
2024.3.31
嘉宾的录音质量不是很好诶……要是可以升级下录音设备就更好啦
JASting
JASting
2024.3.06
09:45 一直投入训练基于transformer的语言模型的原因,是相信:所有问题都可以通过把语言模型(next token prediction)做的更好就可以解决了。 训练的方式就是:不断投入,不断scale,不断找更高效方式scale,就可以找到更好的解决问题的方法。无论是记忆推理or多链路的复杂问题。
SinSin
SinSin
2024.2.26
1、AGI的涌现依赖强大的技术能力与组织,组织往往是被人忽视的;
2、移动互联网时代,产品是被人设计出来的;而AGI则是,当它被做出来的时候,它就被设计好了。“人”的神性与系统性相比,系统性会逐渐碾压“神性”
3、Open AI时代人应当是个可变的容器,快速迭代自己是最重要的
4、必然会有新的Super App产生
瓦尓特
瓦尓特
2024.3.20
45:49 通往AGI需要大量高质量数据,那就需要大量用户
JASting
JASting
2024.3.12
50:55 产品开发方式会随着底层技术变化而变化。移动互联网是确定性的需求(按什么按钮弹什么弹窗),对应是旧的计算机技术:hardcoding/确定性的编码(与或非逻辑运算),衍生出确定性的交互(graphic UI)。新的开发方式变化:一是前端变成语言的UI,二是后端变成语言模型。上一代是对世界上所有信息做编码,这一代是对世界上所有信息做建模/无损压缩。
JASting
JASting
2024.3.12
50:59 mark:开发范式定义
水工鸟Liz
水工鸟Liz
2024.3.12
53:10 “上个时代是对所有信息进行编码,这个时代是对所有信息进行无损建模。”
鲜世丹
鲜世丹
2024.3.01
17:35 未来只有一个 AGI 组织,还是有很多 AGI 组织?未来是只有一种 AGI 还是很多种 AGI ?
Jax_
Jax_
2024.1.29
我觉得这是个很好的问题
iam2fei
iam2fei
2024.1.12
kimi chat 是真不错
Fazzie
Fazzie
2024.1.12
kimi!
18:35 为什么agi下的需求是无法规划的?即使没有数据,应该有定性的方法辅助规划吧
轿子特稳
轿子特稳
2024.10.05
场景摩尔定律会不会存在呢?会不会和industry vertical类似呢
值得反复听!
04:22 阿里不是四个字儿吗😂😂
JoLeung
JoLeung
2024.4.02
38:30 为什么选择长文本能力作为自己的speciality? 1. 长记忆才能产生情感依赖; 2. 类比操作系统,长文本能力是内存,rag是外存
JASting
JASting
2024.3.12
36:01 transformer是新的计算机,1个维度是参数量,决定了计算复杂度;1个维度是上下文长度,决定了内存。