99: MiniMax 创始人闫俊杰:做大模型,千万别套用移动互联网的逻辑晚点聊 LateTalk

99: MiniMax 创始人闫俊杰:做大模型,千万别套用移动互联网的逻辑

98分钟 ·
播放数14400
·
评论数92

更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。

头图是 Dota 2019 国际邀请赛决赛(TI9)中,OG 战队的 Ana 使用 IO(小精灵,图中球形发光体)的经典作战,OG 在 TI9 中夺冠。为什么用这个图,播客里有答案~

经过 “一切在加速” 的 2024 年,围绕中国大模型创业的讨论,从 “谁又融资了?” 变成 “谁会第一个倒下?”

行业分化时刻,我们访谈了中国大模型六小龙之一,估值已超 30 亿美元的 MiniMax 创始人兼 CEO 闫俊杰,聊了 MiniMax 的新技术目标,他们刚刚发布的首个开源模型系列 MiniMax-01 ,去年一年公司的变化和人员调整,以及闫俊杰作为一个“练习时长 3 年”的“新人 CEO”的自我复盘。

10 个月前,我们就访谈过一次闫俊杰。那次他提了很多字节;这次再聊,明显感到他主动提字节少了,提 Anthropic 多了。这与行业风向形成微妙的反差。

在他更在意字节的 2024 年 3 月,大模型创业最是烈火烹油。而现在,越来越多人开始讨论大厂对创业的压力,MiniMax 本来是看起来相对 “安全”:它的 AI 社区产品 Talkie 的最新月活用户数已超过 Character.ai,成为同类产品全球第一;其在中国的 AI 社区产品 “星野”,用户数、使用时长和留存率也都是第一,高于字节旗下的同类产品。

闫俊杰却自己推翻了这些优势,在他现在的认知里,用户数等指标并非 AI 竞争的核心,他说:
- 千万别套用移动互联网的逻辑来做 AI。

移动互联网的逻辑是:用户越多,反馈越多,推荐算法越聪明。而闫俊杰认为,AI 大模型和产品的真实关系是:
- “更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”

在这个认知更加明确后,闫俊杰说他做出了取舍,现在 MiniMax 最重要的目标不是增长,也不是收入,是 “加速技术迭代”。

不到一年的两次访谈,我们从聊移动互联网到聊跳出移动互联网的逻辑,从讲 2024 年的目标到闫俊杰复盘当时定目标的逻辑就不太对——AI 行业和其中的人都在快速变化与迭代。

时间线跳转:
·聊 MiniMax-01 新模型系列:为什么开源?
02:12 为什么开源——加速技术迭代 & 加强技术品牌
08:22 行业误区:认为更好的智能水平要依赖更多的用户;其实不然
13:01 想清楚这个逻辑后:模型要追求不断提高上限,而产品就是产品
15:11 明确 MiniMax 是一家技术驱动的公司

·聊对技术的态度:“一年前最喜欢说信仰的人,信仰都兑现了吗?”
18:01 “随热点而动?”这是对我们的误解
20:13 现在没人能定义什么是 AGI,只能定义智能水平会不断进步
22:00 作为创业者,不是说 Scaling Law 撞墙了我就放弃了,而是努力找方法延续它
23:59 一年前最喜欢说信仰的人,信仰都兑现了吗?

·聊 Agent:long-context 很重要,探索 coding 之外的 Agent 场景
25:31 Agent 能处理复杂任务,复杂任务指在专业领域达到专业人士水平
27:51 Agent 需要模型架构和能力的提升;MiniMax-01 做到了第一点
29:08 01 改传统 Transformer 里的非线性注意机制为线性注意力机制,提升了处理 long-context 的能力,这对单 Agent 交互质量,和多 Agent 通讯都很重要
35:07 为什么没发 o1 方向模型?
39:40 多模态能力在 OpenAI L1-L5 的 AGI 路线图里很重要
41:04 AI 编程助手 Cursor 的成功并不基于 o 方向的模型
41:51 蒸馏 o1 数据复现 o1,没那么难
44:09 编程之外另一 Agent 落地场景:信息的获取
51:09 中美模型的一个区别,前者缺少内部 benchmark
55:19 MiniMax 的技术团队特点:模型、Infra 和工程的综合能力强;客观、扁平、灵活

·聊模应一体:市场不是有 A,就不能有 B
01:01:38 模型、应用一起做,还有必要吗?
01:03:59 即使更晚创业,也不会做只做应用的公司,因为想做基于未来技术的产品
01:04:44 海螺文本的失利——没有坚持技术驱动
01:06:48 Talkie、星野的暂时领先——因为更懂用户
01:07:34 做技术的人大部分觉得自己很牛,但我不是这么认知世界的

·聊竞争:不要区分大厂和创业公司
01:07:56 不用把创业公司单独当一类公司
01:09:22 DeepSeek 也很纯粹;智谱第一个有 AI 路线图
01:09:59 MiniMax 的路线图?——逃出生天,下一步最重要
01:11:19 一年来大模型竞争最大的变化:更多人意识到这和移动互联网是两件事
01:12:29 没和字节谈过被收购,从来没想过把公司卖一个什么价钱
01:15:02 24 年没完成年初目标,定目标的逻辑就不太对
01:16:28 大厂投入和竞争激烈程度都在预料之内
01:18:46 AI 产品该看什么指标?
01:20:25 大公司之外,更大的“危险”还是来自自己的认知

·聊团队和自己:放下 ego,深度思考
01:22:49 不要假定团队没有流失,流失才是正常的
01:23:24 MiniMax 需要的两种人
01:25:48 确定研发优先级需要做取舍,不见得每个取舍都对,纠错很重要
01:26:56 CEO 决策什么不决策什么不重要,重要的是组织有共同决策标准
01:29:48 让所有人都觉得公司被管得很好,这不是一个目标
01:30:28 打造 AI 组织的难点:持续吸引更好的人
01:31:17 半年多前焦虑,现在不了,因为已做出取舍,以技术迭代为最大目标
01:32:08 去年反思最多的问题——认知能力为何不能提升得更快?
01:32:16 放下自我,思考得更深入
01:34:29 为什么一直被叫 IO?
01:36:38 25 年对自己的期待:不断提高技术水平

相关链接:
《晚点对话 MiniMax 闫俊杰:创业没有天选之子》2025 年 1 月
《对话 MiniMax 闫俊杰:AGI 不是大杀器,是普通人每天用的产品》2024 年 3 月
MiniMax-01 开源系列模型技术博客

登场人物:
嘉宾:闫俊杰,MiniMax 创始人兼 CEO
主播:程曼祺,《晚点 LatePost》科技组负责人。小红书 @曼祺_火柴Q 即刻 @曼祺_火柴Q

剪辑:甜食

☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章

展开Show Notes
置顶
上周 MiniMax 创始人闫俊杰访谈的播客版。(访谈文字链接可见 shownotes)

10 个月前和闫俊杰聊,他提了很多字节;这次再聊,明显感到他主动提字节少了,提 Anthropic 多了。

在他更在意字节的 2024 年 3 月,大模型创业最烈火烹油;而当真的有更多人开始讨论大厂对创业的压力,闫俊杰的认知又更新为:千万别套用移动互联网的逻辑来做 AI——因为技术特性导致 AI 不是用户越多,模型能力提升越快。

不到一年的两次访谈,我们从聊移动互联网到聊跳出来,从讲 2024 年目标,到闫俊杰复盘当时定目标的逻辑就不对——AI 行业和其中的人都变化、迭代很快。

再过几个月,AI 又会怎么样?期待住了🤗
鱼丸君
鱼丸君
2025.1.22
访谈的侵略性太强了,反复让闫俊杰在A和B中做选择,而没有展开讲他自己的核心要表达的点。比如minimax技术品牌怎么构建?海螺核心技术差异下一个路标是什么?推理成本怎么降低?不套用移动互联网逻辑,AI驱动的公司盈利到底靠什么?
曼祺_MatchQ
:
https://www.xiaoyuzhoufm.com/episode/672de24af373fe5d4db8c761 谢谢反馈!这期节目第 35 分钟讨论过这个问题:机构媒体的采访方式 VS 主流播客的访谈方式的不同。 这期我们也发了文字访谈,访谈类报道会设计一些挑战性问题,也需要不时跳出访谈对象的逻辑,从别的角度来碰撞。我们继续寻找更好的平衡。您提的这几个点都是很值得让他展开表达的。
姥姥王
姥姥王
2025.1.20
多听合订本,心态更平稳
生而为猫奴:哈哈哈哈+1
庄明浩
庄明浩
2025.1.20
看文字和听声音的感觉还是很不一样的,因为一些原因我是今天早上才完整的读完文字稿,然后马上收听的音频版本;文字的内容会让我这样的所谓古典移动互联网人有一种莫名的想怼回去的冲动,而听到语音的播客,就感觉闫老板也有他自己的逻辑和坚持……
曼祺_MatchQ
:
确实听和看有不一样的感觉。文字效率高,音视频有更多信息维度。😄
yoyoVCer:因为文字的阅读速度快吧,声音的话主要是听嘉宾说 较少植入自己的看法
Ferrothorn
Ferrothorn
2025.1.22
稍微提个意见,感觉这期不太像访谈而像审问……这个感觉在小马智行那期或者以往也没有。毕竟被采访者是公司ceo不是政客,不是说用咄咄逼人的方式去考验对方的能力或者让对方吐露真话。
曼祺_MatchQ
:
为什么会和你说的小马那期感觉不一样,我自己也想了一下。一个原因是,因为小马楼天城那期主要是以一个播客来聊的,主题收束在技术;而这一期的内容,也要更加兼顾文字版本(shownotes里的文字访谈)。文字访谈会更追求跳出对方逻辑给一些不同视角,以及文字访谈中,特别长的文字回答会有些影响阅读节奏和信息密度。我觉得之后是可以更想好该怎么平衡,或者是做好体裁主次的取舍。
采访主持人采访风格和问题过于直白,不太像是在探讨问题,而是在追问和审问,这种风格确实能快速知道采访者自己想知道的、确定的东西,但是很难让被采访者能以一种平等心态,将更深度思考的东西表达出来。
乐Yue言:被采访的人能接受就好了
木易木可
木易木可
2025.1.21
不同意见;买流量和提升模型能力做技术并不冲突
SAuP:实则是资源最优分配的问题
审讯式访谈问答,生硬。出现了好几个问题嘉宾已经回答了,主持依然反复来回问,来确认答案。
王浩_BMaq
王浩_BMaq
2025.1.27
1:17:42 是不是可以这样反过来看:正是因为openai技术比c好一点或者1倍,导致openai的用户规模,比c多了好几倍。 因为技术的一点点提升,用户规模出现碾压超越。
曼祺_MatchQ
:
你说的这个让我联想到另一个事,就是1月20日晚上,DeepSeek-R1 和 Kimi-K1.5 几乎是同时发布的,他们的技术细节和功能(k1.5 还包含多模态)不一样,但大体都是推理模型。最初发布那一两天,我和一些技术人员聊,没觉得两个模型的评价很悬殊,看了一些实际测试,也各有千秋。但一周过去,影响力和带来的连锁反应(DeepSeek app 登顶中美、英伟达大跌…)上,两个模型完全不可同日而语。这可能是量变引起质变:模型好,技术方法新,成本低+开源姿态加持,DeepSeek 直接爆了,哪怕它的效果不能说“吊打”其它模型。这一周,DeepSeek 应该有数倍于kimi 的用户增量。
Selina_2Atw:open ai还有一个先发优势
3条回复
跟周董的风格有点像,有些字听不清
曼祺_MatchQ
:
这联想😅 确实我们这次不是专门话筒录的,然后大家普通话都有点不标准
床前明月光我是遇致罡:曼姐很清晰的,我说的是嘉宾的风格😏
神采奕奕
神采奕奕
2025.1.29
一直喜欢长过一小时以上的节目,原因是长节目的嘉宾能更放松的阐述。但最近稍有变化,觉得主持人的追问,会让信息量大很多,因为客人的确有时候会说废话。感谢本节目,信息量超级巨,上次听就觉得闫俊杰是个牛人,这次觉得是很牛的人。
我以为只有我一个人觉得本期访谈给人一种审问的方式,原来这不是我一个人的感觉。访谈是让嘉宾说出自己的想法,不是在多个问题中做选择,嘉宾好多次回答问题都会说不是,也能感受到嘉宾可能也不太爽,这不是答记者问。你可以说这是你的风格,但这确实不是一个令人舒服的访谈
HD571218w
HD571218w
2025.1.25
喜欢曼祺的访谈,再来再来
lcj_eAxq
lcj_eAxq
2025.1.22
喜欢主持人的提问,很精准🫡。不觉得像有些评论说的有侵略性或者很冲什么的。
一滴水_
一滴水_
2025.2.17
很有启发的一期。嘉宾的视野相当开阔,极具深度。才听了一半,不过已经讲明白了嘉宾的信念是什么,以及围绕这个信念minimax做了些什么。
非常赞同嘉宾对创业者应该做什么的思考,创业者不应该抱怨困难,就应该朝着一个方向,接近它,解决过程中的问题。
孤山春秋
孤山春秋
2025.1.25
01:29 在初期,更好的智能手机能获取更多的用户,而不是更多的用户导致更好的手机;但是中后期,基于更大用户基数和数据生态的手机品牌,将成为更好的手机,而竞对即使做出了硬件性能更好的手机,也无法获取更多用户了。
孙吾饭168
孙吾饭168
2025.1.23
主持人很强呀
夏至2023
夏至2023
2025.1.22
33:20 感觉有点道理,也不完全对,用户可能对产品迭代技术进步没有贡献,但是嘉宾之前也强调了用户心智也很重要,也是壁垒之一,投放带来的拉新用户数和产品创新带来的留存用户数也就强占了用户心智
Bryanc
Bryanc
2025.1.22
主播真冲!哈哈!
Mr_Curiosity
Mr_Curiosity
2025.1.31
闫俊杰强调了很多次想要通过开源扩大技术社区影响力,不过我看了下model card似乎只有01这一个456B的模型,人家deepseek蒸馏了各种大小的版本就是让开源社区大家人人都能用起来,现在01这个大小感觉不是很能普及开,让大家对模型效果有体感
曼祺_MatchQ
:
https://www.xiaoyuzhoufm.com/episode/67c63718e24b741ee8e2ee63?s=eyJ1IjoiNjBkODRlZTVlMGY1ZTcyM2JiNzdiOGYwIiwiZCI6MX0%3D 最新一期聊到了这个问题:为何没开源更小尺寸的?在节目比较后面(省流版是一方面想开源的版本效果好,另一方面做这件事也需要额外的人力投入
Mr_Curiosity:谢谢!主播好用心,马上去听😆