Vol.154 产业观察26|“DeepSeek开了第一枪,更值得期待的是AI普惠”:与季宇聊AI产业新机遇高能量

Vol.154 产业观察26|“DeepSeek开了第一枪,更值得期待的是AI普惠”:与季宇聊AI产业新机遇

64分钟 ·
播放数21651
·
评论数21

【本期课题】

DeepSeek对AI产业的影响。

【栏目介绍】

在《产业观察》这档专栏里,我们会为你厘清不同产业的历史沿革,希望能够从中找到一些底层的规律。虽然当下变化迭起,但是所有新风口都有迹可循,不同产业的发展其实也有很多相似之处。

【免责声明】

本节目的所有内容并非旨在提供任何形式的建议,包括但不限于投资、税收、会计或者法律上的建议。

【本期主持人】

李罡,峰瑞资本副总裁。

【本期嘉宾】

季宇,行云集成电路创始人。

【内容索引】

03:32 春节期间,国产 AI 模型 DeepSeek引起了全球关注。它不仅引发英伟达股价震荡,甚至多国政府相继提出限制或禁用它。DeepSeek为何能掀起如此大的波澜?

04:12 在AI编程这个对逻辑性有极高要求的应用场景下,DeepSeek展现出卓越的模型效果,私有化部署后,它的运行效率远超云端API。从消费者角度来看,本地部署解决了以往大模型难以输出长上下文的痛点。

11:46 与国内外其他模型相比,DeepSeek有哪些关键的区别?

15:05 DeepSeek采用参数规模较大的MoE(Mixture of Experts)架构,在保证模型质量的同时,实现了显著的成本下降。DeepSeek的技术路线是如何实现的?

19:46 自Transformer和Attention架构诞生以来,上一次引发全球性大规模影响的是GPT 3.5,它来自美国公司OpenAI。而这一次,凭借创新出圈的却是一家中国公司。这背后或许跟国内企业受芯片禁令影响有关。

22:52 在算力资源不受限的情况下,OpenAI的发展受阻了吗?

24:39 如果模型的规模、能力和计算速度的增长没有那么快,那么,增加上下文长度会是下一个突破口吗?

27:50 未来几年可能会出现更多新的范式,它们跟原有范式可能是承接关系。例如,DeepSeek的R1模型是在V3这个足够好的基座模型的基础上,通过后训练(包括强化学习等技术)迭代而来的。

28:31 现在容易获取的数据基本都被AI训练过了,未来是否会变成AI自己生成数据来训练自己?

33:42 过去,大模型的发展逻辑是“算力+数据=模型能力”。DeepSeek证明,在有限算力下依然可以取得显著的效果。从模型的发展来看,未来还会有哪些瓶颈?

36:07 在DeepSeek开源的生态下,个人用户和企业用户都能相对容易地以较低的成本自行部署或复制出模型,那么AI模型公司的护城河在哪里?

37:59 DeepSeek的出现,是偶然的破局,还是产业发展的必然方向?

40:08 DeepSeek能否真正绕开英伟达的CUDA生态?

41:42 当前,Scaling Law推动千卡、万卡集群的形成,本质上是在构建一个大型规模的计算体系。如果未来围绕DeepSeek、国产芯片以及AI普惠目标,我们能够打造出类似过去的x86集群和个人电脑的生态系统,或许可以逐渐让这个“大型计算体系”失去其核心价值。

43:52 过去,一些国产芯片企业难以找到很好的下游商业场景。DeepSeek的开源模型相对标准化,不同芯片只要能够高效运行它,都可以通过API接入服务。这为国产芯片企业提供了新的可能。

46:22 作为创业者,如何看待梁文峰所说的“技术优势是短暂的,真正的护城河是文化和组织”?

49:02 创新需要一套强大的方法论,其中可能要摒弃经验主义。当然,反经验主义并非简单地抛弃过去,而是要重新构建一套能让整个组织高效运作的方法。

51:26 过去30年,中国科技产业经历了从“中国制造”到“中国创新”的跃迁。DeepSeek的崛起是否意味着中国企业在全球科技竞赛中迎来了关键转折点?

54:50 随着AI的推理成本大幅下降,和计算速度进一步提升,可能会出现哪些有趣的应用或发展?

【本期相关】

DeepSeek R1的技术报告

从DeepSeek展望AI产业的未来发展

Vol.116 产业观察18|如何成为下一个英伟达:与Mackler季宇聊AI芯片的突围之路

李丰对话季宇:理解英伟达,解构英伟达,挑战英伟达

【制作团队】

主理人:李翔 、李丰

制作及统筹:张英海  (13514156656)、峰小瑞(pr@freesvc.com)

如果你喜欢我们的节目,欢迎你分享到更多的地方,也欢迎你在我们的评论区留言交流。

展开Show Notes
绮她
绮她
2025.2.13
“技术的优势是短暂的,真正的护城河是文化和组织。”
kamu
kamu
2025.2.14
1、可以说中国顶尖大学的优秀毕业生基本被大厂垄断了至少70-80%,结果呢?去研究如何吸引用户点击推送的短视频,所以组织和文化确实很重要。

2、语言模型是多模态模型的基础。人类从多模态的现实世界进化出语言和文字之后才逐步进入高速发展阶段,所以多模态世界还是要依赖二维的语言(符号)这个智力工具;

3、现在大模型的能力无论是达到了本科生、研究生还是博士生水平,拿人类社会做类比,再好的学生再高的智商要想充分发挥自己的能力还是要进入社会,需要与组织和文化之间的互动,人类智能的核心不是个体智能而是群体智能。
Whahahhaha
Whahahhaha
2025.2.15
我的看法:1.deepseek把中国普罗大众拉起到了GPT3.5的段位(甚至于可能是更高的GPT版本),毕竟之前是被ban的,大部分的民众只是听说,没用过。所以就这一点而言,一下子把AI一个行业的事情,变成了整个社会的事情;2.deepseek在老外看来,一个是开源,还有一个是未来会有美国的公司将自己的foundation建立在中国公司的基座上的担忧,deepseek确实可以降低成本以及用更低级别的算力,但这个不是他们最关心的;3.deepseek也无形中拉齐了其他国家追赶的速度,还有一方面就是也会招致美国更深层次的制裁,但这个只能说未来5-10年都会是这样的一个追赶的速度;4.我的看法是接下来pk的是应用场景,谁可以在应用场景端有更多的探索,谁就可以在这个stage走得更远。
-Sharpe
-Sharpe
2025.2.13
技术还没有做到领先,只是成本大幅度降低了,不过也很快会被其它公司学去,在同样方法的情况下硬件性能更佳的会领先更多~
Standalone
Standalone
2025.2.14
季宇声音好听
福山Fushan
福山Fushan
2025.2.16
大仙的分享太到位了
夏至2023
夏至2023
2025.2.25
48:37 okr
dayinfinite
dayinfinite
2025.2.20
37:33 认同商业结构才是护城河,生产力改变生产关系,生产关系反作用于生产力。 麦当劳的成功是商业结构的改变,效率的提高。
Mi0202
Mi0202
2025.2.18
靠资源的护城河最终会被技术打破,真正能形成护城河的是商业模式或一种生态
deep seek明显是从国内火回国内的
栗少
栗少
2025.2.16
等下期聊聊微信和百度介入呗
Steve_DHyN
Steve_DHyN
2025.2.16
还是没有啥自信的表现
哼哈嘿呀
哼哈嘿呀
2025.2.14
05:30 这里提到的 agent 产品是什么?
Jeremy周
Jeremy周
2025.2.13
来了来了!
Judy233
Judy233
2025.2.13
热乎乎来了
Geek-达
Geek-达
2025.2.14
来了来了
风花
风花
2025.2.14
听到自我博弈,想到GAN,也许推理模型利用类似GAN的方法,一个生成模型,一个打分模型,是一个方向?
佳妮宝贝
佳妮宝贝
2025.2.14
52:03 主持人问的是不是标志性事件,如果是故意跑题不正面回答那就是表示否定。梁文锋是特意不按常规打法找的没有经验的人,才有这样的创新。也期待硬件领域迟早会有这样的创新突破,评价别人真得很容易。
yxhuang
yxhuang
2025.2.13
来了
麦粒肿
麦粒肿
2025.2.13
来了来了