Vol.156 产业观察27|关于DeepSeek的7个核心问题和DeepSeek关键技术拆解高能量

Vol.156 产业观察27|关于DeepSeek的7个核心问题和DeepSeek关键技术拆解

59分钟 ·
播放数23105
·
评论数42

【栏目介绍】

在《产业观察》这档专栏里,我们会为你厘清不同产业的历史沿革,希望能够从中找到一些底层的规律。虽然当下变化迭起,但是所有新风口都有迹可循,不同产业的发展其实也有很多相似之处。

【免责声明】

本节目的所有内容并非旨在提供任何形式的建议,包括但不限于投资、税收、会计或者法律上的建议。

【本期嘉宾】

刘鹏琦,峰瑞资本执行董事。

颜黔杭,峰瑞资本副总裁。

【内容索引】

00:41 刘鹏琦分享:

01:27 DeepSeek为什么这么火?

03:05 DeepSeek真正的技术创新是什么?

11:04 为什么是DeepSeek?

13:21 Scaling Law(缩放定律)还成立吗?

17:56 Deepseek给其他模型厂商带来什么影响?

21:53 DeepSeek对硬件生态带来什么影响?

25:50 DeepSeek如何影响应用生态?

29:24 颜黔杭分享:

29:30 从技术角度聊聊DeepSeek的V2模型与V3模型。

35:00 DeepSeek的低价策略秘密之一是MLA(Multi-head Latent Attention,多头潜在注意力)。

37:59 DeepSeek的MoE(Mixture of Experts,专家混合模型)架构,通过多个专家模型的协同工作,提高整体性能,这有点类似于“人多力量大”。

41:47 关于DeepSeek Infra技术中的DualPipe(双管道)算法与FP8(8位浮点数表示法)的混合计算。

43:47 从DeepSeek的R1-Zero到R1的演进:强化学习(Reinforcement Learning,简称RL)驱动的后训练新方法。

47:41 DeepSeek为什么这么火?

50:24 如何看待马斯克的xAI发布的更新版Grok 3大模型?

53:30 DeepSeek给AI行业和技术投资带来了哪些影响?

【本期图示】

【相关文章】

文字版内容请在峰瑞资本公众号查看(一文讲透关于DeepSeek的7个核心问题 | 峰瑞报告)。

【制作团队】

主理人:李翔 、李丰

制作及统筹:张英海  (13514156656)、峰小瑞(pr@freesvc.com)

如果你喜欢我们的节目,欢迎你分享到更多的地方,也欢迎你在我们的评论区留言交流。

展开Show Notes
猫三思
猫三思
2025.2.21
29:09 本期有一种 员工被抓来汇报工作的…微紧张感
李丰FreeSvc
:
是内部所有科技相关同事都各自研究阐述ds,其他同事提问和评价,所以估计是“内卷”压力🤭🙃
RookieStar
RookieStar
2025.2.22
信息密度非常高,这一期对最近一个月关于DS的各类信息做了很好的蒸馏,且不失深入浅出的技术科普👍
浩Sean
浩Sean
2025.2.20
为什么DS原版的效果就是要比其他平台的DS好呢?不都是DS吗?还都是满血的,为什么呢?
尼西柯达:训练的细节并不是完全公开的,所以不尽相同吧
RookieStar:应该是DS官方chatbot有些system prompt第三方平台学不去
fanlu0830
fanlu0830
2025.2.23
转发点赞赞赏三连了,谢谢李丰老师还有团队的老师深入浅出的讲解!之前听过其他专业计算机或者算法研究的人解读是专业但是就没听懂......但是这次听懂了!尤其三维投射影子变成二维存储的类比,为了后面更多人来分享不要紧张特别来留个言哈哈,希望后面多一些这样的内容呀!
speakoutloud
speakoutloud
2025.2.22
等丰树聊民营企业座谈会
刘一笔
刘一笔
2025.2.21
59:19 赞赞赞,太干了
簡單快樂:被你推荐来听哈哈
刘一笔:😂有点费脑
LIN_Q
LIN_Q
2025.2.22
完全圈外人,虽然完全一点都听不懂,但觉得讲的很不错。
ohWAWO
ohWAWO
2025.2.20
讲的真好,深入浅出,很好理解
36:49 MLA有点类似LoRA的方式
48:34 用deepseek-r1做老师,教llma和qwen,再蒸馏出小模型
支持 希望多做这样的好内容
57:36 强化学习突破人类思维和行为范式(机器人agent自己参与社会获得并产生数据集)实现超越人类的agi
到码头整点薯条a:人类不能做的事儿
PT_Nkqc
PT_Nkqc
2025.2.28
丝毫不提蒸馏,我就问一个问题,假如没有OpenAI,能做得出来deepseek吗?
豌豆逗兜
豌豆逗兜
2025.3.04
35:33 注意力机制计算
豌豆逗兜
豌豆逗兜
2025.3.04
工程创新之落地实践
Yuhua_JMic
Yuhua_JMic
2025.3.01
喜欢,技术密度刚刚好
because_zZKH
because_zZKH
2025.2.24
想听丰叔分享更多行业的动态
41:57 deepseek是算法和infra团队协同很好的团队。
11:54 全世界ai技术创新变慢,像deepseek这样的工程能力亮眼的(软硬件结合的)效果会更加亮眼
05:31 moe,mla 时间和空间的优化