Vol.51 那些关于DeepSeek的谣言与误解屠龙之术

Vol.51 那些关于DeepSeek的谣言与误解

120分钟 ·
播放数18933
·
评论数74

春节期间整个科技行业最大的新闻应该是DeepSeek了,

假期中就有很多朋友问我是否要做一期关于DeepSeek的节目,

正好开工第一天,我的好友,也是多次串台的律人行主播Lily找到我说一起聊下这个话题。

本期节目除了我们两人之外还有两位非常适合聊这个话题的嘉宾一起参与:

  • 张涛:Monica的产品合伙人

42章经:《一个顶级 AI 产品经理的自我修养 | 对谈光年之外产品负责人 Hidecloud》)。

  • 张鹏:公众号东不压桥研究院的主理人

关注全球尤其是中美地缘政治,尤其是在科技领域的竞争政策,有非常深入且广泛的研究(《特朗普2.0时代的中美科技竞争》)。

最近一段时间关于DeepSeek的解读/评论已经非常多了,

我们4个人的对谈并没有涉及太过深的技术探讨,

更多集中在科技产业、中美对抗等角度,

以及过程中几乎把这些天种种关于DeepSeek的谣言都进行了澄清和说明。

律人行此期节目已经上线:

EP61 一期节目粉碎所有关于DeepSeek的谣言:训练成本600万、冲击英伟达、五万张H100、模型蒸馏、黑客攻击

【时间线】

复盘爆火的过程

00:04:08 Lily眼中春节DeepSeek的爆火

00:10:06 “国运”这个形容词的第一次出现

00:10:37 老黄的内部信+梁文峰的知乎回答都是AI写的

00:11:30 什么是“假的”,如果已经形成共识,那还是假的吗?

00:12:39 美国AI沙皇五步绝杀—也是AI写的!(正版看这里《特朗普的“AI沙皇”David Sacks谈DeepSeek》

00:13:24 《中美人工智能能力脱钩法案》,会导致每个下载 DeepSeek的美国人被罚一亿美元?—还是假的(正经分析看这里《“美中人工智能脱钩”法案,能通过吗?》

00:14:00 顶级AI产品经理视角下的DeepSeek全球爆火过程

00:16:03 DeepSeek在美国:从核心AI圈讨论到彻底破圈,还得感谢Mark Andreessen(硅谷顶级风投机构a16z的联合创始人)

DeepSeek R1到底强在哪里?

00:19:23 DeepSeek V3创新已经很强,但不过就是另一个GPT4o

00:20:18 DeepSeek R1第一次验证了ORM强化学习路径(你问OpenAI O1?—没公开就等于没有哈)

00:20:29 了解DeepSeek R1更多技术细节( 张小珺商业访谈录:《逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告》

00:21:27 DeepSeek破圈根本原因:全球第一个免费的既有推理模型能力,又可以实时搜索知识,并不断结合、反思的产品,带来全新用户体验

00:27:03 美国主流媒体及学界对中国AI发展长期冷落,英语世界信息极度落后,假消息满天飞

00:28:00 英文世界第一大假消息:DeepSeek 秘密武器罗福莉

00:28:32 英文世界第二大假消息:DeepSeek只是幻方量化的副业项目

DeepSeek R1训练成本只要600万美元?

00:29:12 英文世界第三大假消息:DeepSeek R1训练成本只要600万美元,打垮英伟达算力叙事

00:30:06 回本溯源详解“DeepSeek R1训练成本600万美元”

00:32:28 “DeepSeek 成本600万美元”在美舆论逐渐离谱全过程

00:32:43 实际成本对比:600万美元干了几千万美元的活

00:35:07 美国主流AI叙事:科技巨头百亿美金级投入 vs 主要参与者数十亿美金级投入 vs 挑战者数亿美元级投入

00:37:00 在美国科技巨头数千亿美金的AI基础设施投入面前,DeepSeek的600万美金变成神话

00:38:24 现实的成本对比叠加中美各方民族情绪后,事实变得不重要了

00:42:00 DeepSeek爆火给国内做AI基础设置、云服务、套壳产品的厂商带来的机会

DeepSeek R1的出现对英伟达到底是利好还是不利?

00:43:50 DeepSeek R1的出现对英伟达到底是利好还是不利?谁也说服不了谁

00:46:40 美国西岸的都在买英伟达,而东岸的都在卖英伟达

00:47:26 AI产品经理视角下,未来三年AI推理算力需求可能扩大100倍

00:48:02 算力需求是上涨了,但英伟达都能吃掉吗?

DeepSeek有五万块H100芯片?

00:49:35 DeepSeek有五万块H100芯片?白宫都惊动了,但还是假消息

00:51:34 Deepseek R1的出现,说明美国出口管制自食恶果,还是出口管制不足,应继续加强?

00:53:45 DeepSeek到底有多少张卡?

00:56:13 但凡读过DeepSeek V2和V3两篇论文的人,都不可能相信DeepSeek有5万张H100

美国对DeepSeek模型蒸馏、“偷窃”指控

00:57:22 OpenAI/美国质疑Deepseek蒸馏其先进模型,“偷窃”美国先进技术,到底成不成立?

00:57:49 什么是模型蒸馏

01:00:00 模型蒸馏是行业内公开的“秘密”

01:00:38 蒸馏在整个模型训练过程中只是一个小的技术点

01:01:08 DeepSeek蒸馏ChatGPT的谣言是如何产生的?

01:02:20 为什么DeepSeek APP会回复说自己是ChatGPT?

01:05:06 OpenAI现有产品设计上,已经封锁了真正意义“模型蒸馏”的可能性

01:07:11 从法律角度看美国对DeepSeek偷窃美国模型技术的指控

01:09:47 模型蒸馏是否违法,边界模糊,尚无定论

01:11:08 美国政府对“模型蒸馏”反应激烈

01:12:29 技术上,限制“模型蒸馏”实操性不大

01:12:54 OpenAI自己面临非法爬取全网数据、广泛侵犯知识产权的问题,指责DeepSeek蒸馏违法,未免太过双标

01:15:16 美国对“模型蒸馏”如此敏感,是因为他们认为中国是在“搭便车”

01:16:41 AI合规问题本质上是新技术发展与既有规则体系之间的矛盾,大家都还在探索期

01:17:38 全球各国挑战DeepSeek数据合规,是否过于严苛且双标?

01:18:49 当今地缘政治环境下,任何一个科技头部应用的出海落地都不是一件简单的事情

美国对华科技竞争政策全解

01:19:54 美国对华科技竞争政策全解

01:20:50 拜登政府时期:芯片出口管制、中美数据脱钩、对华科技投资禁令

01:22:45 川普时期:中美贸易问题和科技竞争问题一盘棋

01:23:20 川普政府可能进一步限制美国AI人才向中国流动

01:24:02 美国国内产业扶持 + 国外限制中国AI发展:确保AGI首次发生在美国

01:24:56 DeepSeek R1的火爆,引发美国对华AI竞争恐慌,恐带来过度回应和反制措施

01:27:37 欧盟看中国科技企业出海:就事论事,变相收“监管税”

01:28:48 美国看中国科技企业出海:国家安全威胁,监管规则不断完善,有意识地推动双方脱钩

01:30:51 创业者视角:放弃幻想,兵来将挡,水来土掩

狂欢之后:DeepSeek爆火的长期影响

01:33:22 DeepSeek R1之后,再看国内大模型公司的护城河:原来移动互联网时代的DAU叙事结构不再适用

01:35:50 DeepSeek R1给未来AI应用的发展带来无限想象力

01:37:34 DeepSeek R1之后,再看国内AI六小龙:技术路线还跟不跟?是不是要开源?商业化怎么办?

01:40:32 DeepSeek免费开源,那他们如何盈利?

01:43:55 “异类”DeepSeek,可能是世界范围内最适合去实现AGI的

01:47:38 对推理模型,从业者们也都还在探索期,对接下来半年保持期待

01:49:41 2025年,可能是AI Agent实际落地年

01:51:34 模型技术极速发展、迭代迅速,实体企业应该何时实际落地投入?

01:53:16 模型必定商品化,实体企业不必在训模型层面投入

01:53:55 行业迅速变化,如果今天还不深度参与,可能就没机会了

01:55:10 DeepSeek被海外黑客攻击导致频繁停止服务,国内各安全厂商团结一致抵御---完完全全假消息!!!

01:56:35 教你如何在电脑、手机上本地部署使用DeepSeek---伪概念 !!!实际效果跟满血版DeepSeek R1相差十万八千里

音乐:AI音乐工具天谱乐生成

【播客简介】

屠龙之术是一档关注科技、互联网、风险投资的播客,

主播庄明浩是一个游走在互联网和风险投资行业的边缘人士。

其工作多年所积累的认知似乎都成为了某种意义上的”屠龙之术“……

或许某天再有新的“龙”出现的时候,就是这档播客停更之时。

展开Show Notes
杨热忱
杨热忱
2025.2.08
1:55:38 真么战狼的言论真的很离谱,周鸿祎还特意去蹭了国外黑客攻击这个流量,整的跟真的似的。发抖音说什么攻击deepseek特意绕过了360专线,还说无偿给deepseek提供安全防护援助,真会蹭,无语😓
庄明浩
:
老周嘛 他可太“懂了”
HD481019i:对对对很无语这波真的蹭了一次好的,所有人都以为是360在负责deepseek的流量攻击,让同在杭州的安恒颜面何存🤣
4条回复
OneTiger
OneTiger
2025.2.12
1:14:17 很感谢嘉宾在这个时候区分了两个问题,在主持人情绪化的表达后,没有浑水过去,为所有人理清了逻辑,听前面 youtube 例子时我就感觉好像不是一回事,谢谢嘉宾解答了我的疑惑
Joes东
Joes东
2025.2.08
27:34 英语世界信息极度落后😂
HD1015738z
HD1015738z
2025.2.08
1:15:08 讲到模型蒸馏这个点,这不是典型的智猪博弈(Boxed Pigs Game)😂 跟随者搭便车是最优策略。
子洋Eric:后发优势,摸着OpenAI 过河
这一期详细还原了几位嘉宾眼中这整个事件的传播过程,很有帮助!我也是在r1发布第2天注意到的,但是没想到它会这么火😂,这样一梳理就清楚多了
NiCO酱和她的小布:, ·'蔗梳理 也卟 代表 舅柿真相•`每个 仁 兜有 自己嘚 局限•`˚ 。
生而为猫奴:当然了,所以我说他们眼中。传播过程本来就是多面的。 请问为啥说火星文😂好另类
3条回复
mo__
mo__
2025.2.08
1:56:30 庄老师竟然还干过安全 hhh
庄明浩
:
脚本小子 脚本小子
最后好像说的不对,lmstidio上的模型是r1蒸馏千问的, ollama上的模型名字只有r1, 好像是r1蒸馏自己的
hidecloud:哎,我真不是没有耐心,但从这个回答里说明你完全没有理解这期播客里我和明浩老师聊的这个话题,有没有去读一下最基本的原文信息。在这样的背景下,我是没办法给你说懂的。你可以去看一下我后面一次分享的文字稿,讲得很清楚了。 https://mp.weixin.qq.com/s/cUGA4ujsumNQfVRDGRmxWA
hidecloud:你想多了,不存在r1蒸馏自己的版本。都是 qwen 和 llama 基座。
6条回复
1:07:38 对这个问题Andrea karpathy有一个很好的回答 现在碰到谁问我这种问题我都直接贴他发的那条x了😂
方进
方进
2025.2.12
25年春节的时候,我分析了deepseek的16篇论文,也写了一篇《DeepSeek技术发展主线》:https://mp.weixin.qq.com/s/ttmOgA5tFHfPtXMXp9x-ug
跟老师这边讲的差不多,老师这边讲的更详细一些。

希望这样的这个节目越来越多,很喜欢听
austinzzz
austinzzz
2025.2.10
暴露出中国媒体还没有形成独立人格,自己的科技需要外媒肯定后才恍然大悟。相反 政府要好很多,1月20号李强总理已经见过梁总了。
德吉
德吉
2025.2.08
1:15:54 不公平?那创作者可以好好说道说道了
马也张
马也张
2025.2.08
29:18 不是缺失,我觉得是长期扭曲,前两天塔克卡尔森还在节目里问waleed王子你觉得Deepseek是真是假
马也张
马也张
2025.2.08
1:55:38 有攻击但是无偿防护这事是假的?
庄明浩
:
是啊 红客联盟微博都辟谣了
马也张:不是,我意思是攻击这事不是假的,而无偿防护这事是假的吗?因为你说的还是有点模糊
5条回复
最近资讯太多 却是需要这样的整理汇总,以正视听
特别好啊这一期,圈外人也能听懂,嘉宾们讲得非常好,主持人节奏也非常好,提的问题都很有意义
方进
方进
2025.2.12
最后几句话,澄清了两点:
1、Deepseek安全攻防就是一个YY
2、现在说的蒸馏已经不是AI传统说的知识蒸馏了,不过现在大家也都认可了,也就没啥好说的
公子衡
公子衡
2025.2.11
竟然抓到了宝藏公号东不压桥研究院的作者诶!每篇都写的又快又准!这期集齐了宝藏嘉宾
sherry0122
sherry0122
2025.2.11
57:37 ds卡真不少。。。。。😓
ChaosMars
ChaosMars
2025.2.08
39:28 业内人士努力挽尊。deepseek最大的冲击是技术扩散。
在哪里看AI产品榜单呀
庄明浩
:
公众号 ai产品榜
冬阳Sunshine:谢谢庄老鼠
3条回复