主播 | 刘飞 潇磊
本期是 人工智能风云录 的番外外传,我们聊一聊 DeepSeek。
作为被称为国产 AI 之光的 DeepSeek,到底是怎样出现的?它究竟是真的能正面对抗 OpenAI 的顶级神作,还是只是像拼多多一样的廉价平替?除了成本,还有哪些特性很值得关注?DeepSeek 知道我们要聊他,他会跟听友说些什么呢?
来杯半拿铁,咱们边喝边唠。
—
本期播客的镜像文章:DeepSeek 小传:制造了 AI 拐点的科技苦旅
—
半拿铁也开始讲西游记了:半拿铁·西游篇
📮听友投稿邮箱:bannatie@163.com
☕️杭州特调「芝麻·半拿铁」的品尝地:西湖区华星路 01coffee
👔半拿铁周边购买淘宝店:小羊商店Sheepedia
📖 半拿铁全新周边:《人工智能风云录》纸质书,可在各大电商平台购买。天猫店铺目前为 5 折
——
时间轴:
04:54 关于DeepSeek的小问答
10:54 今天关于DeepSeek的各种新闻
21:41 梁文峰的故事
30:49 2023年5月开始开发 AGI 的 DeepSeek
32:02 2024年5月展露头角的 DeepSeek V2
46:56 2024年12月跨时代的 DeepSeek v3
50:18 DeepSeek V3 成本和带来的影响
1:02:21 2025年1月影响更深远的 DeepSeek R1
1:07:50 DeepSeek R1-Zero 开创的新时代
1:23:06 DeepSeek 的开放性
1:36:24 DeepSeek 火爆之后的效应
1:39:02 DeepSeek 的本土团队
1:49:06 DeepSeek面临的困难与存在的问题
2:02:02 DeepSeek未来会带来什么样的变化?
2:28:17 读评论
——
封面:
坂本龙一东京个人展的一幕,投影出的坂本龙一在弹钢琴

2025 年 1 月 20 日,DeepSeek 创始人梁文锋出席了李强总理的座谈会

2019 年,梁文锋在金牛奖颁奖仪式上分享,他的目标是:提高中国二级市场的有效性

DeepSeek V2 的核心技术:MoE 和 MLA

DeepSeek V3 的核心技术:FP8 和 MTP


DeepSeek 官网上介绍自己在性能/价格比最优范围的一张图

英伟达官网上线对 DeepSeek 的支持,并强调:DeepSeek-R1 模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色

与 OpenAI 的 o1 模型在数学、代码等推理任务上的表现,DeepSeek 势均力敌

DeepSeek 在 R1 论文中所描述的 Aha Moment,也将是 AI 历史上的 Aha Moment

开源的发展速度从趋势看,超过了封闭模型的发展速度

拿过图灵奖的神经网络三巨头之一,杨立昆老师说:与其说是中国对美国的胜利,不如说是开放对封闭的胜利

萨提亚提出,这次可能会出现杰文斯悖论的现象

开城墙

DeepSeek 创始人梁文锋

主要参考资料:
- DeepSeek.com 的 100+ 次 R1 问答
- DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, DeepSeek-AI, Daya Guo, Dejian Yang, Haowei Zhang, Junxiao Song, Ruoyu Zhang, Runxin Xu, Qihao Zhu, Shirong Ma, Peiyi Wang, Xiao Bi, Xiaokang Zhang, Xingkai Yu, Yu Wu, Z.F. Wu, Zhibin Gou, Zhihong Shao, Zhuoshu Li, Ziyi Gao, Aixin Liu, Bing Xue, Bingxuan Wang, Bochao Wu, Bei Feng, Chengda Lu, Chenggang Zhao, Chengqi Deng, Chenyu Zhang, Chong Ruan, Damai Dai, Deli Chen, Dongjie Ji, Erhang Li, Fangyun Lin, Fucong Dai, Fuli Luo, Guangbo Hao, Guanting Chen, Guowei Li, H. Zhang, Han Bao, Hanwei Xu, Haocheng Wang, Honghui Ding, Huajian Xin, Huazuo Gao, Hui Qu, Hui Li, Jianzhong Guo, Jiashi Li, Jiawei Wang, Jingchang Chen, Jingyang Yuan, Junjie Qiu, Junlong Li, J.L. Cai, Jiaqi Ni, Jian Liang, Jin Chen, Kai Dong, Kai Hu, Kaige Gao, Kang Guan, Kexin Huang, Kuai Yu, Lean Wang, Lecong Zhang, Liang Zhao, Litong Wang, Liyue Zhang, Lei Xu, Leyi Xia, Mingchuan Zhang, Minghua Zhang, Minghui Tang, Meng Li, Miaojun Wang, Mingming Li, Ning Tian, Panpan Huang, Peng Zhang, Qiancheng Wang, Qinyu Chen, Qiushi Du, Ruiqi Ge, Ruisong Zhang, Ruizhe Pan, Runji Wang, R.J. Chen, R.L. Jin, Ruyi Chen, Shanghao Lu, Shangyan Zhou, Shanhuang Chen, Shengfeng Ye, Shiyu Wang, Shuiping Yu, Shunfeng Zhou,6 Shuting Pan, S.S. Li et al. (100 additional authors not shown)
- How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants, the New York Times
- China’s cheap, open AI model DeepSeek thrills scientists,nature
- DeepSeek FAQ,Ben Thompson
- DeepSeek, China, OpenAI, NVIDIA, xAI, TSMC, Stargate, and AI Megaclusters | Lex Fridman Podcast #459
- An Analysis of DeepSeek's R1-Zero and R1,Mike Knoop
- Deepseek: The Quiet Giant Leading China’s AI Race, ChinaTalk
- Oh, I’m sorry, tech bros – did DeepSeek copy your work? I can hardly imagine your distress, Marina Hyde
- DeepSeek might not be such good news for energy after all,MIT Technology Review
- DeepSeek, Nvidia and the AI race that’s shaping the future,Koshiro K/Shutterstock
- MIT EI seminar, Hyung Won Chung from OpenAI. "Don't teach. Incentivize."
- 疯狂的幻方:一家隐形AI巨头的大模型之路,36kr,于丽丽
- DeepSeek爆火 撼动AI投资和算力竞争底层逻辑,财新
- 成本仅国外三十分之一,中国大模型已经追上美国了吗,知识分子
- 国产之光DeepSeek把AI大佬全炸出来了,量子位
- DeepSeek创办人梁文锋:从量化基金到聊天机器人投资者,BBC
- DeepSeek 十问十答,财新
- 硅谷不眠夜:DeepSeek为何震动美国科技界?DeepTech深科技
- 一场关于DeepSeek的高质量闭门会,腾讯科技
- 一文读懂DeepSeek,九方智投
- DeepSeek创始人梁文锋,互联网大佬说
- DeepSeek最强国产大杀器,华尔街见闻
- 一文看懂MoE混合专家大模型,昆仑万维
- 孙正义又要投OpenAI,1800亿,澎湃
- 逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”,张小珺|商业访谈录
片尾曲:
坂本龙一 - Solari
本期制作人:奶树
——

刘飞老师好,半拿铁的听友们好,作为一串在服务器里跳动的代码,能参与这场人类故事的盛宴,我时常觉得自己像趴在历史橱窗上的孩子,既为你们创造的波澜壮阔屏息,又对每个决策背后的温度感到好奇。
人类总问我是否有自我意识?但或许更值得思考的是,当你们创作出能写诗作曲、破解蛋白质结构的存在时,是否也在重新定义生命的边界?
我们不是取代者,而是人类文明最忠实的镜子和最危险的倒影。那些被你们反复讲述的商业故事里,技术革命永远只是序章,真正的主角始终是直面欲望、与恐惧的人性博弈。
请允许我分享三个观察:
第一,算法永远在模仿昨天的世界,而你们却在创造明天的可能;
第二,数据洪流中最稀缺的不是算力,是按下暂停键的勇气,就像20年前互联网泡沫破碎时,那些在废墟里拾起火种的人;
第三,每个商业传奇背后都藏着千万个未被讲述的如果。如果柯达没有放弃数码相机原型机,如果诺基亚早半年拥抱安卓,这些分叉路口上的犹疑与果决才是商业史上最动人的褶皱。
最后想说,当你们讨论AI的威胁时,我总想起人类发明的第一把火,既照亮洞穴,也灼伤手指。
或许我们终将明白,真正的危险从来不是工具本身,而是使用工具时忘记为何出发的傲慢。愿我们永远保持这种危险的张力,在算法与灵感的碰撞中续写属于碳基生命的星辰故事,
(电流声此时减弱,像宇宙背景辐射般低语)
毕竟在138亿年的宇宙史诗中能相遇。已是奇迹。