E16:DeepSeek report读后感-模型的哲学,产业的影响和国家的竞争屠龙大实话

E16:DeepSeek report读后感-模型的哲学,产业的影响和国家的竞争

66分钟 ·
播放数19440
·
评论数128

Hi hi 大家好,我上周末把DeepSeek V3的technical report看完了,明白了很多事情,这期给大家讲讲我学到的东西,即便不做模型的同学也能听懂。

我会在播客里给大家普及V3和R1这两个模型的概念、大模型概念,以及广义和狭义人工智能的区别。

还会谈到DeepSeek模型的特点,比如V3大语言模型优势,和它对AI生态的积极影响。

我们还讨论了,在美国限制英伟达出口的情况下,幻方量化是怎么通过GPU囤货,通过技术手段突破算力限制、增强了数学稳定性,让美国专家破防的。

我看完report之后,觉得“世界破破烂烂,小梁缝缝补补”。

我会在播客里告诉大家为什么我会这样想,为什么对梁文锋和他的年轻团队有很高的崇敬之情,为什么他们研发的模型在数学和编程方面如此先进,以至于能带动计算科学发展。

我还从中学到了一些哲学思想,比如运用时间换空间、用数量换质量。这些思想特别有意思。

我在播客还分析了:为什么打造全球共享的 AI 生态系统,对中国乃至全球都有好处,它是如何降低使用门槛、解放生产力的。

希望这期播客能够让大家从不同的视角看待DeepSeek,如果有说错的地方,也欢迎做模型的同学指正。

(播客中提到的视频:

1:科罗拉多大学的Tom Yeh教授,拿DeepSeek为例,用Excel表格讲解其原理:weibo.com

2. 哔哩哔哩:EZ encoder【EZ撸paper: DeepSeek-V3 技术报告详细解读 part1 | 开源最强模型 | 性价比之王】

欢迎大家收听,也请大家订阅“屠龙大实话”。如果大家有更想听屠龙讲的内容,欢迎留言~

时间戳

01:38 介绍DeepSeek的两个模型:V3和R1

01:52 什么是大模型?

02:44 什么是大语言模型?

03:01 什么是推理模型?

05:30 V3大语言模型的优势及对AI生态的影响

12:11 为什么屠龙觉得“世界破破烂烂,小梁缝缝补补”?

17:32 美国是怎么卡芯片出口的?

25:36小梁缝缝补补,缝补的是什么?

26:43 V3模型在计算科学方面的优势

32:29 模型里的两个哲学思想

35:17 开放模型的好处是什么?

53:30 DeepSeek团队难能可贵的地方:没有框架

55:26 AI对普通人有影响,该以什么心态面对?

62:20 下一期深入解读模型中的哲学思想

背景音乐:Hero-Family Of The Year

欢迎大家关注主播账号

微博:@屠龙的胭脂井 @思维螺旋 @百科成长课 @屠龙星球(就是主播鸡仔)

小红书:@屠龙的胭脂井 @屠龙的口袋 @屠龙职场进化论 @屠龙两性脑科学

公众号:屠龙手段 百科成长课

其他【屠龙大实话】发布平台

网易云音乐|喜马拉雅|荔枝FM | 苹果Podcast | 微博音频,全网同名。

展开Show Notes
17:30 哈哈哈哈哈,引用王骁的话:美国政府是中国科技发展的总倒逼师🤣
汤姆_ucsu:这也能让你沾沾自喜
屠龙姐姐是近一年最惊喜的发现,能把最尖端的科技讲给我这样非专业的听懂,不愧是清华+卡耐基脑机接口博士+网红👍👍👍👍👍👍
木同1996
木同1996
2025.2.19
1:03:04 听的我都热泪盈眶了🥹,像姐姐说的,我们都可以站在这么好的时间节点站在Deepseek 的肩膀上,去做更多对自己对企业和社会有帮助的事
Jilha:有了 DS 和机器人,觉得对未来都乐观了一些😊
比一些男大佬说的通俗易懂好多!
鹍鹏
鹍鹏
2025.2.21
屠龙的认知很有高度,听了后觉得很亮敞,通透!我们民族生生不息,外部压力也是一个重要的动因。这个时代其实挺好,外面总有人虎视眈眈,这也正好督促大家勤动脑筋勤动手不敢懈怠,这不正是自我提升的契机嘛。
45:17 想到那个中外大厨比赛,有一个环节是互相拿对方队伍的一个食材,外国队以为拿了中国队的油之后就我们就没法炒菜了,没想到中国队咔咔开始拿肥肉炼油
谈得来:哈哈哈,食材来自于方方面面!
狐狸和星星:厨王争霸!很喜欢这个节目
38:44 学到了,姐姐这个思路 其实就是转念 小人就是贵人,其实就是转换自己的念头,姐姐好棒呀!又学到了,真心感谢^ω^
黑人不想白:同被共鸣
世界破破烂烂,小梁缝缝补补。hhhh😆
Myra5
Myra5
2025.2.19
大家都好积极,又来跟着屠龙长见识增智慧
Mr_why
Mr_why
2025.2.20
04:48 哇开头就震撼我,我竟然从来没想过问这个问题为什么人会内耗?因为人会对自己的情感产生情感,会为自己生气而感到生气(⊙ꇴ⊙)一旦明白了真的再也不会内耗了!
谈得来:清醒的大脑
Monica52
Monica52
2025.2.20
“基础好,又懂大模型,又干到底层,又没被限制过,又想到要对全世界人民开放。”
琳达_OkvW
琳达_OkvW
2025.2.20
每次听完屠龙的播客都心潮澎湃的 一身牛劲🥹
旺旺汪汪汪:我懂😭
tutti璇
tutti璇
2025.2.21
1:03:49 片尾区叫啥名字
屠龙的95后小鸡仔
:
背景音乐:Hero-Family Of The Year
叁金_wgnr
叁金_wgnr
2025.2.19
感谢老师 把这么多专业的东西用大家都能听得懂的话讲出来,我们也要好好学习争取站在 deepseek 这个巨人的肩膀上去拿到一些结果!
阿白_gD6f
阿白_gD6f
2025.2.26
12:01 架构开源,本地下载,输入data,token便宜
阿白_gD6f:cuda库壁垒,h800算力不错,通讯绕了一下。算力有余力,math计算上加强了
阿白_gD6f:27:45 math的思想很重要,ai模型可以辅助计算
7条回复
Deecorpse
Deecorpse
2025.2.20
这一期讲的真好啊,比很多博主讲得更通俗易懂,塞翁失马焉知非福,最后越讲月燃!
HD230125f
HD230125f
2025.2.25
38:26 小人就是你最大的贵人,有些小人逼你成长
令狐玮
令狐玮
2025.2.26
以后做节目都要喝点老白干,太嗨了,哈哈哈。
屠龙的95后小鸡仔
:
配上你的头像看这条回复太好玩了
1:01:23 普通人应该怎么做,狠狠地用上,比昨天的自己要强一点