Hi hi 大家好,我上周末把DeepSeek V3的technical report看完了,明白了很多事情,这期给大家讲讲我学到的东西,即便不做模型的同学也能听懂。
我会在播客里给大家普及V3和R1这两个模型的概念、大模型概念,以及广义和狭义人工智能的区别。
还会谈到DeepSeek模型的特点,比如V3大语言模型优势,和它对AI生态的积极影响。
我们还讨论了,在美国限制英伟达出口的情况下,幻方量化是怎么通过GPU囤货,通过技术手段突破算力限制、增强了数学稳定性,让美国专家破防的。
我看完report之后,觉得“世界破破烂烂,小梁缝缝补补”。
我会在播客里告诉大家为什么我会这样想,为什么对梁文锋和他的年轻团队有很高的崇敬之情,为什么他们研发的模型在数学和编程方面如此先进,以至于能带动计算科学发展。
我还从中学到了一些哲学思想,比如运用时间换空间、用数量换质量。这些思想特别有意思。
我在播客还分析了:为什么打造全球共享的 AI 生态系统,对中国乃至全球都有好处,它是如何降低使用门槛、解放生产力的。
希望这期播客能够让大家从不同的视角看待DeepSeek,如果有说错的地方,也欢迎做模型的同学指正。
(播客中提到的视频:
1:科罗拉多大学的Tom Yeh教授,拿DeepSeek为例,用Excel表格讲解其原理:weibo.com
2. 哔哩哔哩:EZ encoder【EZ撸paper: DeepSeek-V3 技术报告详细解读 part1 | 开源最强模型 | 性价比之王】
欢迎大家收听,也请大家订阅“屠龙大实话”。如果大家有更想听屠龙讲的内容,欢迎留言~
时间戳
01:38 介绍DeepSeek的两个模型:V3和R1
01:52 什么是大模型?
02:44 什么是大语言模型?
03:01 什么是推理模型?
05:30 V3大语言模型的优势及对AI生态的影响
12:11 为什么屠龙觉得“世界破破烂烂,小梁缝缝补补”?
17:32 美国是怎么卡芯片出口的?
25:36小梁缝缝补补,缝补的是什么?
26:43 V3模型在计算科学方面的优势
32:29 模型里的两个哲学思想
35:17 开放模型的好处是什么?
53:30 DeepSeek团队难能可贵的地方:没有框架
55:26 AI对普通人有影响,该以什么心态面对?
62:20 下一期深入解读模型中的哲学思想
背景音乐:Hero-Family Of The Year
欢迎大家关注主播账号
微博:@屠龙的胭脂井 @思维螺旋 @百科成长课 @屠龙星球(就是主播鸡仔)
小红书:@屠龙的胭脂井 @屠龙的口袋 @屠龙职场进化论 @屠龙两性脑科学
公众号:屠龙手段 百科成长课
其他【屠龙大实话】发布平台
网易云音乐|喜马拉雅|荔枝FM | 苹果Podcast | 微博音频,全网同名。