

- E109 从刀片电池到4680:新能源与人形机器人电池的进化之路
“刀片电池”、“4680电池”,这些名字听起来就像科幻电影里的黑科技,但它们到底意味着什么?今年四月,北京要举办一场机器人马拉松——为什么要让机器人跑马拉松?是单纯的噱头,还是藏着更深的意义?今天,我们就从电动车到人型机器人,一起聊聊电池的昨天、今天和未来,看看它如何影响我们的生活。 01:07 磷酸铁锂电池,电池的成本低,循环寿命长,安全性高,在中国市场占主导地位。 04:46 三元锂电池,它的能量密度较高,低温性能也比较好,充电效率也高,主要广泛应用于高续航的电动车,比方说特斯拉的model 3和model Y的高续航版。 05:55 目前的商业化的锂电池当中,电解液主要是液态的,易燃且挥发性强。 07:12 由于液态电解液存在上述缺陷,现在行业正在研发更加安全、更加高效的替代方案,就是固态电池。 08:06 说完了电池的主要技术,再来谈一谈电池的形状。 08:30 目前国产的电池,比亚迪,宁德时代等等,内部的电芯以方形为主。只有特斯拉的电池内部的电芯是圆柱形的。 08:56 为什么选择了46mm和80mm这两个数字呢? 10:32 方形电池的单体电芯通常采用铝壳;所以,虽然重量更轻,但更容易因外力而变形,一旦刺穿,可能就容易引发短路和热失控。 11:04 圆柱形的电芯,理论上它的上限能量密度的更高。 11:50 如果特斯拉的4680成本逐渐下降,未来可能会看到更多的圆柱形电池的应用。 12:14 说完了特斯拉的4680,再顺便说一下特斯拉的Megapack。 14:08 人形机器人的电池和电动车的电池技术有很多相似之处,但也有一些不同之处。 16:26 目前人形机器人的电池的使用时长还非常的短。 16:37 这个瓶颈主要在于。。。 16:57 电动车车的车身重量大部分在2吨半左右,普遍高于大部分汽油车的1吨半。 17:16 机器人内部的空间紧凑,不可能给电池留下巨大的空间,所以人形机器人无法再延续电动车靠增加电池的尺寸和重量来提升续航的这个套路。 17:42 某一次有机会听了主办方的访谈,才知道马拉松的主要的目的是。。。 18:55 未来,电池或许不仅仅是储存能量的容器。
- E108 制造护城河 FigureAI如何打造全球最强人型机器人工厂?
人型机器人,无疑是当今全球最火热的科技赛道——不是之一。它标志着人工智能、甚至通用人工智能,首次真正大规模走向商业化。 人形机器人将直接改变我们的生活、工作,以及日常的方方面面;这种改变的幅度之大,远超所有人的想象。 全球在这个赛道里,走的最快的,就是美国的Figure AI这家公司。在2月底发布了自研的人型机器人大模型Helix之后,昨晚(3月19号)Figure AI向外界介绍了自己建造的全新的人型机器人规模化制造工厂,BotQ,以及这个工厂为了能够大规模生产机器人,都做了哪些流程和工艺上的创新。 02:03 BotQ这个名字就强调了它大规模的生产能力。 02:08 FigureAI选择了自建工厂和流程,而不是通过ODM等委托加工的方式,有这么几个原因。 04:43 BotQ的首代生产线,每年可以制造12000台机器人。 05:32 FigureAI的人型机器人将在制造过程当中用于生产其他的人型机器人 05:53 提高生产效率的关键在于工程设计的早期阶段。 06:19 产能爬坡的真实的原因无外乎两个。 07:26 装配时间的最大影响因素在于零件的数量及制造工艺。 07:45 尽管CNC加工,对于原型产品的开发和高精度的零部件来说是非常有价值,但在大规模生产的时候,CNC的生产成本和制造时间,存在明显的瓶颈。 08:22 再多说一句CNC工艺,CNC工艺在制造业中多被用于高精度的切割、镶嵌等的制造环节。 10:29 这里我介绍一下“注塑成型”、英文叫做injection molding,压注die casting,“金属注射成型”metal injection molding,和“冲压”Stampping。 12:38 哪些部件需要垂直整合?哪些环节需要自主研发? 15:31 FigureAI还搭建了自己的这个软件基础设施,因为制造业需要庞大的软件基础设施来保证生产流程的顺利进行。 16:53 这里已经两次提到了“一致性”这个概念,一致性,在制造业,是确保。。 19:34 这不仅仅是Figure AI的挑战,也是所有科技公司的机会。
- E107 选择真的大于努力吗?从宇树科技王兴兴的选择看创业之道
梁文峰是媒体报道中典型的“学霸”,求学之路始终由自己主导,一路坚定地走在自主选择的轨道上。而王兴兴的经历则截然不同,他更多是在被动接受命运安排,顺应外部环境的选择。 “选择大于努力”这句话我们都不陌生,甚至还有比这更夸张、但也更幽默一点的表达是“在错误的方向上奔跑是没有意义的”。 也有一种说法,说“选择大于努力”这种说法、只不过是给选择之后而没有努力的自己、在面对窘境的时候,给自己的”没有努力“找到的借口而已。 02:52 尽管王兴兴在上学期间曾经获得获得过多次的机器人比赛方面的大奖,毕业时的学历可能很难让他进入。。。 04:19 王兴兴短暂的大疆的两个月的经历,是否是他人生中第一次真正主动选择自己的道路? 04:42 可以说直到2025年的春晚,王兴兴才迎来了世俗意义上的真正的成功。 05:56 现实当中,成功往往是“选择 x 努力 x 机遇“的结果。 07:40 王兴兴创办宇树机器人的2016年,机器人或者人形机器人完全算不上是热门赛道。 09:39 如果今天大模型仍然没有破圈儿,机器人行业将会继续在漫长的隧道里摸索,不知道尽头在哪里。 10:18 大家不知道的是,英伟达在1999年上市之后长达20多年的时间里,股价一直只有几毛钱。 11:15 如果没有大模型在2022年开始出圈儿,英伟达或许仍然是一家名不见经传,在行业里也没有太多地位的芯片公司。 11:45 在面对失败或者是不如意的现状的时候,很多人可能会归因于当初没选对。 14:08 在2016年,王兴兴选择离开在当时就已经是无人机行业的王者大疆,创办了不被主流看好和认可的机器人公司,谈不上是选对了。 14:35 是不是在大厂王者大疆里去努力,人生会更容易? 15:27 真正的差距往往体现在选择之后的行动。 15:50 无论当初选择了哪条路,选择了之后都要足够的努力,让这个选择变成正确的选择。
- E106 Manus从出圈到争议,人工智能代理大揭秘
这两天,国内 AI 圈最火的,非 Manus 莫属了。然而,这次却与以往不同、并没有掀起“一个中国团队让硅谷无眠”的效果,并且国内的讨论迅速走向两极分化。 这期节目,我们不会纠结于Manus体验好坏,也不讨论它的营销方式。我们会专注于:Manus 到底是什么?它与DeepSeek这样的通用大模型有何不同?它提供了哪些服务?它算是 AI 智能体吗?AI 智能体又是什么?打造 AI 智能体到底难不难?Manus 有护城河吗?它能成为下一个 DeepSeek 吗? 01:00 有业内人士对这些不好的产品反馈,给出了相对中正又幽默的解释。。。 02:27 过去这么些年,或许由于我们的遥遥领先,也或许是有其他的原因,我们和国外渐行渐远,东西方之间的信息差越来越大。 03:34 人工智能代理,GPT给出的解释:是一种能够自主感知环境、决策并执行任务的智能系统。 04:46 自动驾驶系统是不是就是一个人工智能代理呢? 05:04 人形机器人也是一个人工智能代理,可以在更复杂的三维环境中完成各种任务。 05:50 虽然人工智能代理的目标是实现高度的自主性,但并不是完全不需要人类的干预或者是交互。 07:23 Manus这个通用代理和OpenAI的Operator有什么区别吗? 09:42 说完了Operator是怎么工作的,我们再来看看Manus是如何工作,如何实现的。 12:57 这个过程当中也能够看得出来,真正制约Manus能力的、在于它使用的模型的能力、和它所调用的其他的人工智能代理的能力。 13:32 对于现在的AI产品来说,护城河就这么几个点。。。 14:47 网上也有另外一个跟这个“数据飞轮效应”相关的、但是更加有趣的观点,叫做“生态卡位”。 15:47 虽然这一轮的出圈儿并没有形成“一个中国团队让硅谷无眠”的效果,但也没有消耗deepseek给中国AI带来的正向价值。
- E105 大模型部署指南: 住酒店、买房还是自己盖别墅?
自从 DeepSeek 爆火后,铺天盖地的新闻都在报道“某某公司全面接入 DeepSeek”,甚至连阿里巴巴的云服务也随之水涨船高,热度飙升。那么,这里提到的“全面接入”到底意味着什么?其实,它背后涉及一个核心概念——大模型的部署。但究竟什么是大模型部署?为什么企业要部署大模型?有哪些不同的部署方式?这些部署方式又是如何与云服务厂商紧密相关的?今天这期节目,就一一解读这些关键问题。 00:53 大模型的部署,是指将已经训练好的大模型,比如GPT或DeepSeek等集成到实际的应用当中,使其可以被用户或者是系统来调用。 02:02 大模型的部署的最核心的环节,就是模型的托管,hosting。 02:29 无论你选择哪一种的部署方式,都需要根据未来业务量的需求来选择相应的GPU和数量 02:49 根据托管方式的不同,大模型的部署方式也就分为。。。 02:59 云端部署,适用的场景是。。 05:44 公有云部署,某种程度上就像是去酒店去订房间。 06:20 如果你不喜欢公有云部署的弊端,那和公有云对应的这个部署的方式就是私有云部署。 07:14 如果说公有云部署类似于去住酒店,那私有云部署就类似于。。。 08:42 行业里面通用的做法是。。。 11:28 本地部署适用的场景是对于数据隐私有更加严格要求的 12:12 本地部署就相当于是自己给自己建立一套独栋的别墅 13:30 边缘部署,适用的场景是那些需要离线运行或者是在终端设备上运行,比如手机、机器人 15:06 边缘部署,通常采用的是蒸馏过的小模型 15:23 对蒸馏这一概念感兴趣的听友,可以去我的第96期节目
- E104 从“赢麻了的速胜论要不得“看懂全球芯片制造格局
提到人工智能芯片,大家都知道英伟达。最近DeepSeek的火爆给国内市场带来振奋,人们对中国AI产业信心满满,甚至有说法“绕过了英伟达”,官方媒体最近发文指出,“赢麻了”的速胜论要不得,DeepSeek虽然展示了超强的产业穿透力,但它仍然是在英伟达芯片集群上训练而成的,也没有绕开英伟达CUDA编程框架。英伟达依托后者构建的软件生态,被认为是比芯片更高的技术“护城河”。 除了英伟达,大家可能还听说过台积电。台积电又是干什么的?他和英伟达什么关系?今天这期节目,和大家一起来把全球芯片产业的格局聊清楚。 "如果说英伟达是给全球人工智能行业卖铲子的人,那台积电就是给英伟达卖铲子的人,而ASML则是卖给台积电产子的人"。 01:06 对CUDA感兴趣的听友可以去我的第92期节目里面了解更多的细节。 01:27 它是世界上唯一一家专注于半导体代工的公司 03:42 除了台积电,世界上还有其他的一些公司也能进行半导体代工生产;但是,他们也在同时做自己的芯片设计。 04:32 这是苹果的“双供应商”策略,一部分交给台积电,一部分交给三星。 05:01 “双供应商”的策略,它的好处是。。。 08:08 除了台积电,第二个重要的代工厂,叫Global Foundries 08:35 在半导体行业当中,Foundry特指那些“专为其他公司代工制造芯片的公司”。 08:47 “晶圆代工厂”就等于“Foundries"。 08:57 Global Foundries这个名字听起来很霸气,但是这家公司本身一点儿都不如他的名气霸气 09:41 第4个最重要的代工厂、就是大家比较熟悉的“中芯国际”了,SMIC 10:09 通过这些介绍,大家就能发现,这4家主要的代工厂里面,最能打的就是台积电了 10:23 台积电比三星在半导体代工领域里面的领先,主要体现以下几个方面。 14:16 也正因为如此,台积电占据全球芯片代工的绝大部分的市场份额,2024年,大约占68%。 14:53 台积电的这个900亿的美元的收入,甚至高过了英伟达的609亿的收入。 15:39 分析师估计,英伟达贡献了台积电营收中的约15%。 15:57 台积电,2023年给ASML贡献了大概30%的收入 16:07 如果说英伟达是给全球人工智能行业卖铲子的人,那台积电就是给英伟达卖铲子的人,而ASML则是卖给台积电产子的人
- E103 从特朗普万斯手撕斯基, 看谈判中的情绪管理
"揭秘科技"是个商业科技播客,我的节目不会谈论政治与外交,我们就从商业的角度,来看一下,这场商业谈判,为什么还没有开始正式谈,就已经谈崩了? 01:19 这个会议的前40分钟都聊得挺“友好”,但是从双方反复重复的话语之间,明显能够看得出来,双方各自心里都完全清楚自己从这个交易中想要什么。 01:35 双方也都完全清楚自己想要的,对方一直都没有明确的给予答复。 01:52 斯基表达不同意见的结束语,用了“问句”的方式去表达,这让万斯感受到了被挑战了。 02:28 万斯在会上并没有表现为常见的传统意义上的这种“沉默的副手”。 03:06 从行为上看,万斯像是特朗普的情绪的放大器。 04:03 特朗普并没有在万斯发飙之后,来演一个“好警察”的角色。 05:00 这种情绪化的对抗、而非利益导向,在谈判中是非常罕见的。 06:35 谈判的双方缺乏前期的共识与预期管理。 09:04 通常的商务谈判前,双方的下面的各级“牛马们”会通过各种正式的、非正式的沟通和协调,确保双方对核心的诉求和红线有了基本的共识。 10:21 电话微信沟通了很多次,感觉“谈的差不多了”,但见面一聊之后才发现严重忽视了对方的立场与筹码。 12:28 哪怕存在严重的分歧,也要保持未来沟通的一个渠道。 13:02 谈判中最重要的是“赢”,还是要保住关系?
- E102 人型机器人大模型Helix 如何在物流行业中‘自主思考’
美国人型机器人界的当红炸子鸡——Figure AI,在宣布停止使用OpenAI大模型并发布自研的Helix人型机器人大模型一周后,再次惊艳亮相,展示了由Helix驱动的机器人在高速运转的包裹物流产线上工作的精彩视频。这是Figure公司机器人在实际商业场景中的第二次应用。首次亮相则是在去年同一时段,Figure机器人成功进入宝马公司的工厂,成为第一个商业客户,并正式投入生产。 这期播客,讲述Helix人型机器人大模型,是如何加速真实的物流世界的。 01:15 Figure创始人说“真正令人兴奋的是,我们与宝马的第一个应用案例,花了12个月的时间;而第二个商用案例仅用了30天,通过Helix人形机器人大模型” 02:30 Figure这家公司,得到了世界首富Jeff贝索斯、OpenAI、微软、英伟达等头部的公司和创投的投资。 03:14 “我们不能再将AI大模型外包出去了、就如同我们不能将硬件外包一样”。 04:30 Helix模型的几个重要的核心的能力是 05:32 这个任务,要求达到人类水平的速度、精确度和适应性。 06:38 这些改进包括,第一是叫做“隐式立体视觉“,是指。。 07:44 第二个改进,叫做“多尺度的视觉表示”,意思是说。。。 08:52 第三个优化,叫做“学习型视觉本体感知”,是说每个Figure机器人能够自我校准。。。 11:30 第四个优化,叫做“运动模式”,指的是不改变训练过程的前提下、在推理时提升速度。 12:16 Figure要应对的这个真实的“物流分拣应用场景”到底是什么样子呢? 13:50 Figure是如何实"物流分拣场景“中特定的优化的呢? 16:07 硬件行业和软件行业特别不不一样的一点是。。。 6:33 同样的零部件,它的实际的表现可能是有所不同。 21:09 训练的数据的质量要重要性要高于训练的数量 21:54 当“运动加速”提升的速度超过50%的时候,实际的吞吐量开始大幅的下降了
- E101 Figure的Helix大模型 - 人形机器人最硬核最好懂最全面的解析
全球人型机器人公司里的当红炸子鸡,Figure AI在2月20号发布了最新的Helix人型机器人研究成果(完整视频在这里),Figure AI这家公司在人型机器人领域,在全球的地位相当于大模型领域的OpenAI、人工智能芯片里的英伟达,我的第12期和第21期播客,对这家公司、及其创始人有详细介绍,感兴趣的听友可以去了解更多细节。 本期节目,我将深入剖析Figure的Helix模型,全面覆盖从技术到方法、从术语到实际应用的各个方面。无论你对人型机器人感兴趣但了解不深,还是希望掌握该领域的基本概念和前沿知识,都会在这里找到清晰易懂的解读。 02:02 Helix是Figure这家公司把人形,把机器人领域里面通用的视觉、语言、动作的VLA模型,在人形机器人中,进行了一次完整的创新和实践。 03:12 "自我学习和控制" - “learned control", 是指通过机器学习的算法,来让机器自动去学习如何控制自己的行为。 03:44 Helix实现了人类历史上的一系列的首次。 03:48首先是一个完整的上半身的控制。 04:35 ”自由度“就是关节能让你动几种不同的方式,人类的上半身大概有五、六十个自由度 05:28 其次,Helix还实现了多机器人自主协调工作 06:05 与以往传统的方法不同,Helix使用一组神经元网络的权重、来学习所有的行为。 07:23 Helix模型是跑在机器人本地的、嵌入式的、低功耗的GPU上,而不是云端的集群GPU上,这意味着它自带大脑,能够独立的看、听和动 07:40 在Figure格的这个Helix模型的paper当中,也定义了"人形机器人的新的scaling law". 09:35 要让机器人在家庭当中发挥作用,他们需要能够按需生成智能的新的行为。 10:32 "泛化",就是机器或者是AI在学会一件事情之后,能把这件事用在没有见过的新的情况上。 11:59 如何从VLA模型当中提取所有的、常识的知识,并将其转化为可以泛化的机器人的控制? 12:31 在Helix之前的人型机器人的方法,面临了一个根本性的一个权衡。 15:01 Helix两个互补模型这的设计,相比于现有的方法,提供了几个关键的优势。 15:52 传统的VLA模型实现方法,将连续的动作转换为离散的、有限的控制选项,来简化控制。 16:44 高维度的控制需要更加精准和灵活的控制策略,而传统VLA方法在这类任务上基本上是无法实现的。 17:24 Helix"关注点分离“的做法,不受寻找统一的“观测空间”或者是“动作表示”的约束。“观测空间”,指的是机器人如何看待外部世界;“动作表示”指的是机器人如何表达自己的动作。 18:53 关于Helixd模型的训练数据、和训练方法,Figure也做了详细介绍。 20:15 这里我再解释一下传统机器人训练的数据,作为对比。 25:21 Helix是全程端端到端训练的 25:42 “标准回归损失”,就是衡量模型输出与期望之间的差距 26:12 Helix的优势,在于它的这种通用性,不需要为每个任务专门去训练不同的模型,或者是微调这个系统的特定的参数。 27:08 “时间偏移”是Figure在训练Helix时,加的非常聪明的一招 27:59 说完了训练,再说一下Helix的优化流式推理。 30:31 随着头部和躯干的动作,一方面改变了机器人能够到达的地方,另外一方面,也改变了机器人能够看到的东西,这带来了一个新的挑战。 32:09 “零样本”,zero shot,是机器学习和人工智能当中的一个术语,指的是模型在没有见过某个特定任务或者是样本的情况之下,仍然能够成功的进行推理和执行任务。 33:42 Helix还弥补了互联网规模的语言理解、与精确的机器人控制之间的差距。 34:12 “非结构化的环境”,指的是那些没有明确规定或者是标准化布局的环境。 35:25 “监督数据”,在人工智能领域是指。。。监督数据是用来指导模型去学习正确的输出。 36:07 “非监督数据”没有预先定义的正确答案,模型需要自己从这些数据当中去发现结构模式或者是特征,而不是学习具体的答案或者是目标输出。 37:12 Helix通过单一的、统一的模型,在各种的任务当中都表现出来了强大的性能,无需任何特定任务的示范,或者是针对每一个不同的场景去进行大量的手工编程。
- E100 量子计算大突破!微软Majorana1能撼动英伟达GPU吗?
今天(2025年2月19日),微软发布了一款名叫 Majorana 1 的量子计算芯片。这个芯片不是普通的那种硅基芯片,而是用了一种特别的材料和技术,这个材料很特别,微软说它创造了一种全新的物质状态——不是固体、液体或气体,而是一种“拓扑状态”。这种状态能让量子比特更稳定、更不容易出错。 00:52 这个芯片到底是啥呢? 01:33 量子比特可以同时是0和1的一种叠加态,这让量子计算机能够做超复杂的计算 03:57 叠加态是怎样让量子计算机算得更快了呢? 05:57 微软为什么把这个芯片的名字叫做Majorana? 06:48 谷歌,IBM等等也在做量子芯片,甚至他们做出来的比这个微软的还要早。 08:27 量子芯片有什么用呢? 09:06 微软今天发布的这个量子芯片,能做什么呢? 09:44 量子芯片,与英伟达的GPU的关系,是竞争还是替代呢?
- E99为什么大厂的“实验室”和“研究院“造不出DeepSeek?
DeepSeek 火爆之后,许多媒体和自媒体纷纷将其成功“出圈”,归因于创始人梁文锋的个人能力,再进一步归因到他出生成长的“广东”老家、他就读的浙江大学,再到DeepSeek 团队那些虽然没有海归背景、但全部是本土清北毕业的顶尖人才团队,甚至还有归因到DeepSeek 所在的杭州在各方面比其他城市更胜一筹。 还有一个广泛流传,看起来非常合理的归因:“因为DeepSeek算力有限、有限的资源,迫使他们开始创新”。这些观点,是有意为之,还是仅停留在表面的认知层面,不得而知。但不可否认的是,这样的叙事方式,非常符合大众的期望,因此能够轻松获得认可并广泛传播。 本期节目,我们将探讨最可能的真实原因,来揭示DeepSeek给我们带来的最大启示。 01:21 如果仔细推敲,无论是浙大还是清北,过去这些年培养了多少相关专业的本科生、硕士和博士?这些优秀的人才毕业之后,大部分都去了国内外大厂的某某实验室或者某某研究院。 02:37 DeepSeek有相当一部分的研究人员是在北京工作的。 02:53 阿里及其达摩院同样位于杭州。 03:13 而“资源有限、强迫了他们创新”这个说法,更是和DeepSeek在2019年就对媒体宣称自己拥有1万块GPU,在国内公司里排名第一这个说法"背道而驰。 03:44 成功往往不是因为别人知道了你所不知道的东西,而是因为别人做到了即使你知道也根本做不到的事情。 03:55 DeepSeek能够在“低训练成本算法”方面取得创新,核心的原因有2个。 04:15 这简直就是研究人员最理想的环境了。 06:13 这些大厂的实验室和研究院,往往也是从没有KPI的这种自由式的研究起步的。 06:31 没有KPI或者是任何监督约束的时候,不是每个人都能够去好好的利用资源,深入的、自由的去做自己想做的事,感兴趣的事。 07:58 大家经常看到某些大厂的实验室或者研究院的1号位,在几年之后就离职了,这背后基本上都是这样的故事。 08:11 为什么那些“姚班”、“邱班”等掐尖项目,到现在也没有出来”巨擎“呢? 10:00 有些项目还要全英文授课,真想问一下,有那个必要吗? 10:26 “我和你”的作者,陈其钢,在回忆自己在中央音乐学院附中求学的时候。 12:18 如何才能够既给研究人员充足的研究自由,又避免人性的懒惰和贪婪导致的长时间看不到结果呢? 13:18 激发人性中向往美好、渴望成功的那部分,才是团队管理者的核心职责,而不是去“制定方向”和“监督结果”。 15:00 为什么高校等科研机构,没有类似的成果出来呢? 15:17 高校的教授必须具备博士学位不可吗?
- E98 从初创公司成长为光刻机之王,ASML的文化与领导力
本期节目通过挪威国家主权基金CEO Nicolai Tangen对全球光刻机巨头 ASML CEO Chris Fouque 的深度访谈,揭开全球最关键的芯片制造设备——EUV光刻机的奥秘,以及是什么让ASML从飞利浦旗下的一家小的创业公司,一步步成为今日不可撼动的行业领导者的?光刻机为什么那么难?到底难在哪里? 01:05 ASML到底是生产什么的? 01:30 什么是EUV呢? 01:56 为什么这么难呢?哪个部分难呢? 03:43 ASML的光学系统是与他们的光学合作伙伴"蔡司"多年共同一起开发完成的,就是那个生产镜头的蔡司... 04:25 “我们当时选择EUV并不是因为它最容易"... 05:49 如果你要去做这么困难的事情,如果你不是独自一人,你会感觉更好,对吧? 07:19 至少在接下来的20年里,AI公司希望是可以每两年将晶体管的密度增加16倍。 07:33 在谈到与德国的光学公司蔡司的关系时,Chris说,"当我们谈论这种关系的时候,我们说这种关系比婚姻还要糟糕,因为我们永远无法离婚" 08:31 关于为什么没有与"蔡斯"合并。。。 09:19 在关于未来几年人工智能会如何发展这个问题。。。 10:28 关于中美关系对于半导体行业发展的影响。。。 11:31 在谈到中国现在的芯片落后有多久的时候。。。 12:12 在谈到能否在美国、日本和韩国完成芯片制造这个话题的时候。。。 13:32 谈到创新。。。 14:13 在谈到如何描述ASML作为一家公司的文化的时候。。。人们做事情基本上不是为了给自己争取功劳,而是为了公司的利益。 15:54 人们必须看到你的真实的一面,不应该有虚假的讨论,也不应该试图去取悦或说服别人,你需要非常真实直接。 16:46 你需要有梦想,同时,你需要能够以一种非常清晰的方式来传达这个梦想。 17:18 “你是如何保持对细节的关注的?” 18:16 作为CEO,你需要能够向人们解释“为什么某些事情很重要”,而做到这一点的唯一的方法就是“简单明了”。 18:42 如果需要太多的话来解释的话,那么你根本就没有解释清楚。 18:56 “你是怎么学会清晰的传达你所做的事情的”? 19:40 在你让人们信服之前,你要给他们足够的信息,让他们自己说服自己。 20:33 当你不再需要证明任何事情时,我认为这是一种解放。 21:09 在谈到“你是怎么放松的”这个问题的时候,Chris说“我感受不到压力” 22:13 正确的问题应该是“我明天要做什么才能真正的让我兴奋?”
- E97 一口气讲清AI所有术语 看DeepSeek之争不再一头雾水
AI正在成为这个时代最重要的变革力量,但它的讨论却常常充满门槛。术语的混乱让外行难以理解,信息的碎片化让人难以构建完整的认知。这期节目,希望让 AI 不再是少数人的“黑话”,而是所有人都能真正理解、思考并参与塑造的未来,因为未来属于那些真正理解它的人。 我将以Lex Fridman最新一期长达5个小时的播客中的热门话题和精彩观点为基础,深入浅出地解释他们讨论中的核心 AI 概念,比如“AI行业里并没有达成一致的关于开源的定义”、“大模型的参数权重”、“预训练 vs. 后训练”、“对齐”、"Token"、“思维链chain of thoughts"、“MoE“、“DeepSeek绕开英伟达"、“集群”、“AI智能体AI Agent"等。 01:43 先介绍一下三位人物,Lex Fridman... 03:06 DeepSeek和OpenAI之争,被很多媒体和自媒体简单的说成了"开源"与"非开源"之争。 03:16 在人工智能领域,关于"开源"的定义到目前为止并没有完全统一一的一个共识。 06:29 大模型的参数权重,就像是大模型的记忆力,他们存储了模型从海量数据中学到的模式、规律和知识。 07:37 权重的公开并不等于模型完全开源。 08:17 Nathan所在的研究机构认为,真正的开源应该不仅仅包括开放源代码,还应该包括:发布训练数据,发布训练代码,并且发布参数权重。 08:54 接下来我先介绍“预训练”和“后训练”。 09:30 在像GPT这样的大语言模型当中,Token是一个是文本中的一个较小的单元,可能是一个单词、一部分单词,甚至是一个标点符号。 11:31 在人工智能领域,对齐、alignment,主要是指确保AI系统的行为和目标,与人类的意图、价值观和期望一致。 13:53 预训练通常成本更高,训练时间更长。 14:13 接下来再介绍一下“推理过程的显性化”这个概念,也就是大家从DeepSeek R1中看到的,R1完整的展示了整个推理的逻辑。 15:07 相比于传统的黑箱模型,Chain of Thoughts有助于帮助人类理解模型是如何做出判断的,从而提升了整个模型的可信度。 15:41 这个“混合专家系统” MoE的核心思想是... 16:15 在OpenAI实现MoE架构之前,行业里没有人相信这个MoE的paper真能work... 16:49 关于DeepSeek没有直接去直接调用英伟达CUDA API,也就是NCCL API(绕过英伟达)... 18:31 谈到当前人工智能领域的数字集群的规模... 21:01 除了电力供,GPU的冷却也是一个大问题。 21:30 未来,谁最可能成为英伟达的竞争对手或者是替代品? 22:42 目前在人工智能领域,谁在赚钱? 23:11 关于AGI,通用人工智能... 23:30 关于未来AI的价值到底会从哪种形式呈现... 23:39 这里又提到了AI agent(AI代理)的概念... 24:12 OpenAI前几周发布了自己的第一个AI agent, 这个产品的名字叫做OpenAI Operator. 25:48 他们三位也谈到了程序员与AI之间的关系,以及未来的发展
- E96 DeepSeek与OpenAI之争:什么是AI蒸馏,为什么它如此敏感?
先祝大家在蛇年里像AI一样快速进化,突破极限,探索未知! 这个春节假期,deepseek成了比春晚还要热门的话题。其中一个重要的讨论是,OpenAI宣称DeepSeek违规“蒸馏”,即:DeepSeek使用OpenAI专有模型来训练自己的开源聊天机器人。我们这期节目,不去评价或声讨OpenAI的指责,更不去证明deepseek蒸馏了或者没有蒸馏;因为我们第一不是当事人,我们没有第一手的信息来证明任何东西;第二,我们也根本不在要去证明任何一方的位置上。这期节目的目的,是来学习一下,什么是蒸馏技术,为什么会存在蒸馏这种现象,以及,在哪些场景下的蒸馏是被允许的。 节目里我会引用多个来源关于蒸馏的介绍,尽量全面和客观。并且只做引用,不做任何评价。 01:54 金融时报讲,所谓蒸馏技术,是指开发者使用更强大的模型的输出来训练小模型,从而以更低的成本来获取更高性能的一种做法。 02:09 蒸馏是业界常见的做法,但问题是... 02:31 专门为大模型提供训练数据的八友科技的创始人、清华大学计算机系毕业的博士梁斌,他对蒸馏技术的解释是... 03:13 梁博还说,蒸馏的过程一般是这样的... 04:00 关于蒸馏技术,ChatGPT是这样来解释的... 04:11 旨在将一个大型的、复杂的模型通常称为教师模型的知识,转移到一个较小的、较轻量的模型,通常称为学生模型当中。 06:27 什么是蒸馏的这个问题,DeepSeek给出了和chatGPT类似的、或者基本一致的回答。 06:40 在人工智能行业当中,教师模型和学生模型通常来自于同一家公司吗? 10:02 OpenAI允许其他公司用ChatGPT作为教师模型吗? 13:33 同样的这个问题,"OpenAI是否允许其他公司用ChatGPT作为教师模型?",我又问了DeepSeek。 15:34 蒸馏技术不仅仅是一种模型压缩的技术,更是一种跨公司合作的潜力所在。 15:51 然而,这个话题也引发了一个更加深层次的思考。
- E95 无论你是谁,这三种技巧都能帮你赢得更多关注
在职场环境中,专业能力固然至关重要,但真正决定能否快速晋升、甚至引领团队的,往往是那些被称为“软技能”的能力。无论你是希望成为一名优秀的团队领导,还是想在职场中脱颖而出的个人贡献者,软技能都会在你职业生涯中起到决定性的作用。 今天的节目,我将为大家介绍三项最重要的职场软技能,整理自两位著名的高管教练——Harriette Cole 和 Ethan Evans 的多个讲座分享。 我之所以喜欢这两位的分享,是因为他们的内容既不书生气,又非常接地气,充满实用性。 01:55 Ethan在接下来的10年的时间里,完成了极具挑战性的两次晋升,从资深经理升至总监,再从总监升至副总裁。 02:43 你必须通过在大批重要的人前讲话的方式,来激发人们对你的能力的和想法的信心。 02:52 没有人愿意将更多的责任,交给那些看起来对现有责任都感到不自在的人。 03:36 接受别人的反馈,对大部分人来讲都非常的难,尤其是在会议这种当众的场合。 05:14 无论对方举的是什么例子,那是对方看到的事情的一个方面,不一定是事情的全貌。 05:36 大部分的反馈,确实是批评性的,有时候是充满了敌意的。 07:11 即使你知道答案,在当场被提问的时候,仍然会变得非常的慌乱,从而失去了可信度。 08:05 也有些人的特质是内向的,比较容易害羞;对这些人来说,当众讲话就更挑战了。 09:14 高管风范的定义是:是“展示自己应该被认真对待的能力”。 10:22 当具备高管风范的时候,人们会被你吸引,专注的倾听; 13:41 你可以拥有最佳的专业技能或者是最佳的创意,但如果不能够通过有力的讲故事的技巧来沟通,那就没有人会关注到你。 16:42 过度的讲故事是一种操控手段。 17:17 在生活和工作当中,有很多机会通过讲故事来更好的实现自己的目标。