- 07.对scaling law不乐观,o1很难创造新概念,我们距离大模型共识有多远?
本期节目是孟醒受邀参加TGO鲲鹏会与张俊伟博士和田渊栋博士的对谈,他们围绕大模型领域的scaling Law、涌现能力、大模型的双系统应用以及AI Agent话题并结合当下多个研究展开讨论。 * 主播 张俊伟 IEEE T-CSVT Associate Editior、TGO 鲲鹏会 硅谷董事 * 嘉宾 田渊栋 MetaAI研究团队(FAIR)研究科学家总监、卡耐基梅隆大学机器人系博士 孟醒 五源资本合伙人、滴滴前自动驾驶COO * 时间轴 3:58 无人驾驶中是否存在scaling law效应? 9:12 对scaling law并不乐观至少在目前看来大模型的能力并不会断崖式地变好 12:14 田渊栋博士的新工作:神经网络的解可以通过某种代数的方式构造出来 18:30 Dualformer模型中的双系统system1和system2的分工 21:36 Apple GSM和Danny Zhou对于COT的分歧和争议 24:24 大模型无法做到过滤无关信息进行推理 29:04 大语言模型的物理学:一个小变量的改变能影响大语言模型的逻辑 31:28 大模型能抽象出数学中的定义吗? 37:22 学界和产业中目前AI agent是什么样的进展? * 提及 Scaling Law|涌现效应|Dualformer|Apple GSM|Danny Zhou|Allen Zhu Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets Yuandong Tian Dualformer: Controllable Fast and Slow Thinking by Learning with Randomized Reasoning Traces DiJia Su, Sainbayar Sukhbaatar, Michael Rabbat, Yuandong Tian, Qinqing Zheng Chain of Thought Empowers Transformers to Solve Inherently Serial Problems Zhiyuan Li, Hong Liu, Denny Zhou, Tengyu Ma Physics of Language Models: physics.allen-zhu.com * 后期:大奎
- 06.从图森的兴与衰聊起,CTO适合做公司一号位吗?对话零一汽车创始人黄泽铧
本期《技术不无聊》,我们邀请零一汽车创始人黄泽铧——被称为90后AI天才的新能源车企掌舵者——探讨“究竟什么样的人适合做技术公司的一号位”? 这是一个最好的时代,也是最艰难的时代,大量科技公司在面临“如何赚钱、如何自闭环”的问题,从技术到产品,从产品到市场,每无一不考验公司一号位的技术认知和资源组织能力,这些技术出身的创始人们,或补足能力冲上一号位,或倒在黎明到来的前夜。 究竟是什么因素影响CTO成为合格的一号位?带着这个疑问,我们访谈了黄泽铧,他曾是全球无人车第一股图森未来的联合创始人,却在自动驾驶最风光的2021年冷静离场。在如今这家公司黯然退场的背景下,黄泽铧已经早早回到国内再次起航,创办零一汽车,重注新能源重卡。就在今年4月,零一汽车的首代两款车型已经实现了量产与交付;6月份,零一汽车低调参加AI顶会CVPR国际自动驾驶挑战赛,斩获第二名好成绩,仅次于英伟达,这意味着零一汽车野心远不止于造车,或者说造车只是零一远景规划中的一环。 在与黄泽铧的交谈中,我们发现这位CMU机器人专业出身的公司一号位,除了对技术有极强的探索动力和拓展能力,在公司管理和用人经验上也有独到见解。 * 零一汽车 零一汽车是一家新能源智能重卡科技企业,致力于通过极致的新能源效率、极致的大数据运用、极致的自动化实现,驱动原生端到端自动驾驶软硬件技术开发与原生新能源智能重卡技术全栈自研两大核心业务,最终成长为全球领先的运输机器人公司。公司成立于2022年3月,由前图森未来联合创始人、工程合伙人、工程高级副总裁黄泽铧,与前三一重卡总经理、北京福田戴姆勒副总裁张红松联合发起成立,辰韬资本、天善资本、新宜资本、联想创投、Momenta、国发文鑫共同出资。零一汽车在江苏太仓、上海、北京、安徽芜湖、湖北十堰等地设立了研发与生产机构。 零一汽车1.0平台的两款产品“惊蛰”和“小满”已经于2024年4月全部实现量产。两款产品搭载的零一自研的“Matrix矩石”智能集成电驱系统、整车五合一热管理系统等核心技术皆为行业首创,使“惊蛰”与“小满”相较同类产品拥有更强劲的动力、轻1-2吨的自重、最低的能耗表现。 2024年5月,零一汽车发布了规模化、可量产的“水滴”冗余线控底盘系统,并首次公布了基于大模型的端到端自动驾驶技术ZSD。6月,在CVPR自动驾驶国际挑战赛上,零一汽车凭借纯视觉方案斩获端到端组别亚军,为自动驾驶的低成本、高效率解决方案提供了全新思路。 * 本期登场 嘉宾|黄泽铧:零一汽车创始人&CEO 主播|孟醒:五源资本合伙人,滴滴前自动驾驶COO,技术不无聊主播 * 内容索引 01:22 从知图科技到图森卡车的转型之路 04:10 自动驾驶卡车最大的技术瓶颈是什么? 05:18 自动驾驶卡车是一个安全系统,拼的不是长板而是短板 08:16 图森为什么能做到行业第一名? 18:27 问自己一个问题:高通能把自动驾驶做出来吗? 23:28 为什么图森会出现这么多失控的行为? 25:45 今天自动驾驶行业爆发的问题是资本进入过早带来的锅吗? 28:32 为什么抛弃自动驾驶转投造车? 34:44 创业意味着从解决问题的人变成定义问题的人 37:47 创业早期招人的时候不是劝大家加入,而是劝大家不要加入 44:46 在中国创业跟合作伙伴打交道:喝酒是一种获得信任的方式 50:21 增长是不是解决所有问题的方式? 56:11 大模型公司的一号位应该是什么样子? * 策划&后期:大奎
- 05.股价下跌9%,特斯拉后悔发布Robotaxi了吗?对谈Wayve主任工程师
北京时间10月11日上午11点,特斯拉举办了WeRobot发布会,我们本来都已经搬好小板凳抱着笔记本打算瞻仰这场技术盛会,结果多少有些令人失望——现场只是展示了它们的Robotaxi即Cybercab、无人驾驶货车Robovan以及人形机器人Optimus,并给到了一些时间线和基本面的描述,紧接着便是全场party。话说回来,内行看门道,炫酷的科技产品背后大多有些技术迭代的支撑,所以今天想跟大家聊的是,Cybercab也好、Robovan也好,还是调皮的Optimus也好,表象之下到底蕴藏着怎样的技术迭代?以及在如此花哨、层出不穷的发布活动中,我们还可以期待些什么? * 嘉宾 陈龙 Wayve Staff Scientist主任科学家 *Wayve 是原生端到端自动驾驶公司的代表,2024年获得10.5亿美金C轮融资,是最近2年自动驾驶行业之最,也是比尔·盖茨和孙正义最为看好的自动驾驶公司wayve.ai * 主播 孟醒 五源资本合伙人、滴滴原自动驾驶COO * 内容索引 7:50 We, Robot在美国版的横店举办,场景类似封闭测试场 11:18 为什么买Cybercab而不是Model3呢?家用车一车二用也许没那么合理 24:42 对外造型的吐槽:外观像Cybertruck,车顶和线条像Model3 26:48 Robovan大概是概念产品:巴士不是一种太好的商业模式 35:28 Tesla是在车辆上的成本是Waymo的十分之一/七分之一。 40:11 Wayve2017年开始做纯视觉端到端,在当时被认为十分激进 50:50 Wayve代表性产品Lingo视觉语言驾驶大模型 1:05:44因为数据量大,纯视觉会是未来自动驾驶和具身智能的主导性方案 1:11:36自动驾驶的端到端技术很难立即复用到机器人上 1:14:28Optimus机器人在发布会上的行动是遥操作的吗? 1:22:56为什么语言上的泛化被ChatGPT解决得很好了,机器人行动上的泛化却很难被解决? 1:32:27人的需求和机器人的发展会逐渐靠拢 * 提及 Lyft | Wayve, Lingo, Gaia | 世界模型 | 理想双系统 | VLA模型(视觉-语言-动作模型)| VLM(视觉语言模型)| Mobile ALOHA | Real-time Game Engine * 节目制作 大奎
- 04.重新认识一下,我是孟醒,刚离开自动驾驶回VC
孟醒:一个月前,我离开工作5年的滴滴自动驾驶,暂别耕耘8年有余的自动驾驶行业,接下来我将在五源资本开启下一段技术与商业的探索。本期做客《张小珺Jùn|商业访谈录》的播客中,我们一同梳理了自动驾驶从创投到爆发的各个关键节点,并复盘这场尚未结束的“技术革命”对今天科技行业带来的启示;此外,我也认真思考并回答了“为什么重回VC”这个灵魂拷问,以及如何看待投资人和创始人这两种身份间的转换。 * 嘉宾 孟醒:五源资本合伙人、滴滴原自动驾驶COO、《技术不无聊》主播 * 主持人 张小珺:腾讯新闻作者、《张小珺Jùn|商业访谈录》主播 * 内容索引 2:14 2016年加入顺为,AI还是个小众投资赛道 6:50 2019年加入滴滴成为滴滴自动驾驶COO,管理1000人 8:16 离开滴滴回到VC,推动早期公司的创造和孵化 11:25 投资人?买方?卖方?FA?不希望用这种身份定义自己 13:10 当行业出现“反共识”时恰恰是我觉得做事情最舒服的时候 15:51 成长往事 17:40 为什么中国的孵化器不够好? 23:55 投资小鹏汽车:他们讲了一个逆投资人心态的故事 28:24 天使轮1亿美金以上的公司后期成功概率更低 33:34 为什么自动驾驶行业在2016-17年的时间段在投资圈火了? 47:34 自动驾驶领域没有专业人才 51:22 自动驾驶行业发展到今天,意料之外的事情是什么? 59:32自动驾驶从创投阶段到爆发,对今天的大模型行业有什么启示? 1:07:26 未来十年出行行业会有怎样的大变局? * 相关链接 E02.特斯拉即将发布Robotaxi,聊一聊FSD是否会演化到全无人驾驶? E03.在美国坐了4个月无人车,我认为自动驾驶不存在GPT时刻
- 03.如何量化OpenAI o1的骗钱能力?被科技媒体集体忽视的官方白皮书给了答案
OpenAI o1推出两周有余,市面上大多数讨论聚焦于其推理能力的优越性,也有一小部分声音质疑模型能力越来越强是否意味着更大的威胁?大多数质疑停留在无限推理之后的科幻化灾难场景,然而事实上,OpenAI早在模型发布之时,也同步释放了针对模型各类潜在威胁做出的测试白皮书“o1 System Card”,这期播客我们为大家深度解读这份白皮书,在缓和担忧的同时,也从客观的角度理解模型的能力的上限与不足。 这不是一期鼓吹OpenAI如何做的好的内容,我们尽可能将未被关注到但十分有价值的分析呈现出来,试图打破大模型领域信息的藩篱。 * 时间线 1:37 System Card白皮书具体是什么,它的受众是谁? 4:19 推理能力的加入使得模型更聪明,更好的服务意味着更好的欺骗 6:17 围绕结果的评估维度:不允许内容、越狱、幻觉、偏见 13:17 思维链过程性评估 18:19 外部红队攻击:评估AI抵抗越狱的能力 21:54 外部机构Apollo research专注“AI是否会欺骗人类”研究 28:01 外部机构METR对模型自动化能力的测试 30:19 OpenAI推出Preparedness Framework,测试模型的信息安全、CBRN、劝说能力Persuasion和模型失控Model Autonomy 53:04 MMLU(Massive Multitask Language Understanding)在多语言中测试大模型的准确性 * 提及 COT(Chain of Thought)| Ilya Sutskever Super Allignment | 夺旗比赛Catch the Flag | Theory of Mind | CBRN(Chemical, Biology, Radiology, Nuclear) | 模型自制Model Autonomy | BBQ Bias Benchmark for QA | European Nucleotide Archive | MMLU(Massive Multitask Language Understanding) * 相关引用 assets.ctfassets.net * 制作剪辑 大奎
- 02.在美国坐了4个月无人车,我认为自动驾驶不存在GPT时刻 | 串台商业访谈录之二
孟醒:过去8年,我一直从各个维度深入参与了自动驾驶的行业,先后投资了小鹏汽车和Momenta等自动驾驶公司,2019年成为滴滴自动驾驶COO,见证了这项技术从实验室阶段到小范围路测到一定规模的运营。 在串台《张小珺Jùn|商业访谈录》的第二集内容中,我和小珺深入聊了聊我见证的无人驾驶的发展历程,从自动驾驶的学术争霸、到行业实践再到当下竞争格局,这即是一次商业访谈,也是对这一技术发展的梳理与反思。 嘉宾 孟醒:五源资本合伙人、前滴滴自动驾驶COO、《技术不无聊》主播 张小珺:腾讯新闻作者、《张小珺Jùn|商业访谈录》主播 时间线 01:00 区别于特斯拉FSD技术路线的Waymo 03:30 DARPA Grand Challenge和自动驾驶的历史 04:30 重新梳理自动驾驶的历史 13:24 Waymo负责人连连换届 21:59 在凤凰城不断体验Waymo无人车 37:32 Cruise陨落始末 46:56 Cruise和Waymo风格对比 50:50 Waymo的长期主义 51:49 探索类前沿科技是否需要大公司支持? 56:42 Uber退出自动驾驶竞赛 58:19 L4的其他玩家:Aurora和Zoox 提及 Sebastian Thrun | Chris Urmson | Anthony Levandowski | John Krafcik | Tekedra Mawakana | Dmitri Dolgov | Saswat Panigrahi | Kyle Vogt | Dan Ammann DARPA Grand Challenge | AlexNet
- 01.特斯拉即将发布Robotaxi,聊一聊FSD是否会演化到全无人驾驶? | 串台商业访谈录之一
孟醒说: 过去8年,我一直从各个维度深入参与了自动驾驶的行业,先后投资了小鹏汽车和Momenta等自动驾驶公司,2019年成为滴滴自动驾驶COO,见证了这项技术从实验室阶段到小范围路测到一定规模的运营。 上周,我结束了这段作为从业者的经历,将转换身份再次回到风投行业做一名前沿科技投资人,在这个档口我应邀做客《张小珺Jùn|商业访谈录》分享关于自动驾驶行业里的重要命题,我将从自己的一线经验尝试回答并深入探讨这些问题。 嘉宾: 孟醒:五源资本合伙人、前滴滴自动驾驶COO、《技术不无聊》主播 张小珺:腾讯新闻作者、《张小珺Jùn|商业访谈录》主播 时间线: 1:25 孟醒的学习经历和从业经历 8:22 自动驾驶行业中的信息不对称 11:17 辅助驾驶的产品中期,无人驾驶的Pre-A 21:10 试驾特斯拉FSD不同版本的感受 33:12 L2和L4不同的产品体系与目标 42:54 端到端技术路线的热情与争议 52:10 V12不是辅助驾驶里的ChatGPT时刻 55:46 特斯拉自动驾驶的技术演进史 01:11:43 端到端是自动驾驶的终极大杀器吗? 01:17:32 复刻特斯拉FSD需要多少钱?