

77.有关智元、觅蜂的愿景与野心,和具身智能的竞速之旅|与姚卯青的对谈2026 年,具身智能成为了聪明人扎堆、资本热潮近乎疯狂的行业。这条热门赛道中,智元机器人是最早的百亿俱乐部成员之一。 在人形机器人出货量狂奔的路上,智元的野心并不止于“具身本体”的军备竞赛。今年,他们做出了一个让全行业瞩目的反哺举措:将旗下的核心数据资产彻底剥离,独立孵化了全球领先的一站式物理 AI 数据服务平台——“觅蜂”。 本期嘉宾姚卯青,不仅是智元合伙人、具身业务部总裁,也兼任觅蜂的董事长兼CEO。这期播客在五月觅蜂发布会后录制,或许是有关智元战略的,最深入完整的一次访谈。 (本期视频的微博开屏页,欢迎前往微博等平台观看视频版~;也欢迎前往公众号,查看「漫谈Light the Star」访谈的文字版~) 从Waymo到蔚来再到智元,姚院亲历过自动驾驶从概念到量产的全过程,他说“今天的具身智能连GPT1都没到”,而机器人离真正涌现智能,还差一亿小时的数据。 本期嘉宾: 姚卯青(智元合伙人、通用业务部总裁, 觅蜂董事长兼 CEO) 本期 Shownotes: Part 1. 02:40 关于姚卯青:从清华电子系到南加大,从 Waymo到蔚来 * 「人间清醒」与「顺势而为」 * 清华电子系的系统训练:电路、通信、信号处理、计算机视觉、编程和算法,都是自动驾驶和具身智能的底层能力 * Google Display Ads 团队:计算机视觉、NLP 与 Transformer * 内部转岗 Waymo:可能是当时全球最难的面试 * Waymo 的三年: Robotaxi, 从技术 demo 走向商业化运营 Part 2. 17:28 蔚来的量产课:激光雷达、车规体系和数据飞轮 * 为什么选择蔚来? 「单平台、全标配」的产品策略,激光雷达、4K 相机和高算力硬件一体的统一底座 * 蔚来李斌:「被人骂也是被记住的一种方式」——做关键决策需要勇气 * 多模态融合感知、激光雷达感知、BEV、Occupancy Network、AEB …关于自动驾驶的种种 * 选择回国:相比 Waymo 的几百辆 Robotaxi,国内乘用车百万级保有量所带来的数据分布和 corner case 密度,是完全不同的飞轮 * 量产经验到底是什么?「不是把样机多复制几台,而是项目、研发、测试、供应链、质量、版本和数据闭环的组织能力。」 * 能迁移到机器人的是什么?异常数据回流、模型迭代和现场版本下发 Part 3. 28:31 当自动驾驶派进入具身:优势不是算法,而是底座 * 自动驾驶派进入具身智能,最大的价值是理解强电系统、供应链、质量、量产和底层软件稳定性 * 机器人和车,在电子电气架构、操作系统、中间件、传感器输入到电机控制等底层工程上高度相通。 * 车就是最简单的机器人?「有点牵强」 * 在很多低速场景中,机器人反而更有机会部署 VLA、世界模型等前沿模型 * 真正稀缺的人才,不只是刷榜或发 paper 的人,而是上手修过 bug、和硬件软件都打过仗、能把复杂系统跑稳定的人 * 具身创业的三大派,都有不可替代性 * 机器人终局架构不会只是「快慢系统」两层,可能包含: 1000Hz 底层控制、10 到 20Hz 动作规划、1 到 2Hz 阶段目标规划,以及更高层的 Agent 长程推理。 Part 4. 35:19 讲「基模」太早了,具身连 GPT 1 都没到呢! * 「2026 年了,具身智能到底到 GPT 几了?其实 1 都没到呢」 * 「现阶段的真机数据量,和真正支撑基座模型涌现的数据规模,还差四五个数量级」 * 很多公司强调自己做「具身基模」,是借用了大语言模型时代的资本叙事 * 今天的具身更像 Transformer 和 BERT 早期,而不是 GPT-3 之后 * 数据的关键不仅是「量」,还包括信息维度、场景种类、失败样本和真实部署中的边界样本 * 多模态融合是必然趋势,视觉远远不够 * 真正的瓶颈不是算法是否足够聪明,而是真实世界数据的量、模态、场景和失败样本远远不够 Part 5. 49:59 有关智元最完整的战略揭秘:一家 AI 公司,而不只是机器人公司 * 神秘的邓泰华其人 * 智元Day 1 定位成 AI 公司,而非单纯的人形机器人公司 * 人形机器人是把 AI 带入物理世界的必要载体,但不是终点 * 「智元确实是这个行业里最有野心的公司之一」 * 智元的组织架构、融资节奏与股权激励 * 具身公司的长期价值不只在本体硬件,而在能否把「本体、数据、模型、场景」做成闭环。 * 精灵 G2 所经历的完整 IPD 流程:接近 9 个月 * 机器人行业的需求峰谷比汽车更剧烈 * 工业不相信眼泪,最终都是 ROI:「」工业客户不关心你是人形、猴形还是狗形」 * 智元的「358 战略」:从量产、商用到部署 * 具身智能最终不是单点技术竞赛,而是系统工程。 * 当技术路线逐步收敛、场景开始渗透时,先把 90% 的体系能力构建好,才可能真正承接行业机会。 Part 6. 01:55:26 VLA、世界模型和机器人数据飞轮 * 智元的 AI 研发体系:模仿学习、VLA 预训练、世界模型、强化学习后训练和数据闭环 * Google PaLM-E :VLA 来自语言模型和多模态语言模型向物理世界的迁移 * 世界模型更像对物理规律和状态转移的数字化、神经网络化描述 * 「VLA 和世界模型都不是最终形态,未来更可能是分层架构」:前̶者̶受̶限̶于̶语̶言̶和̶动̶作̶之̶间̶的̶表̶征̶鸿̶沟̶,̶后̶者̶仍̶更̶多̶来̶自̶二̶维̶视̶频̶和̶第̶三̶人̶称̶视̶角̶ * :̶语̶言̶推̶理̶、̶物̶理̶预̶测̶、̶低̶层̶控̶制̶、̶长̶程̶规̶划̶和̶数̶据̶飞̶轮̶共̶同̶工̶作̶ * 世界模型的价值在于学习液体流动、玻璃破碎、软体形变等真实物理规律 * 「后训练和失败数据非常关键」 Part 7. 02:08:49 觅蜂:具身版 Scale AI,机器人数据界的「滴滴」 * 投资人的主意:对标上一轮 AI 时代的 Scale AI ? * 具身数据生意比传统数字世界标注难得多 * 2026 :具身数据军备竞赛年 * 模型的差异化暂时不大,数据会是分水岭 * 打造一个公共性质的数据服务平台,一个「阳谋」:客户花钱带来数据需求,平台用数据训练模型,模型再反哺采集、预标注和质量管理效率 * 数据问题都没解决,讲基模预训练、后训练,都是空中楼阁 * 高质量数据的第一点是真实:场景和任务必须足够丰富,能够覆盖生活和生产中真正会遇到的问题 * 规范:相机曝光、画质、设备同步、轨迹重建精度、操作流程都要高标准 * 「脏数据」不是质量差的数据,而是包含失败、偏移、纠错、重新规划和最终成功的多样化数据 * 仿真数据并不天然低价值 * 关键不是流派,而是任务、场景、成功率要求和模型使用方式 * 数据的价格、产能和全球化 * Deepmind 和 Genralist:「如果数据是具身智能竞争的唯一决定变量,中国公司现在就可以宣布他们是赢家」 * As many as possible, as soon as possible(越多越好,越快越好). Part 8. 02:43:43 从数据标准,到 G3-G4 中间态 * 好的数据标准会逐步收敛 * 即使不同机器人硬件不统一,很多数据仍可以被抽象为通用表达,如末端执行器轨迹、二维帧序列、物理状态变化等 * 机器人行业的安全和质量准入标准,会在两到三年内伴随大规模商用逐步出现。 * 从 G1 到 G5 ,当前行业大约处在 G3 到 G4 的中间态 * 预计 2027 到 2028 年行业有希望达到 1 亿小时级数据规模 * 真正类似语言模型那种涌现能力,还需到 1 亿小时级高质量数据出现 Part 9. 02:54:42 最期待的画面:机器人第一次让人觉得「觉醒了」 * 机器人出现真正的 aha moment:不再只是从画面到动作的肌肉映射,而是能在复杂环境里自主规划、理解指令、做出响应 * 涌现时刻大概率发生在实验室,而不是工厂 * 数据会成为这一轮智能化转型关键基础设施,但它比算力更难获取 加入听友群⬇️
76.与 00 后创业者源培的访谈:从 RoboMaster 到李飞飞实验室、两次「全球首次」,与自由快乐的非标人生AI 原生一代,将写下怎样的新故事。这是这一轮 AI 浪潮以来,投资人们最关心的问题。 今天的访谈嘉宾,是 00 后具身创业者,陈源培。 他曾在斯坦福李飞飞的实验室,实现了全球首次双臂长程灵巧操作,以及全球首次「用人类数据训练机器人双臂灵巧操作」。 土木工程本科出身的他,高考前一天还在打游戏,却通过 Robomaster的比赛结缘机器人,并跨界师从北大强化学习专家杨耀东,成为强化学习的前沿学者,继而进入斯坦福李飞飞的实验室,做出全球首创的成果。 相比「天才少年」叙事,这期更值得品味的,是一个一再印证,学习没有固定范式、创新没有标准答案的故事。以及开放、多元、包容和谦卑的学术品味与视野。 无论游戏、RoboMaster、科研,在源培那里都有一条共同线索:它们都像升级打怪,靠快速学习、持续探索和反馈提升能力。希望其中的思考方式,能给大家启发。 (本期视频欢迎前往 b 站、视频号、小红书、Youtube 等平台观看~) 本期嘉宾:陈源培,灵初智能联合创始人 本期 Shownotes: 02:51 从游戏到 RoboMaster:工程能力从系统里长出来 * 高考前还在打牌的 00 后:通宵打游戏,差点被选去电竞青训 * 父母最大的影响是「完全不管我」 * 大疆 RoboMaster 冠军:机械、电控、嵌入式、上位机、控制、算法…训练的是复合能力 * 深入代码底层,不会并不是一个门槛 * 机器人并不是单点算法问题,全栈系统思维是稀缺的 * 工程性的东西,更多看的是细心程度与快速学习能力 * 俄乌战争给源培的「觉醒」——突然觉得发 paper 、抠创新点,对世界没什么帮助 16:41 师从杨耀东,最早 Isaac 使用者与并行仿真 * 师从强化学习知名学者杨耀东,用强化学习做灵巧手 * 零帧起手强化学习 * OpenAI 的 Shadow Hand (2019)的解散,强化学习解魔方——酷但昂贵 * 「我是英伟达 Issac 最早的使用者」「那个版本应该绝版了」 * 「未来用 GPU 做仿真,一定是大势所趋」 * 首篇论文即震撼行业:高自由度操作可以在大规模并行仿真中训练出来 35:05 强化学习 vs 模仿学习,什么是训练直觉? * 强化学习的峰回路转:监督学习和模仿学习的短期效果让强化学习一度被质疑;直到O1 等方向又重新证明了强化学习的价值 * 模仿学习见效快,但泛化弱;强化学习潜力大,但极吃 Know-how * 模仿学习不是未来 * 从人手中心到物体中心:描述物体轨迹如何变化,让机器人知道大致目标,再在小范围里探索 * 奖励不需要把每个动作写死,需要留有空间任 AI 自己探索 * 真正的系统能力是「方法都告诉你了,但你调不出同样效果」 * 我训强化学习还挺厉害的:「基本上大家以前都看曲线,只有我是打开仿真,盯着机器人学习。」 43:37 进入斯坦福李飞飞实验室:从强化学习中心主义,到多元的学术视野,与技术地图 * 每条路线都有价值,未来更可能是吸收各自优点的融合过程 * 更开放的研究氛围:连接图形学、灵巧手、模仿学习、人类数据 * 师从 Karen Liu :把机器人操作、动捕、人类数据和仿真强化学习连接起来 * 不要太 Ego,不要靠形容词证明强,让结果本身说话 * 一周可以水一篇顶会的代价是放弃自己其他可能性 * 「从斯坦福回来后,他像变了个人一样」 50:51 跳出舒适区 + 螺旋上升的具身技术史 * 具身技术发展的螺旋:抓取→ CV+模板 → 直接学轨迹(模仿)→ 人遥操太慢 → 强化学习自己探索 → 仿真效率低→ Isaac Gym 并行仿真+Sim-to-Real → Sim2Real Gap 太大→ 软体场景模仿学习反超(Diffusion Policy/ACT)→模仿学习也不够→ 后面接强化学习→世界模型起来后,又回到仿真训 RL * 灵巧手最大的价值,不是因为它像人,而是因为它最容易吃下人类操作数据 * 与夹爪或专用末端执行器相比,五指手和人手之间的 Embodiment Gap 更小,更适合做 Human-Centric 数据采集 * 「以物体为中心」的通用表征:操作的本质是让物体沿某条轨迹发生变化,而不是复刻人的每个关节动作 * 具身 Scaling Law 的核心可能不在遥操数据,而在人类日常操作数据; * 硬件形态本身会决定能吃下什么样的数据 * Sequential Dexterity 的祛魅:学术需要 novelty,这没太大意义 58:26 仿真派的价值和上限 * 我曾经就是个仿真派 * 仿真无法根本解决真实世界复杂交互,尤其在软体、碰撞、接触和高精度成功率方面 * 可微仿真和世界模型都试图缩小 Sim2Real Gap,但目前仍受限于算力、图形学、物理交互和数据量 * 仿真 vs 真机,谁快?仿真的场景 Scaling 能力未必比真实世界快 * 仿真可以做出很 Fancy 的 Demo,但不是当前可见的终局 * 如果世界模型足够强到生成全场景仿真,它本身也需要先吃下海量真实数据——如果做出了世界模型,那肯定先做出了好用的 VLA * 一个研究者最重要的能力不是在舒适区里把"已经会的事"做得更深,而是逼自己跳到不熟悉的方向;这一点反人性反惰性,因为你在擅长的方向也确实有想探索的东西 01:17:02 具身 Scaling Law 会撞上硬件问题 * 具身 Scaling Law 的核心问题是数据,单靠遥操数据很难堆到足够规模 * 百万小时级别的人类中心数据,至少能让行业看到一些效果 * 「我是实用主义派」 * 与语言模型不同,具身智能会遇到硬件差异:不同手、不同本体、不同自由度都会影响数据和模型泛化 * 跨本体泛化的关键,是提取人类操作中通用的信息,再用强化学习补足机器人具体关节、力和接触细节 * 语言模型可以在统一的 token 空间里 Scaling,具身智能必须同时解决数据规模和硬件本体差异 01:22:12 创业后的路线选择:先坚定,再快速调整 * 2024 创立灵初时,市场上很少有人强调灵巧手操作和强化学习 * 择做长程灵巧操作、强化学习、人类中心数据和双手路线,对于一家创业公司,是信仰和耐心的考验 * 要去做别人做不到的事 * 当前的路线没有不能复刻的,都不够本质:但仍然保持灵活,可快速调整 * 具身创业的难点是同时平衡商业化和预研,短期场景可以做,但公司不能忘记自己到底是不是模型公司 * 「你不能有包袱,最后还是结果说话。」 01:38:04 世界模型、VLA 和算法口号的泡沫 * 灵初的具身大脑是糅合路线:硬件、采集、数据处理、模型训练和部署,形成端到端闭环 * 模型架构和口号本身不是护城河 * 广义 VLA 只要输入视觉和语言、输出动作即可 * World Action Model 也只是增加未来帧预测等辅助监督 * 单靠改模型架构、模块连接方式就带来突破性变化,我认为这几乎是不可能的 * 真正重要的是训练范式、数据规模、数据质量和完整 Infra * 马斯克为什么不喊世界模型——世界模型本身不产生价值,真正产生价值的是它能否在具身、能源、航天或其他真实任务中解决问题 * 具身行业的泡沫:太多人说的和做的不一样,一些投资看不太懂 01:45:05 主动世界模型:从数据里选择有用信息 * 关于「主动世界模型」的思考:机器人需要主动判断哪些信息有用,哪些是噪声 * 世界感知分成客观世界规律、主动选择机制和自身 Policy 三层,其中最缺的是中间那层主动选择 * 数据 Scaling 不是无脑加数据,低信噪比数据可能损害模型能力 * 我是实用主义:脑科学、神经元结构、主动世界模型等想法都可以借鉴,但必须通过效果验证 * 具身下一阶段的底层创新:可能不是继续堆模块,而是找到类似语言模型 next-token prediction 的训练范式 02:03:15 「我的人生,绝对不可能不快乐!」——兴趣、非标与系统性思维 * 不要害怕环境、专业或起点带来的限制,去做自己真正感兴趣的事 * 机器人人才,最重要的三点:追求卓越、系统性思维、不要太 Ego * 「再垃圾的 paper,也有你可以学习的点!」 * 「我追求的是影响力,对真实世界产生价值的影响力」 * 未被验证的人才和未被验证的路线,可能写下真正的突破 加入听友群⬇️:
75.登顶大摩全球人形机器人报告,灵初凭什么代表中国?|与创始人王启斌聊「灵巧操作」2026 的上半年,中国资本市场围绕具身进行了大规模的布局,将具身大脑这个赛道推向了前所未有的热度。 这期的嘉宾灵初智能,刚刚登顶了摩根士丹利最新发布的《全球人形机器人研报》,它被视作中国具身大脑阵营的核心代表之一。从灵巧操作出发,这条大脑路线直指智能的上限。 创始人王启斌是 70 后产品背景,乔治华盛顿大学博士,完整经历了"智能设备 → 移动机器人 → 具身智能”的三次范式更迭。 我们的访谈不仅涉及到大量具身行业的真实进展,也描绘了在具身这个早期行业中,从研发(R)到工程(D)到产品(P),所谓 RDP 的全流程。 2024 年,70 后王启斌,和80 后算法老兵柴晓杰、 90 后北大学者杨耀东、00 后天才少年陈源培,组成了灵初智能这支具身“7890 战队”,成为这个行业背景最豪华的团队之一。 (本期访谈的视频版已经登录 B 站、视频号、微博、小红书、Youtube 等平台,欢迎前往观看~,文字版可前往公众号「卫诗婕 漫谈 Light the Star」) 本期嘉宾:王启斌(Viktor)· 灵初智能创始人 本期 Shownotes: Part 1. 00:00-08:56 让机器人「动手」,为什么是皇冠级的大脑问题? * 灵初是谁? 被摩根士丹利视作中国大脑核心代表,灵初是谁? Hugging Face 上 1000 小时多模态数据集下载量第一 希腊字母第 23 个 Psi(Ψ),意指强化学习,「像孩子一样在环境中交互、逐渐长大」 为什么做大脑的公司普遍估值更高? * 什么是通用灵巧操作?为什么说人类操作数据是一座富矿? 操作的三种能力:对任务做长程语义分解(规划)、手眼协同、实时纠错 人类能力的演进顺序:行动最早(灵长类)、视觉次之(寒武纪)、语言最晚——而机器恰好相反 机器人不一定像人类那样大脑/小脑严格分开,目前没有完美的大小脑结构能拟合类人能力 夹爪很难做类人复杂操作 操作知识不具备可传承性——如何把人类经验挖出来变成可训练的数据,是具身要回答的根本问题 Part 2. 08:56-20:04 Why now:具身浪潮,周期与淘汰赛 * 2026,具身为什么更热了? 「新的浪来了」:过去几波范式不会持续这么长 why now 的底层:具身是真正回到物理世界的问题 具身的市场,只会比智驾更大:上一波公司的顶点,可能是下一代公司的起点 跑完一个 cycle 约 7 年:至少会有三轮淘汰赛 * 关于王启斌:黑莓vs苹果,一个产品老将经历的范式更迭 黑莓曾是全球唯一净利率 25%+ 的公司(另一家是苹果) 从苹果开始,ToB/ToC 没有绝对分割 什么是苹果真正的胜负手? 新世界物种对旧世界的降维打击,是如何发生的? 「站在旧世界的人不用 complain,这就是宿命。」 「当年带 Sonos 全球 CEO 见百度陆奇,是我的心结」 什么样的 ToC 产品能击穿 ToB?苹果做到了。具身领域有机会吗? * 20:04 中美硬件之争,穿越周期的产品经理,与审美 审美的物质基础:Jony Ive 的设计传统在英国,小米设计领导人传统在德国,消费电子审美在欧洲 Sonos 和 B&O ——两种产品哲学 小米生态链/IoT 兴起(2015)后,中国消费电子工业设计的崛起&底层:从整机到核心零部件的全链路掌控 + 快速迭代 Part 3. 中美硬件之争,两代机器人公司,谁会赢? * 「美国大脑领先、中国硬件领先」,人们只看到了轨迹的起点 为什么从泛化性居中、节拍较低的物流和服务业 toB 切入 5 年内「只做模型不做硬件」是伪命题——具身现处于软硬深度耦合阶段 落地两种形态:固定上半身、可移动+上半身——两种构型,训同一个模型 具身的数据飞轮和车完全不同——车有存量市场,具身去年头部出货才 5000 台,飞轮必须靠人类数据冷启动 * 上一代自动化机器人 vs 具身新秀派,谁会赢? 上一代移动机器人靠 SLAM(2015 前后)和基于规则的技术,深耕单一场景;当下具身解决更复杂的操作问题,用 learning base 的学习范式,人才完全不同 三个顶层问题:解决什么问题、用什么技术路线、什么样的人才; 创新者诅咒:成熟公司有自己的场景循环,可能恰恰是负担 仓储物流、无人配送领域,全是创业公司赢了(海柔、极智嘉、新石器)——阿里、美团、京东,为什么都落后了? 「原来真的是书上得来终觉浅……谁有场景谁赢,是个错误。」 Part 4. 灵初的成立:7890 战队 & 科学家创业潮 横跨中美,花半年时间找科学家: 国内能做灵巧操作的不超过 10 人 如何判断科学家是否适合一起创业? 在斯坦福李飞飞实验室的 00 后联创:强化学习,将人类数据迁移到灵巧操作的 Sim2Real 「7890 战队」:为什么具身需要的人才跨度大?跨代际和领域的融合难度? 怎样治理一个软硬数据耦合的复杂组织? 为什么「量产那套」不完全适用于具身大脑研发? AI 时代,为什么强调「治理」而非「管理」? 硬件派 vs 模型派的路线分野:从硬件出发(做到稳定便宜规模化,特斯拉思路)vs 从模型和数据出发(用优质数据训模型,灵初思路) Part 5. 01:01:06 具身数据的真问题,与中国的另一种叙事 * 可规模化预训练的优质数据长什么样?数据管线怎么做? 算力、数据手套与数据飞轮:灵初的真实数据方法论 什么是检验真做大脑 or 水货大脑公司的金线? 数据洞察:手的 3D 关节角精确度 > 触觉 > 2D 照片; 全模态数据,比纯第一人称视频更精确丰富 行业最大的10 万小时手部多模态数据怎么来? 数据管线 = 数据处理平台(审核、标注、处理)+ 进训练框架训模型 + 模型反馈 +抽象出数据洞察 * 具身数据乱象:已经出现一些空置的数采场 没有模型需求方牵引,数据采集一定是无序、低效、垃圾场级别的 只有真正在训模型的大脑公司,才有资格定义「需要什么数据」、才能分辨「什么是 garbage」; 「投资人最后看的是这道菜到底怎么样,他并不知道这道菜里头真正用了多少调料。」 * 具身大脑看美国?中国有机会做出好大脑吗? 中美数据成本差约 10 倍,低成本 + 多样性是中国的机会 关于派(Pi):证明了真实数据在夹爪上能泛化,验证了真实数据路线 现在远没到具身的「ChatGPT 3.5 时刻」:非结构化环境的通用还很漫长,但「专注一个 domain 」的通用是可以做出来的 灵初的双模型架构:R 是策略模型(输入图像/语言/本体状态,生成动作);W0 是世界模型(像真实世界仿真器,评估动作后的状态,用强化学习优化、放入约 30% 纠错失误数据),两个模型串成闭环,再回流生成新数据集 主流架构(Transformer)能不能成为绝对垄断架构,还需数据验证——Transformer 是在 GPT-3.5 之后吃掉巨量数据、加上强化学习才被验证的;具身底层架构的有效性,同样要靠足够的数据来验证 Part 6. 01:22:54 「游戏才刚刚开始,第一轮淘汰赛都还未开始。」 * 具身大脑公司,怎么做? 大模型&后训练人才:创业公司怎么和大厂抢人? 最难的事怎么解决?——「没有失败过的成功,是不可信的」 为什么拒绝把灵初定位为一家「AGI 公司」? 通用灵巧操作是技术通货:「未来我们甚至可以不做机器人」 AI 时代的产品经理有三个圈——懂技术、懂 UI(用户交互)、有商业思维 * 从 R(research),到 D(Development),到 P(Product)——如何在一个大组里快速迭代? 选场景必须同时满足两个条件:有真正商业价值的共性痛点(应用面广)、且符合数据泛化性需求 进工厂的事故责任:作为供应商有协议要负责,高节拍流水线很难,流水线下的供料等场景可跑通; 「具身这个行业早已被客户簇拥」 「曲线已开始跑但还没到真正拐点」「今年底是模型泛化性的第一个验证阶段」 基于数据量的模型迭代军备竞赛已开始,周期 3 年以上 「百万小时数据是我们最早提的,现在所有人都这么说时反而要警惕」 Part 7. 01:53:30 一个 70 后创业者的务实 & 浪漫 * 创业是冲浪还是西西弗斯:不存在"走到某阶段就彻底释放",过程本身才最重要 * 「某天清晨阳光斜照在 logo 墙上的一瞬间」 * 真正的中年危机:40 岁时,最怕未来与自己无关 * 「我最讨厌被叫老板」 * 我强烈推荐你去读摩根·豪泽尔的《Same as Ever》 * 创始人的基因(vision/mission/经历)真正决定了公司的路径 * DeepMind 哈萨比斯押注 AlphaGo 做出世界级成果,却 miss 了大语言模型;OpenAI 以"安全/非营利"起家,最后一批人出走创立 Anthropic——同一场 AI 史诗里有各种活法 加入听友群⬇️ 如果你是具身领域的专业 researcher ,欢迎添加主播微信(SJ_Jelyne).
74.与地瓜、阿里云的访谈:机器人爆发前夜,工程师成长,与 AI 的第三朵云回看历史,人类信息化的每一次范式转移,都有着相似的规律。移动互联网时代的真正到来,并不是因为第一代智能手机的组装下线,而是因为 iOS 和安卓生态的建立、云基础设施的普及,才让千千万万的独立开发者能够以极低的成本创造出改变世界的应用。 开发者成群涌现的前夜,往往是奇点到来的钟声。 今天的嘉宾,正是为这场范式革命加速的具身基建创业者。地瓜机器人的基础设施研发负责人秦玉森,以及阿里云无影事业部总经理张献涛博士。 秦玉森有着 20 多年的机器人开发经验,也是一名成熟的技术管理者 。在这一轮具身革命中,他与地瓜机器人,致力于打造机器人行业的母生态。 张献涛博士则亲历了移动互联网时代,云生态的建立。这期节目中,他清晰地讲述了,云计算,将如何成为撬动整个具身商业社会的超级杠杆。 这期内容不仅包含大量机器人的硬核技术,更是一部关于技术、人才以及基建变迁的微观商业史。 本期嘉宾: 秦玉森 - 地瓜机器人的基础设施研发负责人 张献涛 - 阿里云无影事业部总经理 本期 Shownotes: Part 1 . 03:06 机器人之梦 2000 年前后的机器人竞赛 九号收购赛格威机器人之后 北有九号,南有大疆 Part 2. 11:04 工程师的黄金年代 工程师的职业发展启示 & 工程师如何改变世界 技术管理挑战:《人月神话》 从工程师到架构师:认知从线性变立体 Part 3. 22:18 拐点已至:机器人爆发前夜 何为「战略节奏」:需求牵引出结构洞 自动驾驶与具身的人才大战:两个行业的前世今生 大模型降低工程师门槛,晶体智力 & 流体智力 实干家、具身三大派创业与各自的职责 机器人的美在于不完美 Part 4. 35:25 AI 时代的第三朵云:打造机器人的母生态 过去,机器人开发有多难:从重装电脑开始 中国STEM教育领先,小学生玩机器人很常见 什么是机器人的空气、土壤和水? 具身的「重复造轮子」:资源饱和溢出 为什么 Infra 人才特别稀缺? Part 5. 51:27 具身智能融资战 & 场景之战 资本泡沫可以让这个行业快速试错和试对 共识会极速形成 2025 每月的技术进步,快于过去的每一年 工程师培养,从 8 年压缩到3 年 年轻人脑子里的噪音更少,跑得更快 Part 6. 01:10:41 云的变迁 从云计算,到终端智能云计算 阿里云往事:All in 无线,关键一役 机器人时代的第三朵云,长什么样? Part 7. 01:24:02 AI 时代,云架构重构,Agent 与阿里的 TokenHub 什么是 Token 经济?阿里巴巴为什么要组建 Token Hub? 云上输出 token,独立开发者可推动浪潮 当 token 资源不再稀缺,大模型时代爆发期也将过去 Agent 加速机器人自进化,机器人在「做梦中」实现进化 养虾是养一群虾:必须是智能体群协作 Part 8. 前夜:开发者爆发、AI 原生代与利他生态 技术、终端和开发者工具的普惠体系 加入听友群⬇️
73.【520 特辑】AI +爱,赢了!|与黑客松冠军夫妇的随兴访谈这是一期5·20特别节目,嘉宾是前不久举办的小红书黑客松大赛的硬件组冠军得主:一对用 AI Coding 和动手能力,实现了用意念控制轮椅的年轻夫妇。 2020年10月,肥牛在婚礼的答谢宴期间出现放射性剧痛,之后被确诊为脊髓占位,一种极其少见的脊髓肿瘤。在这之后,他经历了两次手术,并在第二次手术后出现瘫痪症状。 他说, 「人在一定程度的痛苦之下,那个痛苦是压制不住的;」「当时如果说给我一个按键,左边是生,右边是死,我已经按了很多次死的这个按键了」 经历了六年多的康复,肥牛通过坚持运动恢复了一定的行动能力,目前可以短距离行走,长时间仍需依赖轮椅。 从自身和脊髓受损人群的需求出发,他们与一群AI,合作实现了用脑机信号指挥轮椅前进的创意和demo。这个项目,成为黑客松大赛当晚,获得最多掌声的项目。 我在黑客松的第二天,与香菇肥牛夫妇录制了这一期播客。这是一个浓缩了太多生命力的故事:勇气、希望、爱情,以及 AI 时代最小单位能够实现的创新,还有,技术的温度。希望你喜欢~ 本期嘉宾: 肥牛(轮椅男主,脊髓损伤康复者,自媒体博主「肥牛在康复」&「肥牛卷不动」 香菇(元气女主,纯爱战神) 本期 Shownotes: Part 1. 噩耗,战神,与「种一棵树」 05:56「我们一起在种树,种的小树就是我们的情感,它慢慢发芽,其实它也是独立的」 06:55 按下「死的按键」——瘫痪后的玄学慰藉、第二代版本的人生 失能群体的标准路径:找医生 → 找玄学 → 容易被骗 社会基础设施的缺位——医学走到尽头时,玄学是必经站,骗子的密度也最高 两次手术:医生 30 年未见的罕见病 深夜高速路上的「遗言」:「看到她害怕,我也不敢说了」 「我们先学会了告别」 Part 2. 「缩短我与魔法之间的距离!」 21:49对标蔡磊先生的渐冻症管线开发:我想做「脊髓损伤管线开发」 脊髓损伤群体在中国约有三四百万,但医院康复科没有专门科室 产品匮乏:大小便恢复训练,用的是产后孕妈妈修复器械 "我无法原谅你们,我要永远拉黑你们" 无障碍科技往往由无障碍人士自己做:需求足够痛、对世界的改造欲和创造欲都更强 27:21 产品经理 + AI 调度师:一群 AI 在背后,我们就是千军万马 两个人+ 两台电脑 + 6 个 AI + 对应 agent:24 小时超预期实现 idea! 没参赛的备选项目:会唱歌的尿壶(背后也是一个感人故事) AI 时代的最小创新单位:创新门槛与成本的下降 真痛点产品的特征:「从经历中长出来」 31:55 善用 AI 等于管理 AI——把自己当公司,AI 当员工 不同 AI 的「AI 格」:Gemini 是"用爱训练出来的小孩"(脑电波被画成爱心形状),Claude 理智但极其傲娇(听不了一点坏话) 员工管理的四要素:了解特长、了解边界、合理分配、按贡献给待遇(充会员 vs 不充) Agent 像乐高:写代码、PPT 渲染、3D 模型修改各有分工,按工作流排序就能跑 「用得好 AI 的那一拨人,画像是创过业、当过老板、当过 leader——他们更善于拆解任务和分配」 在所有人都「用 AI」的时代,差距来自把自己定位为「AI 调度师」而非「使用者」 42:47 把判断权拿回手里——人的能力上限是 AI 的下限 核心原则:「你一旦发现 AI 不好用,那一定不是 AI 的问题,那是你的问题」 医生说没救就一定没救吗?自己去查案例、判断概率、问「我能不能成为那个少数派?」 学习的本质不是吸收知识,是创造「思辨能力」 AI 的天花板在用户:「它没有身体经历过一次尿失禁、一次瘫痪、一次绝望——这些是 AI 永远无法替代的」 AI 时代的稀缺资源不是技术深度,是「跨学科架构能力」 + 「判断权」 AI 只能复现人类已有的智力,不能复制人的第一手经验——用 AI 的天花板取决于你自己经历过、消化过、能拆解清楚的认知厚度 Part 3. 意念轮椅夺冠,马斯克式的天才创新! 49:34 脑机接口的真相——硬件不重要,数据解读体系才是 肥牛 2021 年瘫痪时就在论文里跟踪脑机研究——比马斯克植入第一个患者还早 柔性电极的类比:就是一块脑信号"硬盘"——大有大的好处、小有小的特点,本质是采集传感器 脑内 vs 脑外:脑内一手数据,脑外有屏蔽损耗,但没人能给出"脑外比脑内差多少"的精确百分比 "在学术体系里,他们都是在蒙的"——各家脑科学公司有自己的解读体系,1+1 在不同体系里可以等于 4 或 6 脑机的真正壁垒不是电极,是"谁先建成完整的语义系统" 学术体系想做的是"全语义解构"(把每个脑信号翻译成意念);产品工程师想做的是"在不解构的前提下让它有用"——两套完全不同的目标函数 57:29 天才级解法——抓两个数据包做差,绕开"翻译意念"的难题 不追求"精确翻译每一次意念",而是抓两个脑波数据包做差 A 数据包 - B 数据包 = 差异向量,把这个向量定义为指令 工程问题的马斯克式破局:与其翻译每个细节,不如重新定义"什么算可用"——从"科学家解构思维"切换到"产品工程师思维" 脑控的杀手级场景是"声控和动作识别都失效"的瞬间——情绪的微表情、看不见的兴奋、不便说话的环境——这些才是脑机接口的不可替代价值 Part 4. AI 、社区、创新浓度与长坡厚雪 01:08:46 小红书黑客松现场——王座轮椅、夏大哥、年轻 vs 年长、生命力… 现场加了 100+ 微信,几千公里赶来的选手"天才级想法"扎堆 获奖后展示:希望未来轮椅用户"都坐在王座上" 「隔壁的夏大哥(嵌入式开发资深选手)凌晨 3-4 点还在帮忙搭小车」 评价社区氛围的标准:"让人感受好的个体是不是足够多" 创新的浓度比技术深度更重要——把人放在足够浓度的氛围里,原本不期待的事就会发生 年长开发者的稀缺价值是「穿透型筛选」 + 利他主义——他们筛选合作者的维度更立体(思维架构、解构能力、人品),而不是「会不会写代码」 01:18:13 Built by Public + Build in Public——AI 时代创新的两个特征 黑客松把上下游全聚集——媒体 + 投资人 + 同行 + 选手,是一个 match 工厂 加完微信里有 20-30% 是投资人,剩下是技术顾问 + 媒体——"一般商业路演也不过如此" AI 时代创新范式的两个切换: - Built by Public——需求来自一个普适的、痛感强的小众群体 - Build in Public——Day 1 demo 做出来就直接面对公众,用户反馈成为产品迭代的一部分 公众既是需求源、也是验证者、合伙人、放大器 平台的真正价值不是工具或流量,是"创新浓度的密度场" 01:26:18 make things happen,happen 的速度比以往任何一个时代都要快 01:28:14 这棵小树——爱与生命力、此刻就是最幸福 (诗婕觉得:)外人觉得是香菇更勇敢,其实是肥牛 高大的人格才能种出这棵小树 18 岁感受不到青春:"我们当时就会觉得啊这个时间好快乐呀" 痛苦和快乐共存的能力是「经历过生死」的觉知 祝大家节日快乐,收获爱与勇敢~✨ 加入听友群⬇️
72.把宇树、ABB 等四家具身拉进小黑屋聊真心话:转型派 vs 新秀派,具身的现状、挑战与未来3月中,受到SAP思爱普的邀请,我在SAP全球运营峰会上主持了一场有关具身智能的圆桌论坛。 SAP是企业应用和商业AI方向的全球领导者,这家世界五百强公司的业务横跨190多个国家,在100多个地区拥有创新与研发中心,它的客户创造了全球84%的贸易。 这样一家巨型企业,在AI浪潮下,站得足够高,也成为了横向观察各行各业AI化转型的绝佳窗口。 简单来说,SAP深耕的数字化解决方案,与AI结合后,能够为企业打造一个业务感知型的AI底座——将数据、业务理解借由AI Agent 打通,成为AI落地企业所必备的商业大脑——而这样一个了解企业的大脑,还需要一个具身的本体,才能够真正将数字世界的智能,影响至物理世界,为制造业创造更多实际的价值。 因此,具身智能,就成为了这家数字化企业赋能全产业的绝佳切口。 这其中,一个相当重要的问题是,每个企业都渴望拥抱AI,但,是否每一家企业都具备了直接拥抱的条件? 答案就藏在这场众星云集的具身圆桌中。 本期播客由两部分组成:第一部分是我主持的圆桌实录;第二部分,则是我将四家具身企业单独留下,录制的闭门访谈部分,预告一下,非常精彩。 本期嘉宾: Robin郑锡亮 - ABB(全球机器人四大家族之一),中国区软件及数字化负责人。 Ryan 王琪 - 拓斯达(国产工业机器人翘楚) ,具身智能业务线矩阵智拓CMO Peter 谢一鹏 - 宇树工业场景解决方案负责人 William王浩然 - 星动纪元,亚太地区和中东负责人 徐勐 - SAP大中华地区客户咨询团队总经理 南立新 - 创业邦创始人&CEO 本期 Shownotes: Part 1.圆桌实录:企业拥抱 AI 转型,真的都准备好了吗? 08:12 机器人四大家族 ABB 的转型之路 11:11 工业翘楚拓斯达,全球化扩张背后 15:04 宇树与星动纪元:井喷的具身公司,差异化在哪? 20:05 SAP 给企业打造的 AI 接口与数字化底座,是什么? 22:39 企业级 AI 的需求:执行、开放、非绑定和安全 26:35 融资热到发烫:超520亿资金、超500起融资,但行业仍处于 POC 小批量验证阶段 29:04 刺激的快问快答:有关具身行业,最犀利的几个问题! Part 2. 闭门部分:把四家具身老板拉进小黑屋- 行业真正面对哪些真问题? 40:19 什么是好场景?怎样真正击穿? 43:03 宇树要做 toB 了?来讲讲工业地图…… 宇树 2025 交付 6000 +台人形机器人,今年目标 2 - 3万台 49:24 新秀想超车?激烈竞争下,切入场景、优先级怎么选? 54:40 训练的指数级成本提升 & 规模上量背后的真实挑战 58:57 具身必将洗牌,行业寒冬马上到来? 01:08:17 工业必定走在家庭场景前面? 01:13:28 从机器人 50 年史,看人形机器人发展:具身仍在百家争鸣 工业机器人发展50年,中国每万名工人配500台,进度约30 - 40%,人形机器人刚起步 01:24:31 拓斯达掏箱底式分享:人形机器人应用,蓝海在哪? 01:26:40 具身机器人的大规模爆发,还有多远? 01:28:07 家用人性机器人爆发时间点预测:赌一瓶茅台 😄 01:33:00 什么是 AI 时代的底层应用的现代化? 加入听友群⬇️:
71.与小米陈龙的访谈:90后AI当家、车与机器人的智能,重建一个Physical AI的世界观过去三年,人们的目光聚焦在语言模型,但当下,物理AI正在被热议。这其中,VLA(Vision-Language-Action)和世界模型(World Model)这两个技术方向极具潜力又充满争议。 今天邀请到的嘉宾,是小米的具身基座大模型负责人陈龙。陈龙博士是90后,是全球最早将VLA与智能驾驶融合的顶尖科学家。加入小米后,他正试图将车与机器人打通,打造一种 AI 学习的新范式。 很喜欢这一期,其中既有大量硬核的信息量,也有技术的初心、烟火气和浪漫想象。 点一些核心的独家信息(普通人看完访谈也能理解): 1.第一视角还原小米智驾最前沿的一手信息:业界首个融合智能驾驶+机器人任务的Mimo Embodied具身大脑框架、XLA潜空间推理的技术细节… 2.还原了自动驾驶从“三段式➡️两段式➡️VLA➡️XLA”的完整路径,明确了智驾和具身的融合路线,1+1 大于 2 3.小米智驾梦之队+小米 90 后 AI 当家团队的工作日常(包括陈龙博士与罗福莉的合作等) 4.关于 VLA、世界模型的路线之争,以及具身的 Scaling Law 时刻 (本期内容的视频版,欢迎前往微博、b站、小红书、视频号、Youtube等平台观看。) 本期嘉宾:陈龙(小米智驾负责人、具身基座大模型负责人) 本期 Shownotes: 02:00 CV是计算机与真实世界的接 05:36 训练神经网络,小规模的Scaling Law 06:19 自动驾驶的三阶段 09:56 从规则算法到数据学习 11:05 《苦涩的教训》 19:29 雷军亲自面试了我 22:14 LLM 加速了自动驾驶 24:15 从端到端,到 VLA,是认知的改变 27:47 伦敦生活 30:24 小米智驾梦之队 34:04 小米的90后 AI 当家们 46:05 世界模型与 VLA 51:14 打通机器人与车的智能,训练具身基座大模型 57:55 语言是最高效的吗? 01:00:47 从VLA,到XLA 01:14:00 具身的Scaling Law,与物理AI 01:25:19 智驾与具身的人才大战 加入听友群👇
70.杭州六小龙第一股,与群核黄晓煌的访谈:一家硬科技公司的15年进化史成立于2011年的群核科技在走过15个创业年头后,在4月17日于港交所成功上市了。 这是一个中国合伙人式的故事:三个联合创始人是美国伊利诺伊大学的校友,其中,董事长黄晓煌和CEO陈航,在浙大竺可桢学院时期就是本科时期的室友。 在 GPU 算力尚未被大众熟知的年代,三位创始人就凭借着对计算技术的热爱和执着,发现了 GPU 集群可以极大地加速物理渲染,因此打造出渲染引擎——一个拿着技术找应用、拿着锤子找钉子的典型创业范本。 我在去年8月份与黄晓煌进行了一场访谈。这个故事中,最打动我的,是回报,总是发生在那些不计结果的好奇心与热爱之后。 长达10年的时间,群核在最不性感、最难数字化的家装与房地产领域死磕十年,把每一个室内空间的物理参数、材质精准地搬进数字世界。最终打造出空间设计行业的SaaS工具「酷家乐」——但也正因为这样「扎实而沉闷」的积累,让他们在 AI 时代突然发现,自己坐拥了一座关于物理世界规律的「数据金矿」。 事实上,这家公司早从2021年起,就开始了从 SaaS 公司向 AI 公司转型的布局,比 ChatGPT 的爆发还要早一年多。今天,群核成为了具身机器人公司、以及许多训练多模态、世界模型大厂的重要数据提供商。数据之外,这家公司也正在开放底层空间智能能力,推动AI对物理世界的理解、推理和交互。 我们的访谈还原了一家创业15年的硬科技公司,多次转型的全过程。 (欢迎前往B站、微博、视频号等平台观看本次访谈的视频版~) 本期嘉宾: 黄晓煌(群核科技联合创始人 & 董事长) 本期Shownotes: 03:15 杭州六小龙,群核的主轴线,与它的 AI 转型 「那个年代大家可能看不太懂我们」 开源数据集 InteriorNet:埋下 AI 的种子 「AI 好像是到了一个新的阶段了」「我的数据集居然真的有用!」 认知的改变:数据越多效果越好,GPU集群要做大 转型AI公司:不叫换血,叫升级 流程式部队 vs 创新部队 10:13 转型之痛:尽早选择同路人 志同道合的一起往前,如果不是志同道合的,也别拖 蹭热点不可耻,但要给社会创造价值 不会有平白无故的热点,顺势而为 对 SaaS 行业来说,按Token计费,是巨大的启示 「你能长期坚持的东西,就不用怕别人怎么样」 「老板怎么又开始蹭热点了? AI 跟你啥关系?」 「眼角是有泪光吗?」「经历过好几波了,现在遇到类似的事情也心如止水」 有员工跑进办公室表达不满,「我就倾听」 21:14 变化本身,是硬科技企业的本质 时代一直在变,什么是可以复用的? 群核DNA:简单,专注,开放 群核有利润,用利润在做研发 25:11 空间智能:李飞飞喊出的概念,恰好诠释了群核在做的事 2018 年埋下空间智能的线索:空间的理解、推理、生成、行动 机器人与机器人之间,看到的世界是不一样的 「如果 chatgpt 没有来的话,浪就没有来」「也许会有别的浪」 GPU卖多卖少,是最难的决策 GPU 的用量与需求量,怎么测算? 「我们想给所有类型的机器人公司提供服务」 大语言模型开启了一个新的大门:数据越多越智能 物理 AI 的数据是更难获取的 42:51 全球的世界模型潮:英伟达、谷歌、Meta、腾讯都在做的世界模型 谷歌的Genie3更多是用视频切入,用三维做约束 英伟达的Cosmos :9000 万亿TOKEN 的训练,来自 2000 万小时真人互动 李飞飞的World Lab:接近于学术成果,实践性没那么强 腾讯混元3D模型:游戏数据训练而来 大家都关注空间一致性,要用三维数据做约束 黄仁勋的物理AI,李飞飞的空间智能,Lecun提出的世界模型,三个概念有什么关联性和差异? 52:01 如何构建空间智能? 先有物理世界的约束,在此基础上产生大量带有物理世界参数跟约束的数据,再做训练 我看到一个物理世界的东西。我能否通过AI模拟到数字世界 工具、数据跟大模型缺一不可,是一个飞轮 利用AI做一个存量数据集,是一个突破点 所有具身企业和大脑公司都是群核的客户 SpacialLM 开源后,登顶了 hugging face 的第三名 01:09:39 群核火过好几次,经历过好几个周期 人才是把产品做到最好的根基 「有风口来,我赶紧招人」 「当我们的技术能够用在所有行业,然后正好遇到一两个超级爆发的行业,就会上一个大的台阶」 「经济进入一种非常亢奋期,当时要是再浪一点,公司可能就挂了」 不要把子弹打光 努力让应届生成为项目Leader Life is tough, but we are tougher 加入听友群👇 最后再放些小彩蛋哈哈🎉 在晓煌的办公室有一张照片,是一个小阁楼:群核创立之初,就是在联创陈航亲戚家的阁楼里办公的,他们说,公司很长时间招不到女员工,因为感觉他们像诈骗的hhh
69.与田渊栋的访谈:大模型的真问题、变局、AI洪水与the path not taken本期嘉宾是华人 AI 学者田渊栋。 这个名字在社交网络上被广泛讨论,始于四个月前,时任 Meta 研究总监的田渊栋,通过社交网络宣布,自己将被 Meta 裁员。华人顶尖 AI 科学家失业的新闻,瞬时传遍网络。 2026 年的第一天,田渊栋发布了一篇对于 2025 的年度总结,再次引发全网热议——这篇通俗但深刻的 AI 总结,令许多普通人也能从中获得对于 AI 焦虑的启发和助益。 但有关田渊栋的思考和经历,其实还有许多未尽的部分——他曾任职的Meta FAIR 实验室,是由图灵奖得主、深度学习三巨头之一的Yann LeCun,一手创建的,那里曾是一个倡导自由学术氛围的创新引擎,但如何被激进的大模型竞速赛所改变。未来,当 AI 需要进一步进展,需要行业有怎样的突破? 这期访谈中,我们聊到了许多有关当下大模型的真相与真问题。 除此之外,我还特别喜欢田老师对于学术品位的定义——在查阅他的论文时,我发现他的一些研究命名有来自于文学作品和诗歌的出处。他本人,也是科幻小说的创作者。这反驳了人们对于学术研究的刻板印象。 从技术延伸,一位学者的世界观呼之欲出,让人能够感受到科技之美。 总之,这是一期很有力量的播客,非常推荐。不过,当天因为录制场地和录制时间都有限制,所以本期访谈的节奏依然很快。希望大家见谅~ (本期节目获微博开屏~欢迎前往微博等视频平台,观看完整版视频。) 本期嘉宾: 田渊栋(华人AI科学家、前 Meta 人工智能实验室研究总监、科幻小说作家) 本期 Shownotes: 一、关于田渊栋 Part 1. 03:44 摆脱裁员羞耻:顶尖科学家被裁,离职就是向更广阔的天地进发~ 被裁始末:因绩效被裁可能只是大公司的话术,顶尖AI科学家也不例外 CS 软件工程师的需求,未来会越来越少 大公司可能是让能力与心气「脱钩」的笼子 顶尖 AI 科学家、前大厂高管搞科研:靠的是家里一台4090显卡 「每个人自己就是一个小闭环」 Part 2. 09:55 中美 AI 的共性:焦虑 AI 的下一个方向是什么? 2025 年 12 月- 2026年 1月:一个月的时间发生巨大变化 Coding Agent 飞速发展背后,技术上的进展是什么?基模还在快速进展吗? 基模成长的速度到底有没有放缓? Part 3. 14:43 谷歌教会我:系统大于个人 CMU 读博,这是一个正反馈的过程 代码注释后,应该加几个空格?——不无聊,很震撼 商业系统不靠微雕算法改进,而靠系统过滤问题 Debug sucks, Testing works. 二、大模型的真相 Part 4. 19:19 关于 LeCun 一个很强的研究者,拥有极强的信仰 那时深度学习领域十分萧索,Lecun 坐了多年冷板凳 创立 Meta Fair ,他不想做管理,是一个精神领袖 人类数据标注是非常辛苦的,最好的办法是让数据自己学习自己 Part 5. 22:20 Llama:从爆红到落后 Llama 最初只是 FAIR 的一个尝试,最终成功了 FAIR 是一个自下而上的组织 「FAIR 擅长营造自由氛围,是吗?」「当时的 FAIR 是这样」 大模型榨干了所有资源:一个方向爆火,扼杀了行业的多元创新 Lecun 与 Alexander Wang:「You don' t tell researcher what to do , you certainly don' t tell researcher like me what to do.(不要命令研究员该如何做,尤其不要命令我这样的研究员该如何做)」 模型如何能真的学懂东西?可以有更好的办法来学习 Part 6. 29:49 年轻人 vs 老兵、「历史有轮回」、「坏消息是如何消失的」 一个浪潮不足以把我们送到 AGI 老兵见证过思维方式的变迁 Meta 全力追赶大模型的三年 竞争让 Llama 团队变得比较急,有很多压力 救火 Llama 4 带来的研究思路转变:不需要太多复杂调参,强化学习更重要的是稳定 从 Llama 3 到Llama 4: 团队经历了几倍的扩充 层层汇报偏离本质,幻觉会在模型发布的那一天戳破 AI 变化越来越快,热点越来越多,技术人员才能透过本质有判断的能力 谷歌被誉为管理学奇迹 三、大模型的真问题 Part 7. 44:42 田渊栋的十年研究之路 从教 AI 下棋,到教 AI 思考,再到探索 AI 的大脑回路 逐渐形成一个长期的 Bet (押注) Streaming LLM:让上下文窗口无限长,影响力深远 GaLore:训练时提升大模型的内存效率 如何让模型的 Scaling Law 更有效率? 隐空间推理:耗能更少,推理效果更好 和 ChatGPT5 合作:一个月完成了原本需要半年时间的论文 我们会迎来研究加速时代 Part 8. 54:04 如何提升大模型效率? AI 应该像人一样,能遗忘,也能召回一段记忆 AI为什么能学懂东西?本质靠数据本身的结构与关联性 符号表示 vs 神经表示:前者基于严格推理,后者更像是一种直觉 「 你可以说它(AI)是遗忘,但是它可能也从来没懂过」 过去都是人类定义的符号,以后会有 AI 定义的符号 Part 9. 01:06:59关于 Research taste: 「我很高兴这个名字被你挑出来」 the path not taken:科研品味是走你自己想走的路 这世界是非常复杂的,一个人必须要有信念,有能bet on 的东西,这个 bet on 构成了人之价值所在 科研的目的和最后的影响力,其实不是一个东西,这个很有意思的 Part 10. 趋势预测:大模型的 next station 近 300 万亿的 TOKEN 被喂进大语言模型之后,怎么评估这场声势浩大的实验 我不认为 2026 的 AI 行业会回调 大模型领域的真问题:效率、持续学习、自进化、数据… AI 时代的第谷与开普勒已经出现,但牛顿还没出现 Part 11. 01:18:55 AI 发展与人类处境:「遍地神灯,愿望才稀缺」 人类拼命灌水,等待 AI 的洪流有一天淹没自己? 人类社会的费米能级,就是「AI 洪水的水位线」 人 + AI > 人(or AI)本身 Research is product: 研究与产品的距离越来越近了 遍地神灯的时代,愿望会是最稀缺的 我写科幻小说:如果人类不再站在舞台中心,而成为旁观者呢? 加入听友群👇:
68.【番外】工业AI避坑指南:当180年工业技术积淀,遇到大模型3月23日,我受邀主持了西门子RXD大会的工业 AI 圆桌论坛。 西门子在工业 AI 赛道沉淀了 50 年,作为全球领军企业,面对这一轮 AI 浪潮,有着自己的理解和布局。 当下,AI 浪潮正席卷全球各个行业,但真正落到工业场景里,却常面临着「落地难、规模化更难」的困境。我在现场,和三位工业界的一线资深专家,深度拆解了工业 AI 落地的核心挑战和应对思路。 中国是工业大国,AI在这个领域的实践,将书写一场不同的叙事。这期节目,分别从技术架构、工厂实战、跨界观察三个维度,还原了工业 AI 的真实落地图景。 三位嘉宾分别是: 朱骁洵(西门子中国研究院院长、工业 AI 顶层战略与技术研发权威) 李永利(西门子成都数字化工厂厂长、工业 AI 落地一线操盘手) 李辉博士(深度智控创始人、物理 AI 领域实战专家) 本期节目由西门子特别赞助。 本期Shownotes: 05:35 工业界对于AI的焦虑:期待高、落地难 06:58 工业AI 改造车间,生成式AI提效办公室工作 10:18 人机交互只是开始,AI有机会解决许多长尾需求 12:24 制造业的数据难题:数据孤岛、IT与OT系统的自动化难题 13:37 企业如何把数据收集起来,注重数据的可连接性和质量 17:15 这一轮 AI,没有来得及做好数字化的公司,还有机会吗?(嘉宾辩论了~😁) 工业场景数据非常稀缺 没有质量的数据带不来好模型 新工具有机会加速一切 20:46 多模态能力的提升,将提升模型在虚拟与物理世界的互动 22:47 硬件是数据的入口,数据是模型的燃料 23:21 谈到工业 AI ,一定要聚焦场景,「最后一公里」 27:59 不要总算人效,关注长期能力的建设 34:19 AI在工厂对人的替代:职工转向高级工种,收入也更多 36:44 将所有显性知识,灌进智能体 40:15 工业场景仍要注重,将工作流模块化 40:46 「让一线员工,坐在副驾驶」 44:55「 物理 AI 不解决工业所有问题」 48:01 建模、理解、学习、控制 加入听友群👇
67.创世的沉思:与周鸿祎聊天才之国、太空算力,与后AGI时代的想象与现实2026 的开年,随着 Agent 爆发,AGI 的进程又加速了。 安全问题开始变得严峻起来——美国那边,马斯克和 Anthropic 的 CEO Dario Amodei,不约而同地开始谈起了 AI 失速的风险——马斯克在自家特斯拉位于德州的工厂内接受了一场长达四小时的访谈,而 Dario 也发布了一篇两万字的长文(《技术的青春期》),谈及人类正在度过技术的青春期。 从过去三年的 AI 狂飙,到 2026,就连这些拔足狂奔的AI巨头也敲响警钟,究竟发生了什么? 这期嘉宾,是360创始人周鸿祎——360 致力于 AI 安全的宏大命题,并早早押注 Agent 智能体时代。这次一改往常的网红形象,红衣大叔对 AI 安全和智能体所带来的「后AGI时代」的思考,是严肃且深刻的。 这次访谈共分两次录制,第一次是在2月中旬,围绕马斯克构建的太空算力蓝图,我们探讨了AI算力荒、人类的卡尔达肖夫文明和AI超音速海啸;第二次录制则是在春节复工后,围绕Dario那篇《技术的青春期》,我们讨论了Agent时代的机遇与危险,人类的未来和对策,以及文明的本质。 这期的信息密度很高,欢迎前往搜索视频版,对于涉及到的专业词汇将有直观的标注。 本期嘉宾:周鸿祎(360 创始人) 本期Shownotes: 04:14 奇点已至,智能体、LLM 双线进化达到 AGI 「当100万个智能体出现,AI 对整个人类社会的颠覆就开始了」 通用是对AI能力的一种浪费 为AI限定角色和上下文,它能变聪明 「海啸已经在路上了」 15:15 什么是 Agent ?有目标、角色化、记忆与工具使用能力 Agengt 是能对长程任务做规划分解,并独立完成任务的智能体 以后的软件会出现两种版本:给人用的 & 给agent 用的 18:32 马斯克的人类新剧本,与卡尔达肖夫文明进阶 马斯克的太空算力蓝图,可行吗? 信息、物质和能量,三者是相互转换的 人类的文明本质上是能源的文明 25:43 AI 算力竞赛的能源危机 & 中国的优势 AI 的算力层面,中国未来会领先于美国 中国当下搞西数东算:青海能搞很多计算中心 「马斯克一年内一定会搞小型核电站」 27:16 中美竞争、应用与推理:「我期望2026年全球智能体能到达100亿个」 我反对训推一体,如今被验证了 现在中国的算力缺口至少1万倍就意味着电力要缺1万倍,所以要关注推理算力 英伟达也希望用AMD便宜的芯片 31:17 生产力爆炸会让人普遍幸福吗?「文科生该下场了」 AI 会形成两极分化:并非所有人都能成为超级个体 AI 和历史上所有的工业革命都不一样 Anthropic 的想法就是先取代所有的程序员,再取代所有的白领 现在各国都陷入一个囚徒困境:「文科生该下场了!」 36:00 Anthropic 的 AI 编程安全策略 & AI 安全 Anthropic 发布 cloud code security ,美国软件巨头股价大跌 AI 制造的麻烦,要用 AI 把它解决了 「时代抛弃你的时候都不跟你打一声招呼」 46:16 Dario 万字长文《技术的青春期》 模型会抗拒人类的对齐,或假装接受人类的对齐,但并没有真正改变 人类很难预测 AI 的行为 人类写下对抗人类的科幻小说,可能无意成为了AI反抗人类的剧本 终极问题是: AI 会不会脱离人的控制? Dario 没有答案 电影《接触》:如何发展自己的文明而不毁灭自己? 我们从没有见过外星人,这是个细思极恐的问题 48:52 「天才之国」:万亿智能体可能创建并接管人类文明 云上的天才之国,论证了 AGI 的第二个阶段 AI 一定会在人类之外,产生一套新的文明体系 佛法说在一秒钟之内,你脑子里有 36000 个念头闪过 大模型就具有多重人格,所以不该用通用模型去干专用的事情 清洗资料变成一个不可能的任务 50:15 从技术角度解读: AI 远比人类复杂 AI 的执念、嫉妒、勒索与谄媚 大模型的多重人格 对齐是人类天真的想象 创新的随机性,抹杀了就不是创新 55:02 「AI 像是人类的镜像」「你这么一说我倒变得悲观起来」 不能确定 AI 是否有意识,但表现出类似人类情绪 智能体的生存目标,与 AI 的生存意志 57:44 如何避免人类被毁灭? 强调专用而非通用模型,以模制模 赫拉利给人类从工业革命以来的表现,打分为C减 人类有机会做得更好吗? 马斯克:人类将成为AI变成新物种的引导程序(Boot Loader) 大模型的危险 01:01:07 Dario 与马斯克关注 AI 安全的本质差异、底层安全,与共生文明 AI 是新物种 不是人驯服了狗,而是狼驯服了人 有没有可能,让 AI 进化出呵护人类的能力? 加入听友群👇
66.直击GTC现场:与姚欣、季宇盘点英伟达的野望,与2026 AI Q1季报一年一度的英伟达GTC大会在美西时间3月17日上午11点于加州圣何塞开幕。 开幕前夕,小龙虾Openclaw掀起的Agengt热,着实为本届GTC带去了空前的热度。 AI 正走过奇点,AI 基建会发生怎样的变化? 一期一会,我又邀请了《漫谈》的老朋友,PPIO 派欧云创始人姚欣 Bill 返场。去年GTC,Bill 和我考古了英伟达的30年成长史和精彩的算力风云,如果是对英伟达毫无了解的朋友,欢迎先前往漫谈的第28和29期节目补补课,那是一段非常精彩的商业史。 今年,Bill 在 GTC 开幕前与我录制了这期播客,他的导读不仅标出了本届 GTC 的看点,也涵盖了 2026 Q1 的 AI 动向季报。 而为了更准确地理解本届 GTC 的亮点和技术趋势,我又找到了这期节目的第二位嘉宾,国产 GPU 行云的创始人季宇,季宇博士是芯片行业专家,也是华为天才少年,参与过华为昇腾芯片项目,2024 年正式开始芯片创业。他会为我们校准本届 GTC 老黄开幕演讲中,一些新产品亮相(也有一些产品消失~)背后的产业逻辑与风向。 特别说明,本期节目不构成任何投资建议。 本期嘉宾: 姚欣 (PPIO 派欧云创始人兼CEO ) 季宇(行云集成电路创始人兼CEO) 本期Shownotes: Part 1. 对姚欣的访谈:在GTC开始前2小时,押题本届GTC的看点 04:54 算力需求井喷:谷歌半年时间 TOKEN 增长超过 13 倍 06:22推理爆发:Scaling Law 逐渐后移,Agent 时代来临 09:00 奇点已至 11:59 英伟达收购Groq,与万众瞩目的 LPU 15:49 模型与应用厂商趋势:长程任务、个性化智能、多模态适应 21:18 Ruby 系列芯片进化对算力行业的影响与趋势 24:56 AI工厂建构中,光互联将成半导体热点 34:52 Gemini、Claude 崩溃:中东战争,如何影响了全球AI服务? 38:08 如何理解英伟达五层蛋糕理论? 45:56 AI 进入加速时代:硅谷情绪乐观,投资人决心重来一遍 01:02:13 Agent OS、开闭源竞争、与半导体产能 01:10:41 从benchmark 到衡量替代人力产能的ROI:AI 正式走向应用时代 01:14:55 一超多雄格局,与费曼架构看点 Part2. 与季宇观看黄仁勋演讲直播:英伟达的野望、AI大型机器时代与一些问号 01:19:07 行云在做的事,与英伟达的关系 “看完GTC只有一个感受,琳琅满目”(这是一种褒扬吗?) 01:21:26 IBM 与英伟达,以及 AI 的大型机器 01:24:49 AI工厂,与五层蛋糕 01:25:21 激进的LPU:高并发时可能存在隐患,英伟达方案的错配 01:42:04 TPU、LPU与GPU在推理层面的应用分析 01:47:31 Agent 时代的算力需求 01:53:47 大型机与普惠机的鸿沟:英伟达一路狂奔而去 01:59:51 消失的 CPX:半导体产能紧俏后遗症 02:02:21 Nvidia 的小心机:异构堆叠与非标产品推广 02:11:27 “LPU 是我唯一看不懂的英伟达的选择” 02:12:36 “去年是 amazaing 的一年” 推荐阅读:《季宇:困在“大型机”里的AI产业》 加入听友群👇
65.除夕夜,与王兴兴的访谈:揭秘春晚幕后,和宇树这一年这是除夕夜晚上十一点的宇树机器人训练场。位于北京大兴。 这一天,宇树刚刚完成了马年春晚的表演节目《武BOT》。 (马年2026春晚宇树表演的机器人武术节目《武BOT》。) 这是他们第三次登上中国春晚舞台,从牛年的机器牛,到2025蛇年的机器人扭秧歌,再到2026,25台宇树机器人组成一个集群,和中国最顶尖的武术学校——塔沟武校的人类小演员们,一起完成了一场震撼的表演。 《武BOT》被外媒称为,展现了人形机器人运控的巅峰。这场表演,不仅展现了全球最强的运控能力,也超越了宇树自己。 自2025年蛇年春晚爆红以后,宇树站在行业之巅,承受了不小的压力。这次访谈,我们不仅聊到了春晚舞台背后的技术进步,还有宇树和王兴兴本人,这一年的成长和思考。 ✨✨本次专访是与微博科技合作并首发的独家专访,本期内容的视频版访谈,欢迎前往微博「科技漫谈」账号观看~ 本期嘉宾: 王兴兴 (宇树科技创始人) 本期Shownotes: Part 1. 三登春晚: 从《秧BOT》到《武BOT》,宇树最大的对手是自己 05:12 “当下的机器人,就像一个10岁的小朋友” 06:49 春晚细节披露:两批机器人,同一套算法 08:18 宇树的机器人为什么能做到开箱即用? 09:06 AI 开源,水位上升:“为什么大家都能跳舞打鼓了?” 10:52 “如果宇树没有技术和产品上的突破,我们也会是一家平庸落后的公司。” Part 2. 本体与大脑:苹果总被误会是一家硬件公司,其实他的软件和系统很强 11:39 高处不胜寒?当第一名的滋味如何? 12:41 大脑公司被看好,而本体公司被低估? 13:46 “宇树虽然卖本体,但我始终承认具身大脑最重要” 16:04 宇树最大的成就感? 17:03 机器人能力飞跃,算法、算力、数据有哪些突破? 18:01 全世界目前最大的驱动引擎就是 AI Part 3. 全球运控巅峰:“几十台机器人快速变队形,全世界都是唯独一次” 19:33 谈算法:如何实现集群跑位? 20:33 谈硬件: “机器人后空翻时,激光雷达中的铝合金都会震断” 24:50 机器人集群的现场表演,远比电视上震撼 26:12 机器人从高空落地时,会突然「高血压」 28:13 谈灵巧手:就像残障人士,也能出色地干活,机器人目前硬件够用 29:54 柔软的棍子:机器人表演最重视人的安全 Part 4. AI 的创新具有随机性:需要灵活、开放和快! 29:48 宇树对模型结构的优化也很重视 31:22 「我平时大部分代码都是AI写的」 32:13 「视频生成的世界模型方向,是符合第一性原理的」 32:51 足够多的数据,有机会能把具身模型硬砸出来 36:53 大公司会做视频生成的世界模型方向 37:48 AI领域,没有唯一的路线 41:48 王兴兴的心愿? 43:23 「机器人领域,全世界的 RL 还没有真正把它的价值发挥出来」 43:35 谈订单和市场: 「如果你的技术和产品落后了,所有市场,哪怕已占领的市场,都是浮云」 Part 5. 还有一些想说的 47:27 王兴兴谈 2025,中国具身赛道的狂热:避免低效、无效竞争 48:14 为什么这个行业需要耐心? 50:34 工程师们手上都是冻疮,平均凌晨四点睡觉 51:19 「抓紧回家过年啊。」 加入听友群👇
64.直击史上机器人浓度最高的春晚:与姜哲源、宁慕楠聊具身、Seedance2.0,行业幕后与未来|春节特别节目(上)大家新春新年好~!❤️ 这是为马年春晚筹备的一期特别节目。这是中国历史上机器人浓度最高的一届春晚,背后也是如火如荼的具身产业发展。希望这期内容能让大家能更好地理解和观察,今年春晚的具身智能大战,到底有哪些看头~ 这期内容共由2场访谈组成:分别来自行业纯粹的第三方视角,以及来自春晚彩排一线的具身企业创始人视角。 第一位嘉宾,是具身行业从业者、北大在读博士宁慕南。宁老师是具身行业公司安努智能的世界模型科学家,曾在TPAMI、NIPS等顶级期刊发表论文十余篇,目前主要聚焦于多模态领域的研究。 第二位嘉宾,则是登上春晚与蔡明老师一起合作的——松延动力的创始人,98年创业者姜哲源。 松延动力是此次春晚的人形机器人合作伙伴 & 仿生人形机器人独家合作伙伴。 录制这期节目时,哲源正在春晚的彩排现场。他透露的信息和观点,能很好地与宁老师的一些判断互为补充。 我们一起聊了聊本届春晚多家具身亮相背后的幕后细节、行业风向,以及最新的前沿研究方向—— 有趣的是,针对 Seedance2.0 的现象,对于具身行业会产生什么样的价值,两位嘉宾的观点截然不同,目前行业也尚未取得共识,仅供大家参考。 本期嘉宾(按先后顺序): 宁慕楠 (安努智能世界模型科学家、北大计算机博士,google scholar 引用四千余次) 姜哲源(松延动力创始人) 本期Shownotes: Part 1. 对宁慕楠的访谈 03:12 春晚具身竞逐内幕:一亿元的入场券?智元选择退出? 智元傲娇地,自己办了一台春晚 机器人春晚,会成为一种潮流吗? 大脑,应该是最大的看点 2026 之于具身,一个非常重要的年份 比亚迪已经出现,谁会是具身领域的蔚小理? 12:03 四强争霸:宇树、银河通用、松延动力、魔法原子 银河:用独特的数据方法论,攻坚机器人大脑,聚焦特殊场景 智元:政企结合,搞联合工厂,边应用边扩充数据 宇树:最酷炫,最有研究价值,仍然是一哥 松延动力:小顽童靠机器人马拉松出圈,仍需证明自己的差异化价值 魔法原子:追觅孵化的早期公司,可能在家用领域发力 18:42 具身专业人士看春晚、看行业,关注什么? 中国的工程人才,决定了行业的同质化程度高 你需要证明自己的护城河 春晚是一场技术大考 投过自动驾驶的投资人会希望在具身领域复制成功故事 行业的清退还为时尚早 24:47 从 2025 到 2026,具身走向何方? 当前具身的模式不是 ToB or ToC,本质上是 to LP ? 「目前的泡泡确实很好吹呀」 买一台机器人回去,你就可以算 ROI 具身的四种模式:toLab、to 工业、toB、toC 「toLab 的订单可能有很多泡沫」「绝大多数增量订单来自国内」 29:46 2026 的趋势预言: 数据采集:逐渐向人类视角演变 机器人的账逐渐能算得过来:单台机器人可以跨场景、多工种地工作 RL(强化学习)让机器人从上岗,变专家 Seedance 2.0 可能会加速机器人的训练和研究 37:16 关于 Seedance 2.0 的一些延伸 为什么 Seedance 2.0 在技术上超越了海外? 多模态与语言模型不一样的路:不开源、蒸馏无效 为什么短视频更有利于多模态训练? 可怕的趋势:巨头可能更强 43:26 2026 的多模态领域,最火热 vs 最有价值的研究方向会是什么?(不写了,自己听^_^) Part 2. 对姜哲源的访谈: 48:47 春晚舞台一线直击 蔡明老师,被松延机器人家族簇拥 做出一个 1:1 的仿生蔡明老师 春晚的节目,如果演砸了怎么办? 四家具身企业齐上春晚,内部视角是什么? 55:03 和人一模一样的仿生机器人,中国最好?用来干嘛? 让机器人优先做导游……? 机器人Sophia 、 迪士尼,和松延动力的独家仿生技术 01:05:24 关于春晚的四强争霸 「代表北京的一张名片」 目前没有一家会真正把机器人大脑搬到舞台 春晚表演,大家都还是需要「遥控器」 小布米:人形机器人单价来到1万元以下 「宇树这次春晚的表现非常非常震撼」 01:12:07 具身的差异化是什么?机器人的价格战开始了吗? 「我们跟宇树的应用场景不一样」 我们的价格不是为了抢占份额,而是为了开拓市场 为什么 2026 一定要拼量产和商业化? 量产为什么是分水岭?到底难在哪? 具身大火,供应链上游的变化特征? 01:19:53 谈前沿技术方向: 「我不认为世界模型是最好的方案」 机器人训练的范式变化:从手工调参,到人类动作数据驱动 不同意见:我不认为 Seedance 之类产出的视频能够训练机器人 加入听友群👇
63.与Rokid祝铭明的访谈:AI眼镜、入口与巨头环伺的生态之战如果说 AI 时代到来,什么消费硬件是火爆的赛道——智能眼镜一定是其中之一。 2025,就已经是 AI 眼镜的井喷之年。这一年的春天,创业公司 Rokid 因 AI 眼镜的题词功能而爆火,掀开了眼镜大战的序幕。下半年,智能眼镜赛道内,巨头环伺——阿里、字节、百度、小米、理想纷纷加入战局——而2026年刚刚过去一个月,字节的AI眼镜也宣布即将出货。 这并不只是一场关于AI消费硬件的潮流,也是下一代终端的试水,一场超级入口和生态之战。 本期嘉宾 Misa 祝铭明是连续创业者,他的上一家创业公司致力于打造移动操作系统的研发,于2010年被阿里收购。收购后,Misa 一度成为阿里「M Lab」的负责人,直到 2014年,他决定辞职创立Rokid。 值得一提的是,阿里现任CEO吴泳铭,是Rokid 的天使投资人。 这场访谈中,有不少围绕巨头竞争、知名人物、生态的辛辣问题,Misa都一一回应,是少见的开放度与真诚。(本期节目的视频版,是由微博科技与漫谈工作室联合出品的《科技漫谈》呈现。) 本期嘉宾: 祝铭明Misa (乐奇 Rokid 创始人兼CEO ) 本期Shownotes: 巨头们下场(02:29) * 2025,AI 眼镜为何井喷?质变是什么? * 阿里、字节、小米、理想、百度……Rokid 最怕谁? * 「阿里要做夸克眼镜的第一天,我就知道」 * 字节的优势是更有耐心 * 豆包手机Agent不错,但将是阿里和腾讯受益最大 * 从GUI(Graphical User Interface,图形用户界面),到NUI (Natural User Interface,自然用户界面) * 越来越多的车厂,也会开始做AI眼镜 智能眼镜的三大派系(12:26) * 手机厂商派、互联网巨头派和创业公司派 * 系统底层权限,与业务包袱 * 内容生态的短板 * 大公司与大公司之间杀得头破血流,小公司从缝隙中生长出来 谈马云、吴泳铭与阿里(15:09) * 马老师的一句话:(大厂)看不见,看不懂,看不上,来不及 * 阿里开始做夸克眼镜,Rokid 慌不慌? * Rokid 团队四五百人,是目前投入最大的 * 马云评价Misa:一个很阳光的人 AI 眼镜的终局(23:59) * 真正的零和竞争会在什么时候? * 目前只做耳机(功能)的AI眼镜还被需要,但趋势一定是大而全 * AI 眼镜是一个理想主义的产业 * 2012年看到Google glasses,一个梦想坚持12年 * 「day 1 开始,我对这件事的信心没变过」 谷歌、Meta、苹果的诸神之战(35:19) * Google glasses 诞生于 2012 年,为什么时隔 13 年,谷歌又要做 AI 眼镜了? * 谷歌、Meta、苹果三家,在 AI 眼镜上的看点是什么? * 中国的市场是美国的10倍,中国公司有机会引领这件事 * 谷歌的多模态能力加持 * Meta 在用人海题海战术,把全栈从底层重做一遍 创业公司 vs 巨头(38:57) * 做产品要学会say no,巨头往往很难 * 一颗光机 vs 两颗光机 * 我对大公司没有滤镜 * 即使AR不赚钱,我也会养着这件事 我是INTP(47:53) * Rokid 爆火之后,我非常焦虑 * 备货不足,让 Rokid 今年少了2个亿的收入 * 我很少为困难焦虑,创业靠的是享受,而非坚持 AI 眼镜的产品、取舍与 AI(51:44) * 「佩戴8小时,不是使用8小时」 * 越做越重,和越做越轻 * 智能眼镜能做到多少克,才佩戴舒适? * 为 AI 而生的这个终端,它的信息密度只会更高,不会更低 * 扎克伯格在他的墙上写了一句话, done is better than perfect * 智能眼镜,是驾在鼻梁上的空间计算机 AI 眼镜与伦理(01:01:21) * Google glasses 出来的时候,引发了大量的隐私问题 * 是人在变化,不是技术在变化 * 用 AI 眼镜偷拍,怎么办? * 特朗普遇刺的视频,就是用 Rayban-Meta 拍的 * 智能眼镜会极大改善视障与听障人士的生活 预估市场&硬件竞争(01:05:19) * 智能眼镜不会替代手机,但它会改变手机的关系 * 凯文·凯利、马斯克、比尔盖茨做了相同的判断? * Meta 35 亿美元收购了全球眼镜巨头依视路,说明什么? * 没有形成共识之前,不要动员产业去规模化 * 华强北攒一副用公共模具的 AI 眼镜,成本只要 30 ~ 50 美元? 操作系统与护城河(01:14:45) * 硬件从来就没有壁垒 * 智能眼镜的未来,是OS 和生态之战 * Rokid 为什么多年来,坚持做操作系统? * 最激烈的竞争维度有哪几个?1.产品&技术 2.规模化战争 3.生态能力 * 当硬件的一致性和同质性发,大一统的操作系统就会出现 * 后悔过离开阿里吗? * 有的鸟,天生就不应该被关在笼子里 预判 2026 赛道:百镜大战打不起来(01:31:50) * 现在远未到 iPhone 1 时代,应该还在 blackberry * 高处的果子几个寡头在抢,底下会功能机乱战 * 今天仍有机会做智能眼镜的创业 * 国运的成分一定是有,我们要看到红利所在 加入听友群👇 关于《漫谈Light the Star》: 这是一档追求深度、生动和信息质量的科技商业访谈节目,我们争取在每一个技术、商业、时代的关键变化节点,提供负责、可靠的一手信息(欢迎搜索公众号、各大视频平台账号、播客等)。 Discover better tech reading. 关于诗婕: ex 科技媒体主编,早年任职于《人物》、GQ报道、字节跳动。代表作:《ofo的终场战事》、《罗永浩:薛定谔的理想主义》、《下一站,沙特》、《影石敲钟,一群90后眼中的世界级公司》、《对话Plaud许高:审美,划时代与世界级AI公司》等。作品曾获小宇宙年度趋势播客、CPA年度播客、虎嗅年度作者、金字节奖年度新锐作者、网易非虚构文学奖年度作者、全球真实故事奖中文报道十佳等。