- Vol.6 机器人为什么要像人?大模型爆发跟它有什么关系?当我们在讨论具身智能的时候,到底在关注什么?
如果说在大模型概念爆火之后,AGI 代表着AI 智力的终极猜想,那么具身智能就是 AI 硬件能力的未来形态。 在ChatGPT 诞生之前,强化学习已经在机器人领域得到广泛使用和研究,带动着机器人行动能力的提升。而在加入了大模型能力之后,机器人这个历史甚至比 PC 还要长的“老物件”,得到了迅速的发展。 这次我们邀请到的企业加速进化就是在这波 AI 浪潮之后崛起的一家做具身智能的公司,而另一位嘉宾,则是来自投了加速智能的英诺天使基金。 具身智能到底是什么?大模型到底如何作用于机器人?以及在商业层面我们为什么需要机器人?他们的回答能让我们更能看清到底具身智能为什么会成为一个风口以及它未来发展的路径。 欢迎大家收听硅基立场的第四期节目,这一次我们来聊一聊关于机器人的现在以及它的未来。 【主播】 硅基立场主理人 骆轶航 【嘉宾】 英诺天使基金合伙人 王晟 加速进化创始人兼CEO 程昊 【时间线】 06:15 从《科幻世界》杂志开始的机器人梦想。 14:30 ChatGPT 的出现像是给通用机器人行业带来了一束光。 17:50 在 2022 年提到具身智能是不足以令人信服的。虽然已经有很多企业动起来了。 23:21 大模型给机器人提供了一个高效的交互手段。在这之前需要大量的代码操作,虽然是通用的形态,但仍是专用的设备。 32:35 大语言模型是纯靠已有的“经验”来输出内容,而非通过输入的知识来推导出还不存在的内容。 42:03 强化学习和 Transformer 两条平行线随着发展突然在具身智能领域交汇,给机器人的两条腿接上了。 50:04 强化学习完全可以让机器人训练出“先亲淑女步”,只是时间问题。 53:44 对于投资者来说,机器人公司的基本功很重要,AI 只是加分项。 01:02:40 不要反复造轮子,今天回过头去看百模大战其实没有意义,现在是有轮子没车。 01:05:09 2023 年之后的机器人项目明显受到大模型崛起的影响。 01:12:00 机器人的“大脑”和“小脑”之间的关系是什么? 01:14:35 小模型就是强化学习。 01:18:18 机器人像人是因为要兼容人所创造的物理世界。 01:24:40 双足机器人算法很快会演变的很成熟,“两条腿”的成本会降到 1 万块以下。 01:32:00 人形机器人是终极答案,但不是唯一的答案。 01:40:06 AI 带来的生产力变革不应该仅停留在数字事件,还有很多人类干不了的事,才是生产力变革的方向。
- Vol.5 和Deepmind前科学家、硅谷AI Agent创业者聊聊如何把你的电脑变成另一个你
到底什么是 AI Agent?又该如何定义它?这个问题从上世纪 80 年代至今已经讨论了四十多年。随着大语言模型的爆火,AI Agent 的形态已经越来越具体,开始能逐渐被人感知、体验和创造。 Deepmind前科学家、硅谷AI Agent创业者李昂给出的答案是: AI Agent 应该是一个“像人但不是人的东西”。 它应该具备跟世界互动的能力,应该能优雅的将人类模糊的自然语言表达转换成像手机、电脑、机器人这样的硬件能“读懂”的机器语言,代替人类去完成操控硬件的工作。它也是 AGI 这条路上的第一个目标。 欢迎大家收听硅基立场第五期节目,通过这期节目,你能更清晰的了解 AI Agent,以及得到关于 AI Agent 创业的最真切的经验分享。 【主播】 硅基立场主理人 骆轶航 【嘉宾】 Simular AI 创始人兼CEO 李昂(Ang Li) 【时间线】 02:47 AI Agent 应该是一个像人但不是人的东西。 05:46 像人不是人只是一个中间态,最终 AGI 将跟人“没关系”,而是更自然、比人更智能的物种。 11:33 重新讨论一个原始的议题:如何去定义 AI Agent?这个话题最早能追溯到上世纪八十年代。 13:48 Agent 应该具备与人所在世界交互的能力。 19:37 将模糊的自然语言需求转化为精确的具体要求,这一步骤更适合由人类通过Prompt来完成,还是应该更多地依赖Agent来实现? 答案是全都要。 22:40 AGI 应该从真实的世界中诞生,而非诞生于实验室当中。 25:40 Simular AI 是如何让你的电脑自己用自己的? 41:51 看似是关乎每个人生活中个人电脑的产品,但背后驱动人们去用它的,实际上是一些非常现实和复杂的职场需求。 50:13 如果 AGI 被实现,TA应不应该具备死亡的能力? 53:47 将智能与硬件绑定不一定是件坏事,相当于给了智能一个身体,让它变得可控。 56:28 当前的成本很低,20 块就能开始让Agent S控制你的电脑了。 57:33 创业其实就是在啃硬骨头,骨头啃掉了自然就有了市场。 59:49 一个小调查:人们每天会有 5 个小时的时间在移动鼠标。Simular 能帮人节省掉这些时间。 01:02:50 硅谷的创业公司会互相买对方的产品,互为客户和供应商。 01:07:57 Simular 当前在做的事跟 Apple Intelligent属于两条路线,完全不存在被吃掉的情况。 01:11:47 AI Agent 和 AGI 是一个重叠的概念,AI Agent 是人类迈向智能的第一个目标。
- Vol.4 跟硅谷的智能眼镜华人创业者聊聊Meta的新眼镜Orion;以及最适合搭载AI能力的下一代硬件,为什么是眼镜?
在2024 Meta Connect大会上,扎克伯克拿出一副名为Orion的AR眼镜新品,要用它彻底取代智能手机。 从演示视频上来看,使用者可以戴上Orion浏览网页、打视频电话、玩一些简单的3D游戏。以100克左右的重量实现了微型高级计算机的能力,一眼望过去都是未来的样子。 但目前高达1万美元的成本也让他停留在实验机层面,预计要到2030年前后才会正式推出。但毫无疑问的是,Orion让所有人都再次对智能眼镜这个形态的硬件提起了兴趣,尤其是在AI加持下,甚至能成为承载AI最佳的硬件产品。 欢迎大家收听硅基立场第四期节目,我们这次邀请到目前全球头部的智能眼镜厂商VUE的联合创始人JasonGui(桂家勋),来聊一聊智能眼镜这个载体和AI结合的可能性,它的未来以及智能眼镜这个物种应该向哪个方向演化。 【主播】 硅基立场主理人 骆轶航 【嘉宾】 VUE 联合创始人 桂家勋(JasonGui) 【时间线】 03:57 Jason的智能眼镜创业,从 2012 年大学时期就开始了。 08:44 第一款成功的产品是通过做减法减出来的,任何不像“眼镜”的设计都去掉了,45 天在kickstarter众筹了 200 多万美元。 18:45 一个投票调查:你认为未来最适合搭载 AI能力的设备是什么? 22:30 人的头部是感官传感器最多的部位,眼镜作为一个已经有了 800 年历史的老物件,最应该被智能化。 28:32 作为创业公司很难像Meta一样创造10年后的产品,而是要做现在就能在市面上卖的产品。 35:16 目标是要让所有戴眼镜的人都换成智能眼镜。 42:02 现在的智能眼镜就像90年代的大哥大,随着技术的成熟和生产成本的降低,未来必然会成为每个人都拥有的设备。 51:32 好的智能眼镜需要拥有优秀且完善用户体验。 56:01 不管是智能眼镜还是普通眼镜,一定要去线下试。 01:03:42 如果智能眼镜功能足够强大,未来会成为像手机电脑一样的刚需。 01:09:26 科技是帮助人类进化的。AI与眼镜结合最重要的还是找到最刚需的场景,现在还是处于太早期的阶段。 01:14:21 一个做智能眼镜的厂商,未来10年的目标是先做一个像雷朋、Warby Parker这样的全球知名的经典眼镜品牌,将科技和传统相结合。 【关于VUE】 这是一家总部位于硅谷的智能眼镜初创公司。公司由包括 Jason Gui 在内的三位联合创始人创立。 VUE的主打产品是一款名为Vue Glasses的时尚智能眼镜。这款眼镜集成了多种传感器和功能,包括动作跟踪、触控操作、语音控制等,可实现听音乐、接打电话、活动跟踪、语音助手等智能功能,同时保持传统眼镜的外观,适合日常佩戴。 Vue Glasses有光学镜片和太阳镜片两种版本,且提供处方镜片定制服务,满足不同用户的需求。眼镜框采用TR90材质,重量轻,佩戴舒适。 VUE通过Kickstarter众筹平台融资,2016年10月众筹超过200万美元,超出目标4倍,创下当时智能眼镜众筹记录。随后又获得风险投资,2018年开始陆续向支持者发货。 官网链接:vueglasses.com
- Vol.3 对话VAST创始人宋亚宸:神学爱好者创业,做出被马斯克转发的3D大模型
VAST,一家做 3D AI内容生成的公司, 成立仅一年半就成为了这个领域里最头部的企业,以行业最顶尖的技术能力占据超过 70% 的市场份额,几乎你能听说过的国内游戏公司都在用他们的产品来辅助开发。 然而这样的成绩可以说只是这家公司野心的第一步,它想成为的不是 Unity这样的引擎公司,也不是大疆这样的硬件公司,而是想做 3D 领域的 TikTok,将 3D 内容创作大众化和普世化。 更有意思的是,VAST 创始人宋亚宸并非计算机相关学科、电子工程类学科甚至是设计类学科出身,他的专业背景是神学,毕业于Johns Hopkins University,这在满是科学家的 AI 创业领域算是一个异类。 神学到底是如何跟 AI 产生联系?在创立 VAST 的过程中又有哪些思考和经验值得人们学习?欢迎大家来到我们硅基立场播客的第三期节目。 接下来我们会给大家带来一系列关于创业者们的真实故事,力图毫无保留的、不加掩饰的分享关于 AI 商业世界和 AI创业形态的演进,欢迎大家关注我们。 【主理人】 硅基立场主理人 骆轶航 【嘉宾】 VAST 创始人 宋亚宸 【时间线】 08:01 神学是如何与 AI 扯上关系的? 12:40 AI 赋予了人类一个上帝视角,能把天堂搬到现实世界。 21:45 给 3D 内容制作的成本打下来,要让3D的创作成本几乎为零。 30:00 有才华的人不应该困于“拧螺丝”的工作,AI 能释放人类的艺术价值。 35:21 VAST 的诞生源于世界还不存在 3D 内容平台这样巨大的需求空缺,这是一个拿着钉子找锤子的过程,AI 只是实现手段。 39:00 在 2023 年,一个学神学的声称要做 AI,还不是基座模型,凭什么会有人投资? 41:30 “能走到现在这一步真的是团队给力,小几十号人小半年没拿过工资。” 42:39 没钱的时候磨合和聚焦非常重要,就算交学费也不会过于致命。 46:01 绿洲资本在投 钱的同时,也在帮 VAST 梳理路径。不像投资人,更像早期合伙人。 49:33 推荐一本书《源泉》。 52:40 当下资本市场变得更严格和严谨了。一家真正的好公司能拿到他自身价值应得的钱,这对于公司发展来说是好事。 58:10 垄断有利于创新。当公司开始过度竞争的时候,就难免会导致动作变形。动作一变形就要交额外的学费。 01:02:29 当大部分 AI 公司的 API 降价的时候,VAST 还涨价了。 01:06:27 要做 TikTok 的意思,是要让人人都能成为 3D 内容创作者。 01:09:49 凡尔赛时刻:这家没有销售的公司都已经有了 300 多大客户,2 万多中小客户。将客户当做开发者去对待。 01:15:02 人是视觉动物,让人看到 3D 产品的用处和优势,才能更好的吸引投资人。 01:23:23 3D 创作未来将会是一个价值 2-3 万亿规模巨大市场。 01:26:21 当下还没有一家是 VAST 真正意义上的竞争对手。新形态的公司不会建立在旧规则之上。 01:29:39 最后一个小故事分享。当下的 3D 创作是带着镣铐跳舞,希望能诞生出精美的艺术品出来带动 3D 创作整体发展。 【关于 VAST 】 VAST成⽴于2023年3⽉,是⼀家致⼒于通⽤3D大模型研发的AI公司。公司⽬标是通过打造⼤众级别的3D内容创作⼯具,建⽴3D的UGC内容平台,让基于3D的空间智能成为⽤⼾文娱体验、内容表达、提升新质⽣产⼒的关键要素。 2024年初,VAST推出数⼗亿参数级别的3D⼤模型Tripo 1.0,其以8秒完成从图/⽂到3D⽹格模型⽣成的卓越表现,成为市面上上线半年内全球⽤⼾⽣成超过500万个3D模型。 2024年3⽉,VAST与全球顶级开源社区Stability AI共同推出开源3D基础模型TripoSR,该模型创造了0.5秒完成单图⽣3D模型的顶尖表现,⾄今仍是3D⽣成领域开源社区的热⻔项⽬。 2024年9⽉底,VAST推出Tripo 2.0,验证了3D大模型的Scaling Law,也将3D生成推向Sora时刻。 Tripo 2.0采⽤了融合DiT和U-Net模型的复合架构,通过学习捕捉⼤规模数据中的⼏何和材质分布,更好地保证了3D模型⼏何形状的细节和材质的输出质量。Tipo 2.0能够完成10秒⽣成形状⼏何,10秒⽣成纹理及PBR,其⽣成效果在全球所有3D⽣成项⽬的匿名测试中均保持断崖领先,为3D⽣成领域设⽴了通⽤模型新的效果标准。 网站地址:www.tripo3d.ai
- Vol.2 硅谷明星AI公司 Character.ai 的终局
近期,硅谷明星AI公司 Character.AI 以25亿美元的价格被谷歌收购,引发了人们对陪伴式AI模式的反思。Character.AI 的创始人 Noam 及其团队原本致力于打造有角色属性的通用型AI助理,但最终用户却将其用作陪伴聊天工具,这与创始人的初衷相悖。 我们将深入剖析 Character.AI 的案例,探讨 AI 陪伴模式的终局及其对全球创业者和AI行业未来的深远影响。讨论情感陪伴AI如何填补现代社会中人们内心的空白,以及这种心理需求如何反过来塑造产品的发展方向。陪伴式AI的未来究竟在何方?它将如何与人类的生活更紧密地交织在一起? 欢迎大家收听本期节目,欢迎来到硅基立场。 【主播】 硅基立场主理人 骆轶航 【嘉宾】 前聆心智能CEO 张逸嘉 【时间线】 04:15 说 Character.ai 是陪伴类AI产品,其实是一个误会 08:50 Character.ai 原本想成为超级个人助理,却被用户用成了角色陪伴,这就麻烦了 17:30 Character.ai 的创始人是相信AGI这一卦的,但用户不关心这些 19:10 AI 的“智力”是融资的保障,而不是陪伴感 20:23 不过在Character.ai之前,没人能想到“角色扮演式的陪伴”会是一个刚性需求。 25:15 陪伴类AI 产品的聊天内容,可再训练的价值远低于生产力AI用户生成的内容。 30:00 ChatGPT的GPTs,其实就是Character.ai。 32:03 为什么角色扮演类的 AI 产品在资本市场不值钱 52:33 Character.ai的被收购,不意味着中国的陪伴式产品没有机会。 59:58 拿着语言模型这个"锤子",去锤陪伴的“钉子”,问题在哪里? 1:05:33 AI陪伴跟机器人的结合,是不是一个赛道? 【Link】 聆心智能:https://www.ai-beings.com/ Character.ai:www.ai-character.ai 星野:www.xingyeai.com
- Vol.1 狂奔中的AI行业,跟10年前的移动互联网到底像不像?
回顾 10 年前的移动互联网,我们经历了百团大战、网约车大战、社交网络和短视频的兴起这些热闹的大事。当时,涌入移动互联网的人们就像发现了新大陆一样,互联网用户规模翻了五六倍,诞生了许多新巨头和独角兽企业。当下正处于风口浪尖上的 AI ,似乎像是移动互联网的翻版,但细看又好像也全然不同。 如今中国 AI 该如何再往前一步,是继续“卷”模型,还是另辟蹊径寻找新的应用场景和商业模式?是坚持“改变世界”的宏大愿景还是脚踏实地,先赚点“小钱”? 欢迎大家收听本期节目,欢迎来到硅基立场。 【主播】 硅基立场主理人 骆轶航 【嘉宾】 播客《乱翻书》主播 潘乱 播客《屠龙之术》主播 庄明浩 本期由 「乱翻书」× 「屠龙之术」 ×「硅基立场」联合出品 【时间线】 07:59 现在的这些 AI 公司打过什么仗?凭什么拿那么多钱? 10:10 现在AI 这波只有热闹程度像 10 年前移动互联网,其他细节都不像。 11:43 到底谁是大模型四小龙?(中国有六家大模型四小龙公司,累计日活可能也就1000多万)。 13:05 一个日活200万的产品就开始“寡头化”,这事儿就不对。 16:22 腾讯和字节的幽灵在中国 AI 的上空徘徊。 27:18 Prompt Engineer非常难。 31:54 快手是中国一个非常宝藏的公司,包括在AI这一波。 43:19 当下 AI 业界缺乏真正意义上的产业交流和合作。 44:42 这一波 AI 对这一代的创业者而言,天生就是一个更难的命题。 48:22 再谈 Kimi 的种草现象。 01:03:09 现在的大模型,不像 10 年前的移动互联网,却像 30 年前的早期编程语言爆发的情况。 01:05:14 对普通用户来说,当时玩天涯和西祠胡同的热情,要远高于今天玩大模型。 01:16:49 AI 应用还是拿不到钱,导致当下作坊型的创业越来越多。 01:24:28 今天这些在一线干活的 AI 创业者朋友们,工作的正反馈从哪儿来? 01:35:12 我们当下期待 AI 领域能出现比字节更大的东西。 01:38:16 我们当年给了自动驾驶太多钱了,现在才给生成式 AI 多少? 01:49:34 这应该是有史以来的,个体员工价格最高的一次创业。 【监制】 椰子 【后期】 雯琪