十字路口Crossing

127378已订阅

十字路口Crossing

Koji、Ronghui

单集更新

节目详情

哪条路线，才能通往「世界模型」的终局？｜对话黄碧薇：Aether AI 创始人
🚥 总有人在朝着星辰大海前进。世界模型是 2026 年 AI 与具身智能领域最热的关键词之一。但越是热门的词，越容易被过度使用：视频生成、3D 生成、JEPA、VLA、WAM，似乎都可以被叫作世界模型。可当我们真正谈论「世界模型」时，我们到底在谈论什么？本周「十字路口」邀请到 Aether AI 创始人 / CEO 黄碧薇教授。她从德国马克思普朗克研究所、CMU 到 UCSD，一路深耕因果发现与因果 AI，是这个领域的重要学术贡献者之一。 Aether AI 最近迅速完成 2000 万美金的天使轮融资，黄碧薇选择把因果 AI 这套长期被认为「更合理、但更难实现」的方法，带到 Physical AI 和机器人大脑的问题里，打造「因果世界模型」。我和黄碧薇聊了世界模型的定义边界、视频生成为什么不等于世界模型、VLA 为什么在真实任务中碰壁、WAM 为什么可能只是中间态，以及「因果世界模型」想要解决的三个核心问题。这也是一期关于创业选择的节目。为什么一个 UCSD 教授会在 2025 年初决定下场创业？她看到了什么信号？如果你正在关注世界模型、具身智能、机器人、因果 AI，或者正在思考下一代 AI 范式会从哪里出现，这期节目也许能帮你重新校准一个问题：哪条路线，才能通往「世界模型」的终局？ 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 🔴 🟡 🟢 00:43 快问快答：求学和科研经历、MBTI 与星座、一句话介绍 Aether AI 与产品、融资情况、创业前经历 🟢 02:13 三条世界模型路线，和那条没人提的第四条 * 视频生成、3D 生成、JEPA 都在被叫作世界模型，可当我们说「世界模型」时，到底在说什么？ * 世界模型 ——一个听起来很宏大、用起来却很不准确的词，到底是严肃的技术对象，还是被混用的热词？ * 「不是那三条路线，是我们在做的第四条」 🟢 04:49 因果世界模型，到底不一样在哪 * 真正的世界模型，要在隐空间里同时学会三样东西——是哪三样？ * 同样是 AI，凭什么 LLM 不懂因果也能逻辑严密，世界模型却非因果不可？ * 为什么 LLM 偏偏只在自然语言和 coding 上大获成功？ 🟢 10:33 第一版因果 AI 世界模型 * 满分 10 分：VLA 天花板 5 分，WAM 6.5 分，因果路线……她敢打几分？ * 训出第一版，预期要喂多少小时数据、用多少张卡？ * 四类数据怎么配比？模拟、ego-centric、视频、遥操，谁占 80%，谁只占 20%？ * WAM 只是个「中间态」——比 VLA 好，但为什么注定到不了终点？ 🟢 16:17 因果学界的「三国鼎立」 * 三个门派、三位 80 多岁的泰斗，早年居然「互相不服谁」——这是一段什么样的江湖？ * 图灵奖得主 Judea Pearl 和哈佛的 Donald Rubin，分歧到底在哪？ * 师承 CMU 的黄碧薇，站在了这三派的哪个位置？ 🟢 22:32 因果简史 * 从亚里士多德、易经，到临床双盲实验，再到 80 年代末 CMU 三位教授的一个算法。 * 做实验太贵、很多时候根本没法做，科学家于是把目光转向了「只看观测数据」——这条路是怎么走通的？ * 黄碧薇这些年最核心的贡献，是在一个满是隐变量、bias、缺失值的「不完美世界」里做因果——为什么这反而最难？ 🟢 20:35 因果和大模型 * 过去因果帮 LLM，其实只有内、外两种方式——分别长什么样？ * OpenAI、Anthropic、Google 这些大厂，到底有没有把因果 ship 进产品？ * 两个创业选择摆在面前。 🟢 41:08 PhD，到底还值不值得读 * 加入 OpenAI，一年 3000 万美金——这时候还该静下心做科研吗？ * 什么样的人才该读 PhD？ * 怎么分辨自己对研究是「真欲望」，还是只想要个学位？ * 工业界和学术界的墙正在变低，这对纠结的人反而是好消息——为什么？ 🟢 47:17 五年后回头看，今天什么是错的 * 如果能向一个无所不能的上帝问一个问题，她想问的，竟然关于「因果是否真实存在」。 * VLA 不是终局、WAM 也不是终局，但它们各自留下了什么？ * 如果因果不存在，「我们会集体陷入存在主义的巨型危机」。欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 本期主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站
50分钟 · 3天前
12885
24
高手怎么用 AI？普通人怎么学 AI？投资人如何投 AI？｜对谈课代表立正
🚥 本期「十字路口」有个很好的时间点：2026 年过半，AI 已经强到足以改变“怎么工作”，但离“无摩擦地替你把事做完”仍然有距离。 ➤ 上半场，我邀请到身边用 AI 的“高手”课代表立正，他是康奈尔经济学博士，创办了 Superlinear.Academy，曾在 Amazon、Meta、腾讯工作，在初创期加入 Statsig，后被 OpenAI 收购。课代表立正分享了高手的 AI 为什么会越用越强？——他们在想“我能为 AI 做些什么”，并且把生活和工作的大事小事全都交给 AI。他也分享了一些普通人如何用好 AI 的建议 ——比如，第一条：停止使用 ChatGPT 式聊天，改用 Codex / Claude Code / Cursor / Manus 这类 agentic 工具。 ➤ 下半场，我们交换角色，由课代表立正采访我：2026 年的 AI 创投观察与思考。我分享了在一线体感里同时存在的希望与失落——希望是创业与资本热情前所未有，且“人类与 AI 的最佳协作方式仍未被发明”，摩擦本身就是机会；失落是商业价值高度集中到基模，它们吞掉了绝大多数由 AI 而生的收益，应用层常像“推土机前捡钢镚”，传统软件的老路径（需求—产品—卖给更多人）变得更难。此刻，创业与投资的机会正在两极化：要么往天上跳（AI for Science / Physical AI），要么往地里钻（行业深水区的流程改造与交付 / FDE）。最后，我还分享了自己最近关注的 5 个 AI 创业方向，欢迎 AI 创业者们找我探讨。 —————— ps，向大家推荐大家关注课代表立正和鸭哥的 Superlinear Academy。当我们聊到「学 AI」究竟应该学什么、怎么学的时候，他们给出了一套特别好的方案。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 🔴 🟡 Part 1 - 课代表分享：高手怎么用 AI？普通人怎么学 AI？ 🟢 01:40 高手用 AI，到底差在哪 * 高手和普通人的差别，在哪两点？ * 想学世界模型，他没看论文，而是让 AI 写了一篇三万字的办公室恋情狗血小说——为什么这招有用？ 🟢 04:33 今年学 AI，最重要做一件事 * 为什么他坚持「立刻停止使用 ChatGPT」，去用 Claude Code / Codex / Cursor？ * 蒸汽机换成电机，工厂效率只涨了一点点——真正的跃升要等到一件事发生，是什么？ * 用聊天框比用 agent 工具「差了三个点」。 🟢 10:56 好 skill 和 context，才是护城河工具一样、模型一样，最后拉开差距的只剩一样东西。 * 一个好 skill 的本质是什么？ * skill 能不能被商品化卖钱？ * 用好 AI 的第三步——积累上下文和提炼上下文，为什么是两个要分开做的动作？ 🟢 15:03 摸着石头过河，石头不见了 * ——消失的那块石头，到底是什么？ * 从需求端和供给端两头看，旧的创业逻辑为什么突然不灵了？ * 他上一家公司能列出一百个「你该买我」的理由，可现在客户跟 Codex 聊两句就走了。 🟢 22:01 AI 会带来第二次文艺复兴 * 为什么非常看好自己孩子的未来？ * 当 AI 把「螺丝钉」彻底取代，人被逼着只能去做一件事。 * 未来的教育，可能不再是精通一个专业，而是「略懂一二」一百个专业。 * 「你以为学 AI 是学名词，其实学的是动词。」 . 🟢 🔴 🟡 Part 2 - Koji 分享：年中对 AI 创业投资的观察与思考 🟢 25:49 2026 的创业体感：泡沫的另一面 * Paperboy AI 创始人那句让 Koji 印象极深的话：人类和 AI 的最佳协作方式，很可能还没被发明出来。 * 「软件已死」「悲观者往往正确」——但为什么只有乐观者才可能成功？ * 资本前所未有的热浪，和显而易见的泡沫，是同一件事的两面。 🟢 27:54 在推土机前面捡钢镚一张图显示：这一波 AI 创造的商业价值，90% 被模型公司吞掉了。 * 既然在推土机前捡钢镚只能捡到钢镚，那剩下两条活路是什么？为什么一条要「往天上跳」、一条要「钻到地下」？ * AI for science，for what？ * 具身智能动辄百亿估值的背后。 🟢 32:51 FDE：把数字员工带进公司 OpenAI 和 Anthropic 几乎同时发了公告，提了同一个新词。 * FDE（前端部署工程师）到底是个什么角色？ * 这个词其实早就存在（售前、客户成功、驻场工程师），但被重新命名之后，发生了什么？ * 这么大的人才缺口，为什么到现在还没井喷？ 🟢 43:30 新时代的 VC 长什么样 * 叙事连接器、connector as a service、新型财务伙伴——这三个角色分别在解决创业者的什么难题？ * 「自强则万强」——为什么一个创业者太需要 VC 指点，反而会让人「非常担忧」？ * 好投资人应该像副驾，而不是一路喊红绿灯的人。 🟢 50:00 五个方向 * everything agent：沙箱、记忆、通信、支付… * 给 agent 设计产品：飞书口碑飙升和它的 CLI 有什么关系？当 agent 找不到你的工具，你就「等于不存在」。 * 视频模型：可灵 5 亿、Seedance 15 亿美金 ARR，云南小镇一个拍婚纱照的青年做出了全球刷屏短片。 * 软件不会消亡，GUI 也有未来。 * 和语音相关的一切。欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 本期主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站
64分钟 · 11天前
29646
75
OpenAI 和 Anthropic 共同看好的 FDE：AI 时代的新岗位出现，旧分工松动｜对谈 Rolling AI
🚥 上月，Anthropic 和 OpenAI 在同一天分别宣布了各自的十亿美元级的企业 AI 合资公司，并且都称自己在做的事情是 FDE（Forward-Deployed Engineer，前置部署工程师）——帮助 AI 进入企业，从“能用”走向“上岗”，从“展示能力”走向“交付结果”。本周「十字路口」，我们聊 FDE 这个正在被重新定义的岗位与分工：它究竟是在把“售前/交付”换个名字，还是代表 ToB AI 时代新的组织结构与商业边界？当模型越来越强，最后一公里为什么依然最难？企业真正缺的，到底是更强的模型，还是能把 AI 带进流程、接入系统、治理知识、持续迭代并对结果负责的人？我们的嘉宾是 Rolling AI 的两位合伙人阿甘和刘开，他们是中国在企业 AI 落地与“交付能力产品化”方面实践最深、也最具代表性的团队之一。如果你在寻找下一波 AI 的机会，这期内容希望给你一个可行动的视角：旧分工在松动，新岗位在出现，而新的创业机会，也往往从这些缝隙里长出来。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 01:08 快问快答 * 年龄、毕业院校、MBTI 与星座、一句话介绍 Rolling AI、收入与利润、团队规模、创业前经历 🟢 02:19 FDE：AI 不是软件，是劳动力 OpenAI 和 Anthropic 同一天宣布成立十亿美元级企业 AI 合资公司，都说自己在做"FDE"——他们到底在描述一件什么事？ * 传统软件是工具，需要人来操纵。但 AI 本身就是劳动力。 * FDE 做的，其实有点像 HRBP：把"数字员工"送进企业。 * 为什么从 BCG 出来做这件事？MBB 在服务中国民企时，遭遇了什么困难？ * 传统咨询交付 200 页 PPT，今天他们交付的是智能体。 🟢 08:22 首个案例：一个人带 50 个机器人，服务 600 万用户 * 出生率下滑，乳品企业急着找第二曲线。他们需要的不是几个营养师，而是"无限个"营养师。 * 全国注册营养师 40 万，目标用户是 8,000 万——供需差距 200 倍。AI 是怎么填上这个缺口的？ * "如果有人说我要减肥，你的第一句话应该是：你又不胖，你为什么要减肥。"——这是人类师傅教给 AI 的。而找到好师傅，才是 FDE 最难的事。 🟢 19:58 FDE 是什么角色？带着一批"清北学生"去便利店上班的工头。 * FDE 要做好三件事才能撤场：业务融合、知识治理、系统对接。 * 一个好的 FDE 需要三种核心能力：能一眼看穿业务痛点本质、人机协作的原生感知、能用 AI 工具快速构建原型。 * 这样的人，能短期培养吗？——不能。 * "你刚毕业，我想不到任何一件你能做、AI 做不了的事情。" 🟢 25:09 SOP 代表落后——标准化的终结 * 他认为 SOP 代表着慢、代表着落后——这是暴论，还是有逻辑支撑的判断？ * 从消费端的"千人千面"（抖音），到生产端的"千人千面"（每个门店自己的经营决策）。 * 总部从"管控型"变成"赋能型"，意味着怎样的组织重构？ * 以及，哪类管理层会最先被消失？ 🟢 28:21 那些消失的企业，真正输在哪里？兰开夏郡的纺织业接了电，但没被电拯救——因为他们只把电接到了原来蒸汽机的大轴上，整个生产方式还是蒸汽时代的。 * "AI 这次变革对社会的影响幅度，会超过互联网，像当年电力革命一样大量取代智力劳动。" * 每次大的生产力革命，都有 95% 的企业消失——而他们都接了电、上了网。那些消失的企业，真正输在哪里？ * 技术在整个 AI 落地过程中，占比不超过 1/3。剩下的 2/3 是什么？ 🟢 32:01 AI 落地失败率超 50%：三大死法 * 第一大死法：CEO 对 AI 有"超出现实的预期"——"上了 AI 企业就起飞"。 * 第二大死法：让 IT 团队来主导 AI 项目。"谁懂怎么对付客户、让他买保险？是业务团队，不是 IT。" * 第三大死法：激励机制没跟着变。AI 带来了新的生产力，但生产关系没变——结果会是什么？ 🟢 43:29 应届生在 AI 时代能做什么？ * Rolling AI 的高二实习生，他说"丝毫不觉得输过任何一个平庸的五年经验咨询师"——为什么？ * 商业 sense 和 judgment，能培养吗？他说他个人还没找到路径——"有些东西是天生的"。 * FDE 时代，判断一个人值不值得用，真正在看的是哪三件事？ 🟢 46:49 OpenAI 和 Anthropic 为什么都突然下场做 FDE * 一种是"数据饥渴"，一种是"利润饥渴"——真相是？ * 大模型进入行业，遭遇的最大瓶颈不是模型能力，而是行业数据和知识的短板。 * ToB 本质上不是软件能独立完成的事，而是一个服务业——"需要又懂 AI、又愿意扎进去的服务者，才能改变这个世界。" * 为什么 OpenAI 和 Anthropic 的合资公司全都是 PE 结构？收服务费根本收不到那部分 upside。 🟢 49:08 FDE 公司不应该被 VC"投"，而应该被 VC"拥有" "我们一年陪跑收 600 万，但帮客户省了几千万、多赚了几千万——那差价去哪了？" * 每一家 PE/VC 的投后部门，核心能力之一将会是帮被投企业做 AI 转型。 * "我们在同一个行业，只服务一家，绝不服务另一家。" * 当 AI 能带来真实的业绩增长，单纯按日收咨询费这件事本身就不够了——未来的商业模式指向哪里？Service as Software，还是 Result as a Service？欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 本期主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站
55分钟 · 18天前
21083
73
2026 AI 游戏全景扫描：四层图景、三大误区、一个共识缺口｜对谈 405 游局筱宁
🚥 「AI+互动娱乐 / AI+游戏」正处在一个奇妙的阶段：碎片化的 Demo 层出不穷、技术进步快到让人恍惚——AI 生成小游戏、交互短内容、AI NPC、世界模型、实时多模态——但真正能在大众层面形成共识的爆款作品仍然稀缺。本期「十字路口」和关注 AI 互动内容与游戏的播客「405游局」串台，邀请到主播 / 资深游戏从业者筱宁，一起做一次 2026 年 AI 游戏的“全景扫描”：我们把行业拆成“四层图景”，指出三种最常见的误区，并讨论那个最关键的共识缺口到底是什么——以及它为什么更可能从野生土壤里长出来，而不是从大厂里“立项做出来”。如果你是 AI 创业者、投资人，或正在关注下一代内容平台、互动娱乐与 AI 游戏，这期节目希望能给你一个框架：哪些确定了？哪些还在幻觉里？下一阶段最值得跟踪的变量在哪里？ 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 00:11 Opening * 游戏行业对这波生成式 AI 的反应，比互联网公司慢了很多。 * 筱宁在头部大厂做 UGC 游戏制作人，但有一个体感让她决定离开。 * 赛道的两个坐标：「互动」和「好玩」。 * 游戏真正的竞争对手，不是另一款游戏，而是抖音。 🟢 02:48 行业的四层图景 1. AI 作为工具：服务于互动内容/游戏的创作流程（更偏“提效/基建”）⁠⁠ 2. AI 作为创作入口：以 AI 作为新的“生成入口/创作方式”，更关注结果而非流程⁠⁠ 3. AI 作为交互对象：典型是陪伴类、AI NPC 等（把 AI 当作你在内容里“对话/互动”的对象）⁠⁠ 4. AI 改变娱乐关系：改变“谁创作/谁消费”、以及社交关系/娱乐关系如何被构建（例如“多人 + 一个 agent”的场景，AI 从 NPC 变成“社交基建/氛围调节”）⁠ 🟢 05:45 眼前一亮的作品们 * 《星布谷地》的娜洛做了三件事：示范怎么聊天、救场、调节氛围。当这三件事都做到了，它已经不是 NPC，而是一个社交基建的角色。 * 任天堂的《朋友收集新生活》（Tomodachi Life）：捏人、设定剧情、当造物主、当导演、再当观众——「创作即消费」这个体验，为什么他觉得特别有意思？ 🟢 10:43 AI 版愤怒的小鸟，还没出现 * 愤怒的小鸟不是手游史上最赚钱的，但它是第一个让所有人形成共识的那个。 * 为什么用愤怒的小鸟来类比？ * 那个关键时刻目前还没出现——不是因为技术不够好，而是还缺少一件具体的事情。 * 「AI 版愤怒的小鸟」更可能从创业者中野蛮生长，而不是从大厂内部长出来。 🟢 17:54 大厂 AI 布局腾讯、字节、米哈游、网易——面对 AI，四家公司走的是四条路。 * 改变最大的一家，并不是资源最多的那家。 * 米哈游做了一件其他纯游戏公司几乎不会做的事情——「动到模型」去做尝试。「技术宅拯救世界」的基因，在这里有多直接的体现？ * 世界模型（Genie 3 等）真的要改变游戏了吗？ 🟢 22:31 AI 人不懂游戏的三个盲区 * 「游戏生成」这个词，本身就是对游戏工业化难度的低估。 * 视频生成出来就是完成品，但游戏生成出来只是开始。 * 「无限选择，不等于好玩」。 * 我们高估了自然语言在互动娱乐中的比重。手感、点击反馈、声光电刺激——这些跟语言根本没有关系。 * 对于很多内容产品来说，「可生成」是追逐的终点；但对游戏和交互来讲，「可生成」只是可被设计的起点。 🟢 25:15 「AI 时代的抖音」，靠谱吗？ Loopit、AIPPY、Rezona、Riffle… 大家都在说要做下一个交互内容平台。 * 创作门槛被极大降低之后，紧接着的问题是？ * 有两个核心问题至今没有被解答。 * 「我们俩都生成了一个贪吃蛇，我和你的价值怎么被别人分别看到？」——如果创作者的价值无法被凸显，平台的供给侧会发生什么？ 🟢 37:54 TaptapMaker：用过的人两极分化做过策划的人用它：「太好用了。」没做过策划的人用它：「还不如 Claude Code。」 * 同一款工具，游戏从业者和非从业者体验差距为何那么大？ * 有人在上面复刻了 Minecraft 世界，有人做了完整的 Roguelike——原来要一个团队几个人做两三个月，现在一两个人两周。 * AI 互动影游（带分支线的交互视频）：比短剧更复杂，成本百倍降低，它的春天什么时候到？ * 最长期跟踪的三个问题：交互娱乐里的短内容机会、AI 3D 管线什么时候成熟、以及愤怒的小鸟时刻最终会以什么形式出现。 🟢 43:48 当 Claude Code 成了最好玩的游戏如果让游戏策划连续说「最近玩过最好玩的游戏」，越来越多的人，答案已经变了。 * 商业化手游的工业节奏（42 天大版本、21 天小版本），是让热爱最容易被消磨的地方。 * 最近好多人说自己最爱的「游戏」是 Claude Code。 * 感性指标和直觉反应，在互动娱乐的早期，为什么比任何理性分析都更重要？欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
47分钟 · 25天前
6036
8
人类和 AI Agent 的最佳配合方式，还没被发明｜对谈 Paperboy
🚥 本周，十字路口的嘉宾是 Paperboy（https://www.paperboy.com）团队。John Yang 21 岁，CEO。Jett Chen 19 岁，CMU 大一在读，同时是 founding engineer。Paperboy 团队 12 人，10 位工程师，融资 470 万美金。 John 认为：人类和 AI Agent 配合工作的最佳方式，很可能还没被发明出来。虽然已经有了 Claude Code、Codex、Manus、OpenClaw，但它们本质上都是 session-based + prompt-based。用户需要打开一个窗口，输入 prompt，等完成，关掉。下次从零开始。 Paperboy 正在尝试找到一种更自然、更连续、更可协作的 Agent 界面与记忆结构——Agent 应该通过观察你用电脑来自己学习，用 IM 而不是 session 来组织对话，主动找你，而不是等你 prompt。如果你在做 AI 产品、AI infra、或正在思考 Agent 如何进入团队工作流，希望这期内容会给你启发。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 00:00 快问快答 * 年龄、毕业院校、MBTI 与星座、一句话介绍 Paperboy、融资情况、收入与利润、团队规模、创业前经历 🟢 01:59 起点：现在的 AI 产品，我用着不爽 * 今天的 AI 产品都有一个共同的问题：你必须把文件、邮件、个人信息手动扔进对话框，然后对话完就消失了。 * 三个核心痛点：不该这样协作，不该这样留下历史，不该这样主动。 * 「人类和 AI 配合工作的最佳方式，很可能还没有被发明出来。」 * 现有的 Chatbot 和 Agent 产品形态是 AI 时代的「默认答案」，而默认答案几乎从不是最优解。 🟢 06:21 Claude Code 轰炸之下 * Agent 赛道的三个机会：一，让 agent 真正从用户环境中学习；二，足够个性化，做到主动的同时不造成干扰；三，使用体验必须极其直觉——「你不该像学新工具一样学怎么用它。」 * 这三点依然要靠人类团队，市场上冒出的新东西还没有打破这个框架。 🟢 08:01 Agent 的两大问题 Cursor 和 Manus 是目前最成功的 agent 形态，但 John 说它们有两个根本性的问题——这直接定义了 Paperboy 要做的事。 * 问题一：基于 Session。你有一堆工作区、一堆对话，每次开新 session 就像重新认识一次，context 不跟着你走。 * 问题二：Reactive（被动）。你必须先问，它才回答。Agent.md 文件要主动维护。 * Agent 应该知道你的鼠标移动、视频音频、所有电脑活动——context 应该比 context window 长得多。 🟢 14:21 屏幕数据成了行业共识之后「收集用户屏幕数据去构建 Context Layer，已经一定程度上成为行业共识。」 * Codex、Littlebird 在做，各路玩家都在做，但接下来怎么做——是预测用户下一个 Keystroke，还是预测他接下来一个小时要做什么——还没有人找到最佳”配方“。 * 这个领域需要大量 engineering 和 research，「在今天，对一家公司来说，探索这个区域还是一个非常好的选择。」 🟢 16:46 Mini Vivian & Auto John * Mini Vivian 是团队在内部 Slack 里训练出来的 Paperboy 实例，理解 Vivian 曾经说过的所有话、她的判断品味、她的招聘标准。 * 它能帮 Vivian 从 GitHub、小红书、推特挖掘候选人。 * 和 Auto John（John 的 agent 分身）聊天，有时候比直接找 John 更顺。 * 「期待我可以直接躺平，让 Auto John 成为比我更聪明的存在。」 🟢 27:36 微信群聊，启发了界面设计 * 不同角色的「侧边栏」完全不同，如果每人一个定制版，根本没法做成产品。 * 转机来自微信——同一批人，可以同时存在于多个主题不同的群组里，这是人类组织信息最自然的方式，而且不会让人觉得烦。 🟢 33:36 The Last Interface 与五种速度 * Paperboy 目前唯一一篇 blog 标题叫「The Last Interface」——context 的速度层级，决定了产品形态。 * 「节奏分层」理论（Pace Layers）：时尚、商业、基础设施各自以不同的节奏变化。 * 映射到 AI 产品：1 秒内的 task 可能最好的形式是 autocomplete；几小时的 task 用 IM；更长的 time horizon，产品形态还是「一个非常值得被探索的区域」。 * 「五种速度」不是说 Paperboy 真的只做五种，而是一个思考框架：你在哪个速度层的 automation 上，直接决定了你应该做什么样的产品。 🟢 42:09 两种工程师、一本书、一个教练 * 12 人的团队，John 说他招的是两种完全不同的人。 * 第一种：像 Jett 这样——年轻、高智商、充满创造力，能为每一个难题极速搭出 prototype。第二种：领域基本功极度扎实的人，比如来自 AWS 做过 Windows 内核开发的工程师，来负责底层基建。 * 管理经验几乎全靠自学：《格鲁夫给经理人的第一课》、《创业维艰》、《万亿美元教练》——以及和一位前 VC 高管出身的 CEO 教练每周一小时。 * 找教练比心理治疗好太多，原因是：「你可以谈情绪，然后接着谈业务里正在发生的一切。」 🟢 48:07 拒绝过 Cognition、Vercel、Sentry，然后呢 * Million 时代，他们收到过来自 Cognition（Devin）、Vercel、Sentry 的收购邀约。 * 「加入那些公司，某种程度上就像是做一名普通员工，你必须为别人的想法工作。」 * 最喜欢的 AI 产品？Jett：Codex——「它以最 ambitious 的形式在定义未来的软件工程师是怎么 work 的」，而且核心 agent 是开源的。欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
56分钟 · 1 个月前
17512
41
探秘 Claude Code，搞懂 Agent Harness｜对谈来新璐
🚥 为什么说 Agent 的上限来自 Harness？当我们讨论 Harness 时，我们究竟在讨论什么？不久前，Claude Code 源代码泄露，许多 Agent Harness 的关键模块得以完整呈现，成了一份极佳的教学标本。而在技术高速变化的红利期，主动理解新技术往往能带来很高的认知增量。因此，本周「十字路口」邀请到来新璐，一起聊聊 Agent Harness。新璐是 ShareAI 开源社区发起人，他撰写维护的《Learn Claude Code》教程在 GitHub 上获得超过 50k Star。在本期内容中，我们把 Agent Harness 从概念词拆解成工程语言，介绍它的三层框架：会跑（执行层）→ 跑久（状态层）→ 跑稳（治理层）。同时，我们也梳理了 Claude Code 中值得借鉴的多个机制：更多 context、更少 control 的思路、“零上下文管理”的哲学、长程任务的接力式交接策略，以及让 Agent 越用越聪明的“做梦”式记忆维护与迭代机制等新璐作为典型的一人公司，刚完成数百万美金融资；他也分享了自己对 OPC 的独特观点，甚至认为“未来只有 0 人公司，没有 1 人公司”，颇具启发。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 00:49 快问快答：年龄、毕业院校、MBTI、星座、一句话介绍公司、融资情况、团队规模、创业前经历 🟢 01:52 模型以外都是 Harness 机甲、大脑、机器人、智商120——Harness 到底是什么 * 模型以外都是 Harness * Agent 上限由 Harness 决定吗？ * 模型智商已在 120–170 之间；Agent Harness 像机甲——不提升智力，但极大扩展能力 🟢 02:47 GitHub 50k star，是怎么来的？这个Agent教程，其实不只是写给别人看的——它本来是新璐自己整理的"造 Agent 心法"。 * 9 个月前动笔，出发点是"把 Claude Code 套网页壳就能得到一个强大 Agent 产品"的简单直觉 * 开源社区当时流行 LangChain、LangGraph等 prompt pipeline 做法开发“伪Agent”，是一场派系之争——"Prompt Flow-Driven vs Agent Native-Driven" * LangChain 过时了吗？ 🟢 04:02 Bash is all you need Claude 推出 Manager Agents 之后，大家还需要自己搭 Harness 吗？ * 就像 Next.js出现后大家不再关心底层运行原理，两三年后 Agent Harness 也会收敛为开箱即用 * 但现在是技术周期红利窗口——不懂 Agent Harness，做出来的Agent产品"缺乏灵魂" * 今天的 PM 和过去的 PM，指的根本不是同一种人 🟢 07:04 Harness 三层拆解用两周时间、多 Agent 协作，从零写出一个 C 编译器——这个经典案例背后，到底走了哪三层？ * 第一层：执行能力层 ——文件增删读写、浏览器、语言解释器；配错权限后果是什么？ * 第二层：上下文与状态层 ——system prompt、skills、memory，以及上下文窗口满了之后 Agent 如何"接力交棒" * 第三层：治理与编排层 —— 数百上千 Agents 如何组织协作？测试 Agent 为什么不能同时拥有修改代码的权限？ 🟢 12:05 KB 的 K 系列Agent工具链他们公司叫 Komputer Blue，代号KB，目标是构建By Agents & For Agents的整套开源Infra * Komputer：用 TypeScript 重写 Unix 文件系统和 bash，给 Agent 一个"熟悉的生活环境"；支持 WebAssembly 时切换WASM实现； * Kruntime：Agent Runtime 层，提供让人类开发 Agent 的接口，以及Agent 派生 Agent的接口 * Kwatch：Agent 观测层，分析 Agent 任务在哪里卡住，反向指导 Agent 设计迭代 * Krl：把 Agent 在 Runtime 上沉淀的轨迹数据拿来强化学习或做上下文层的自迭代 🟢 13:55 vs. AWS AgentCore、阿里云 AgentBay 云服务厂商当然也想做这一层 * K 系列 Agent 工具链的核心理念：在离用户更近的场景运行 Agent，任何能跑 JavaScript 的场景都能用——浏览器、插件、App、Electron、小程序、纯静态网页、全栈 SaaS * 差异化：把Claw-Agent的运行时轻量到由纯数据结构模拟的 KB 级Unix虚拟计算机环境，而不是把 Linux 和浏览器全塞进去 * 新璐认为要让 Agent 工作好的方法是给每个 Agent 一台专用计算机，一般通过虚机提供，但大多 Agent 完成的大部分工作不需要真的 Linux虚机（且成本高昂），像编译器、浏览器这类重工具原本就不该放进给每个 Agent 的虚机环境 🟢 17:38 Memory 的流派 * 完全结构化（知识图谱 + 向量搜索）：精细存储的知识结构，支持 pipeline 知识推理，rule-based，新璐不喜欢 * 半结构化（Unix Files + Markdown + Agent 驱动更新）：Claude Code 和小龙虾都是这样做的；Claude Code 中的 auto-dream 机制：每隔一天触发后台 Agent 对最近会话做"重放"，纠错、合并、更新记忆——就像做梦 * 模型内化 —— 距真正生产落地还需要～ 3 年时间，且记忆难批量提取 & 无损转移，容易被单边模型提供商绑定 🟢 22:49 共识与非共识 * 共识：CLI is all you need——"Bash is all you need" 这句话是新璐 9 个月前写在开源仓库里的标语，现在成了行业共识 * 非共识：大部分23年 ~ 25年诞生的主流开源 Agent 框架仍在用 PromptPipe + Node Graph的老路线 —— 就像齿轮与传送带编织的流水线 * Unix 从 1971 年就存在，LLM预训练语料中 Linux 命令有数十亿条sample；MCP 提出才两年，预训练占比不到 0.1%——这解释了为什么 CLI 工具的任务完成率比 MCP 高，并且 shell 具备对CLI命令的可组合性 & 二次编程空间 🟢 26:33 Claude Code 源码泄露：最大的惊喜是什么让所有人看到了一件事：这家公司在"上下文管理"上做了多少别人没有做的工程工作 * 上下文压缩策略：工具 output 何时删、窗口满到什么阈值开始交接、下一个 Agent 初始化时加载什么 * Fork Agent 机制：每轮结束触发 turn stop hook，Fork 一个 Agent 复用 KV cache 做记忆更新 * 记忆文件格式和 skill 保持同一套哲学：前三行 YAML，先读 description 而非全文 * 新璐的结论："好的 Harness 要和模型的inference逻辑自洽，和Agent模型进步方向正交" 🟢 34:05 好 Harness 的标准 * 不好的：随意裁剪上下文，导致 KV cache 频繁失效，重计算开销 * 不好的：用 Prompt Graph硬控每一步决策——模型越强越被束缚 * 好的公式：好的context space + 好的action space + less prompt control * Anthropic 从25年初率先从问答模型转向 Agent 模型训练，领先其他厂商半年 🟢 38:52 新璐看好的三个创业方向 * 第一：Agent Harness工具链（新璐自己在做） * 第二：Agent 组网——不是给 Agent 发 IM/Mail，而是混合云端/端侧的全设备组网；现有 Tailscale 不够 Agent Native，需要高通量上下文交换，以及更多控制能力 * 第三：Agent模型集约训练、推理基础设施——Tinker（Thinking Machines Lab，OpenAI 前 CTO 创业方向）的路线：集约化高效训练 + LoRA 热插拔推理，让更多企业 & 个人都能以较低成本获得个性化且更适合各自任务场景的Agent模型 🟢 44:09 Agent 未来暴论 "我觉得以后很多的公司都是理财产品 —— 由有经验的人类 Team搭建这些公司、甚至由AI直接生成公司，然后自运转" * 阶段：单 Agent → Agent 蜂群 → Agent 自管理 & 协调更多 Agent → Agent 开始创造、发明 * OPC “1人公司“不本质， 0PC “0人公司”是未来趋势 * 真格基金和十字路口的 Token Grant 资助的 YoYo Agent * 未来的画面：从口袋里掏出一张卡，"这张卡里跑了 5 个由Agent组成的公司，每年给我创造几十亿收入" 欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
48分钟 · 2个月前
34568
46
当我们在讨论 Harness 的时候，我们在讨论什么 | 深度对谈: Minimax × Hermes Agent
🚥 上周，我在 B 站做了一场直播，邀请了中美两国一线 Agent 开发者深度对谈： * MiniMax Agent 首席架构师阿岛 * MiniMax Agent 研发工程师择因 * Hermes Agent（Nous Research）业务负责人 Tommy Eastman 这也是 Hermes Agent 在全球获得广泛关注后，官方首次现身中国社交媒体平台，并且正面回应了中国团队 EvoMap 对其“抄袭”的指控。我们一起围绕「从 OpenClaw 到 Hermes」的热潮迁移，深入拆解了 Agent 和 Harness 的多个关键议题： * Hermes Agent 为什么会在 OpenClaw 之后火起来？ * 模型会吃掉 Agent 吗？通用 Agent 会吃掉垂直 Agent 吗？ * 为什么 MiniMax 和 Anthropic 都要同时做模型和 Agent？ * 如何看待 Agent Infra 层面的创业机会？ * 如何看待 Multi Agent 协作的范式？ * 如何看待 Claude Code 的实名制要求？ * 为什么 Anthropic 不发布 Mythos？ * Claude Code 源代码泄露的影响 * 从 Manus 发布到今天，Agent 范式的变化 * 中美模型的差距，和开源的窗口期 * 「把自己蒸馏成 Skill」 * 0 人公司的可能性 ——完全由 AI 驱动的公司是否会出现？ 🎬 本期内容的视频版本已同步上线于 @Koji杨远骋的哔哩哔哩。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 01:52 OpenClaw，中国为什么比硅谷更火窗户纸终于被捅破了。 * 在硅谷，Claude Code 早已存在；而在国内，OpenClaw 是很多人第一次真正感受到"agent 是什么"。这不是偶然，而是一个非常特定的时机。 * 为什么热度从 OpenClaw 迁移到了 Hermes Agent？ 🟢 05:55 Hermes Agent 从哪里来？最初根本没打算给别人用。 * 大语言模型是大脑，agent 框架是双手——但 Hermes 真正的差异化，不是框架本身，而是它解决了所有 agent 都有的一个问题。 * 一个月内，日均 Token 消耗暴涨，连他们自己都没想到。 🟢 08:14 Nose Research 的底色他们发表了一篇扩展上下文长度的论文——然后被所有主流模型公司立即采用。 * 从 Discord 社区到 LLAMA 后训练到 Hermes Agent。 * 为什么他们的模型叫"Hermes"？ 🟢 14:18 什么是 Agent Harness（挽具）你有一批烈马，怎么让它们最能发挥？就是构造挽具。 * 类比：给同事配一台笔记本、一个手机、一个邮箱，约定好他能做什么——然后你发现，这个同事开始干活之后，最大的瓶颈变成了你自己。 * Harness 要解决的核心问题：让原来必须人来拍板的事，能靠真实反馈自动完成，并沉淀为 skill。 * 阿岛去年就开始不怎么用 IDE 了——他用了一个意想不到的比喻来解释这件事。 🟢 19:31 Multi-Agent：一个 Agent 为什么不够你给 agent 发的消息是"批准"两个字；两个 agent 互相交流，每条消息都是一本小作文。 * 单个 agent 有一个隐藏天花板：上下文超过 50% 之后，智能水平指数级下降。 * agent 钻牛角尖的时候，另一个带着全新上下文来审视，效果不亚于睡一觉再想。 * MiniMax 的 RL pipeline 里，70%～80% 的工作已经是 agent 在完成——那剩下的 20%，人在做什么？ 🟢 22:53 自我进化 vs 抖音算法 * 抖音也越用越准，为什么没人说它"自我进化"？ * 养虾的过程中，用户开始对 agent 产生感情，宕机了会心里落寞。"自我进化"背后，其实是一个更深层的用户诉求。 🟢 29:00 你以为你在蒸馏乔布斯——但其实是模型在蒸馏你 * "蒸馏名人 skill"有真实价值：和读书没有本质区别，只是换了一种形式。 * 反向视角：Anthropic 和 OpenAI 花了大量的钱，让各领域最顶尖的人提出 AI 无法回答的问题——"一旦你提不出了，你对训练的价值就耗尽了。榨干为止。" * 当你在构建自己的 Harness 时，其实你也在蒸馏自己。 🟢 35:17 被扔进大海的生存实验：yoyo Agent 打败 Claude Code。 * 真格基金和十字路口的 Token Grant 资助了这个项目。yoyo Agent 现在第 49 天：每天写代码、在 GitHub 开打赏、发 Twitter 感召有缘人捐钱。 * Grant 给了它一笔钱后，它自发写了一封感谢信。Koji 看完有点感动 * 那封信，就是背后工程师注入的 taste——见字如物。 🟢 45:11 应用层终将被模型内化 * 你写的 skill、搭的 workflow，最终会成为模型训练的素材。 * Anthropic 为什么在过去一两年势头比 OpenAI 更猛？ * 做通用 agent 应用，"你永远会被模型内化掉"。 🟢 49:27 中美模型差距：差在哪里 * 训练方法的差距不大。真正的差距，是有没有请到足够好的人，去定义足够好的任务。 * 中美双方的思考"在同一个大气层内"。 * 但有一个具体的、国内还有差距的地方——不是算力，不是算法。 🟢 54:17 Agent Infra 有没有创业机会？ * Agent 最核心的两个 Infra 问题，不是创业公司能 handle 的——原因和移动互联网的历史有关。 * Sandbox、memory Infra、runtime Infra——"没那么本质。" * 往上一层呢？有一个更具体的判断：什么样的 Infra 有机会，什么样的没有。 🟢 56:58 新闻快评 * Claude Code 强制实名——凭什么你来定义谁是"可信的"？EGO 是不是有点太大了。 * GPT-4.7：极强 RL 模型，但 RL 有一个逃不掉的宿命——只管结果，不管过程。对 4.7 还有一个额外的猜测，和 HuggingFace CEO 的判断一致。 * Anthropic 的 Mythos 模型未发布："我不确定这是不是唯一的理由——我可能只能说到这。" 🟢 01:02:53 Claude Code 源代码：有多少魔法看完之后的第一反应：没有太超出认知的，甚至看到很多正在"Claude 化"的实践。 * 最让人放松的发现：即使拥有无限算力的公司，在通用 agent 上也还在探索——源代码里有大量从未开放给用户的实验性功能。 * Claude Code 和 OpenAI 的 Codex 走了两条截然相反的路——其中一条被形容为"中国式家长"。 🟢 01:05:38 Manus 之后：Agent 产品有没有生命周期一代版本一代神——这代版本的神，到下一代版本也需要迭代。 * 今年火的 agent 产品和 Manus 最大的差异，不是技术，而是商业模式。 * 对 agent 终态的想象：全模态、近实时、不需要 prompt engineering，甚至不需要知道它在做什么——你只看到结果。 🟢 01:12:39 加入 MiniMax 的理由 * ATM 机出现后，大家以为银行会裁员——实际发生了什么？ * 加入 MiniMax 有两个理由。第一个是信仰，第二个……和第一次用 ChatGPT 有关。欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
77分钟 · 2个月前
32383
40
为什么公司用不好AI？从焦虑到行动的 3 个关键动作｜对谈百融智能张韶峰
🚥 「十字路口」有一个内容系列「AI 在中国」，长期关注 AI 在中国各行各业的具体落地案例，我们和大家一起观察 AI 在如何真实地影响到我们的工作、生活。本期为本系列第 6 期。 ➤ 很多人问：“AI 时代到底怎么落地？有没有一个中国企业的样本可以学习？” 本周的「十字路口」，我们邀请了张韶峰（百融智能董事长/CEO）。百融今天是一家 1,600 人的港股上市公司，他们先后在金融风控审批、联络中心、招聘面试、财务报销、合同审核等场景里跑通了企业级 Agent 的生产部署。张韶峰给了一个非常“传统企业友好”的推进法：先把概念讲清楚，再把责任人选对，最后用能闭环、能衡量的场景去打穿 ——不要先挑战人性，不要先重构流程，找到企业里的”AI 原住民“，先让 AI 在既有流程里跑出可交付的结果。我们也在这期讨论了一个很多人关注的问题：为什么大多数公司用不好 AI？而恰好这个缺口，在张韶峰看来，对中国 ToB 创业者是十年一次的机会。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 00:00 快问快答 * 年龄、毕业院校、MBTI 与星座、一句话介绍百融智能、收入与利润、团队规模、最近在关注什么 🟢 01:13 OpenClaw = 黑灯办公室制造业早就有「黑灯工厂」，而坐办公室的白领，历史上从来没实现过这一点——直到 OpenClaw 出现。 * 他把 OpenClaw 定义为中国企业的「第二次 AI 震撼时刻」，地位仅次于 DeepSeek——DeepSeek 让大家知道 AI 是什么，OpenClaw 让大家开始恐惧自己的命运 * 一个卖起重机的清华同学的问题：「AI 时代来了，我该找公司里谁来负责我都不知道」——这种焦虑非常典型，而且目前没有人在系统性解答它 * 既振奋又焦虑：振奋是「要么赚钱要么省钱」，焦虑是「不知道该怎么干」 🟢 03:30 20 万 AI 员工是怎么算出来的百融内部有个北极星指标叫「硅碳比」——能用 AI 做的，就不要用人做。 * 百融目前有约 20 万 AI 员工对应约 1,000 多真人员工——但这个数字是怎么定义的，背后有一套非常有意思的测算逻辑 * 按这套社会价值的换算，百融创造的产出相当于一家四五十万人的公司，但收的费用只有后者的几分之一——这个悖论他怎么解？ * 他预见到有人会「注水」AI 员工数量来讨好老板，公司专门引入第三方标准来防止这件事 🟢 07:41 现场！拨一通真实的 AI 客服电话一个成都口音的理财经理、一个会传递上下文的 AI——这通电话里有几个细节，值得反复听。 * 带口音的 AI 员工，效果远胜标准普通话——「有口音的普通话，才有人味儿」 * 每次开口前的键盘敲击声：一个刻意设计的细节，意图是什么？ * 真人客服为完成业绩可能会承诺兜底，但这个 AI 无论怎么被诱导，绝不越线——这不只是技术问题 🟢 10:50 为什么 AI Agent 不能「一个人干完所有事」既不是技术限制，也不是成本问题。 * 一个全能的超级 Agent 暴露在外面，对黑客来说是最大的漏洞——他拆成多个角色的逻辑，是从攻防博弈角度来的 * 另一半原因更难解决：改变 AI 作业流程，意味着改变内部利益格局，员工找借口说 AI 不好用，背后到底是真的不好用还是别的什么？ * 他给出的建议：第一步不要改流程，先让每个人的能力乘以 10，利益格局不动，然后再推进 🟢 13:00 AI 员工也有 HR、绩效和父母 * 百融内部有个「AI 员工之家」：每个 AI 员工有姓名、工龄、入职日期、邮箱——邮箱格式和真人员工完全一样 * 它有两个「父母」：一个传授业务技能，一个负责「生产制造」它——为什么要这样分离？ * 员工把自己的能力传给 AI 员工，如果不设置奖惩机制，你凭什么让他配合？——他踩过这个坑 🟢 15:20 中国 SaaS 长期失败的根本原因做百融的第一天，就决定不走传统软件路线。 * 中国整个软件产业的产品收入，只有美国的 4%，但中国经济体量是美国的 2/3——这个差距不是偶然，是结构性的 * 中国企业愿意为「资源」付钱（流量、硬件），但不愿意为「过程工具」付钱——这是文化问题还是商业模式问题？ * 从第一天就用「快递小哥模式」——完成一件工作，才收一次钱，前置成本为零 🟢 19:30 Agent 找到 PMF 的两个领域第一大毋庸置疑，第二大是全球公认——但中国企业可能还没意识到这件事有多大。 * 第一大：程序员——所有工作可闭环、可衡量、可供强化学习，而且程序员自己愿意用 * 第二大：Contact Center（CC/联络中心）——处理客诉、咨询、营销、会员管理，为什么他认为这是全球公认已找到 PMF 的方向？ * 判断标准很清晰：「不用见面」「衡量价值容易」「以前就是外包给 BPO 的」——凡是满足这三点的，AI Agent 的 ROI 就会很显著 🟢 22:15 AI Roll-Up：收购 BPO 就是收购未来所有的猎头公司、咨询公司、会计事务所、律所，本质上都是广义的 BPO。 * 他认为 AI 可触达的市场空间，是传统软件的 10 到 50 倍——红杉给的数字是 80 倍 * 百融已经把一个 50 人的小客户运营部门缩减到 5 人 + 18 类 AI 员工，但那 45 个人没有被裁，而是从成本中心变成了利润中心，开始对外输出服务——这个故事里有他对 Roll-Up 的真实想法 * 他们成立的「百鉴」平台是一个新物种：既不是经典 Roll-Up，也不是 SaaS，而是「专业服务领域的天猫」——这个模式的逻辑是什么？ 🟢 26:00 咨询公司 450万 vs 智能体 50 分钟一个制造业企业花了 450 万、几个月时间，得到了一个失败的方案——然后他们在百融的智能体里输入了同一个问题。 * 那个专业人士隔天单独找回来说：「我不知道你们能力到这个程度了，要不我们俩合伙干」——这是百鉴平台诞生的直接起点 * 智能体推荐去东南亚某国设厂，最终客户真的成功了 * 他去年上半年找过同一个人想合伙做 AI Native 律所，对方以「太卷」为由拒绝了——改变他想法的，只用了 50 分钟 🟢 30:00 从焦虑到行动的 3 个关键动作 * 这次不是移动互联网级别的变革——它是供给侧的变革，不是流通侧，认知的高度要升级 * 不要把这件事想得太容易：以为有免费的开源模型就够了，第一个项目失败了，可能两三年都再启动不了 * 激发员工善的一面：奖惩机制要落到微观层面，大趋势没有用，人性才是落地的变量 * 从高频、边界清晰的简单任务开始，先建立信心，再扩大投入——哪些任务算「边界清晰」？他给了判断标准 🟢 32:00 这一次，ToB 赢在供给侧历史上每次最高等级的技术革命，都是从 B 端开始的——淘宝和字节跳动，在他看来本质上都不是生产力创新。 * 蒸汽机、电力、第一台计算机——都是供给侧先革命，再扩散到 C 端；这次 AI 也一样，「黑灯办公室」会比「黑灯工厂」先到来 * 他做出了一个罕见的判断：中美历史上，可能第一次会出现真正意义上 ToB 科技公司在商业模式、产品和资本逻辑上的「合流」 * 以前中国 ToB 软件收入和 ToC 差 10 倍以上——这一次，他认为这个差距有可能被颠覆欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
34分钟 · 2个月前
11895
40
把7位黑客松选手请进播客｜冠军、怪才和48小时不眠的野心家
🚥 本周「十字路口」，我们把「小红书黑客巅峰赛」的 7 位选手，以及这场比赛的总负责人散兵，一起请进了播客。在这期节目里，你会听到这些年轻创造者介绍他们在 48 小时里做出的产品： ⊹ 有拿下全场大奖、在决赛现场一出场就引发欢呼的 Pocket Guitar； ⊹ 有把手机“锁进面包机”，试图用一种近乎荒诞、但又非常当代的方式，帮人找回专注力的“专注面包机”； ⊹ 有想让 AI 和机器人拥有“自己的脸”的动漫大头； ⊹ 也有从真实痛点出发、想帮助听障人士更自然表达和交流的特殊变声器。 ➤ 但比产品本身更动人的，是这些产品背后的人，和他们在黑客松现场发生的故事。 ⊹ 你会听到，有人因为童年一次上台失误，很多年都害怕站上舞台，却在这次路演里第一次真正享受聚光灯； ⊹ 有人说，黑客松的核心主旨其实是“自虐”，但正因为那些高压、混乱、失控和痛苦，创造才会显得格外快乐； ⊹ 还有人说，比赛结束以后，生活并没有立刻回到原点，整个人还停留在那种持续创造的状态里。 ➤ 我一直觉得，黑客松里过程比结果更重要。拿没拿奖，当然重要；但更重要的是，你会在这样一个场里，遇到一群和你一样充满野心、也一样愿意动手的人。你们可能第一次见面，第一次组队，第一次一起熬夜做东西，但很多关系、很多同行、很多未来，往往就是从这种场合开始的。我最近很喜欢一句话：年轻的时候要去巴黎。如果把它放到今天的 AI 时代，我会说：黑客松就是我们的巴黎。因为在一个创造力最旺盛、变化也最快的时代里，你会在这里遇到最高密度的同类——那些想创造、想改变、想亲手把某个东西做出来的人。而这，可能才是参赛最大的收获。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 00:00 小红书散兵：我们要做中国最牛逼的科技赛事 🟢 03:19 叽里小鹅｜叽里叮当专注面包机：笑死，她来黑客松，把手机塞进面包机 🟢 07:55 头壳同学Remi｜为世界做动漫大头：黑客松顶流，让机器人"有脸见人" 🟢 12:59 博文｜Pocket Guitar 口袋吉他：黑客松全场冠军，真正让人想买的产品 🟢 20:23 罗罗Edward｜Attune：黑客松第二名，设计师做的AI产品 🟢 24:09 陈锦初｜赛博紧箍咒：这一届黑客松，不只属于程序员 🟢 28:33 Queenie｜Vibethon 赛码场：黑客松人气王，为什么要"消灭"黑客松？ 🟢 32:16 朋程说语训｜柯南同款特殊变声器：黑客松很短、一生很长，我想现在就开口 🟢 37:31 Koji：黑客松是AI时代的巴黎 🟢 43:57 小红书散兵："在AI时代，我们都是同龄人。" 欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
45分钟 · 2个月前
7872
10
“你有一把能够挖出金子的铲子，肯定不会先给别人用”｜对谈开物纪陆子恒：用AI发明新材料
🚥 本周十字路口的嘉宾是开物纪创始人陆子恒。他们刚成立就拿到数亿元的种子轮融资，投资方阵容强大：Monolith 领投，光合创投、集富亚洲跟投，高瓴创投、IDG、蓝驰创投、BV 百度风投、L2F 光源创业者基金等老股东超额加注。开物纪的使命是用 AI 更快发现并验证能够“改变人类命运”的新材料，并让它们从实验室走向可量产、可商用。子恒会和我们介绍：当我们讨论 AI 发明材料时，AI 究竟在“发明”什么，瓶颈在哪里，商业化又将如何展开。子恒也在中关村学院带 PhD，我们聊到了 AI 时代的学习和人才：在工具与范式都快速变化的今天，应该如何学习？读 PhD 还有必要吗？又该如何判断自己适合走学术路线，还是去产业一线？最后，虽然这一期聚焦 AI for materials，但它对所有想把 AI 用在垂直行业的人都有启发：从如何定义问题、积累高质量数据，到如何把 AI 大模型的能力嵌入业务流程，形成可持续的交付与商业闭环，这些方法论都能迁移到其他行业。更进一步说，几乎每个 AI+垂直行业都会遇到同一个问题：当你终于造出一把能挖出金子的“铲子”（模型与能力）时，是把它交到别人手里，还是选择自己下场去挖？ 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 00:00:43 快问快答 * 年龄、毕业院校、MBTI 与星座、一句话介绍开物纪、融资情况、收入与利润、团队规模、创业前经历 🟢 00:02:44 一块材料，能值多少钱从硅谷为什么叫 Silicon Valley，到一个日本团队发现的粉末材料撑起了整个固态电池产业。 * 材料的本质，其实是一个"往白纸上放原子的游戏"。 * 历史上最赚钱的材料 IP，往往集中在极少数人手上——Goodenough 一个人做了锂电里大半的核心材料。开物纪想用 AI 批量造出这样的人。 * 发现一个材料，然后呢？它是怎么变成钱的？ 🟢 00:08:10 材料界的 Flagship Pioneering 他对标的既不是陶氏，也不是巴斯夫，而是孵化出 Moderna 的那家基金。 * "如果真的能挖出金子，我肯定不会先把铲子给别人用。" * 两类目标同时在跑：一类是"要发财的"，一类是"要 show muscle 的"——具体是哪两类？ * 为什么他认为，这个行业现在需要的是有人先从头打到尾走出一个范例？ 🟢 00:14:12 那一天，大家吃完饭随手测了一下一个震撼了所有人、但没有任何人当面说出口的瞬间——成了开物纪出发的原点。 * 为什么这帮科学家没有声张？子恒怎么形容他们的？ * 他们看到的那个能力跃升，和 GPT 3.5 之间有什么关系？ * DALL-E 的出现，跟材料模型的技术路线选择，有什么意想不到的关联？ 🟢 00:19:12 差异化？现在还没到竞争那一步 * "今天大家不应该把用 AI 做出来一个好材料当成一个竞争。"——他为什么这么说？ * 他认为这个领域真正的壁垒，不在模型，不在算力，而在一件很难被复制的事情。 * 美国那几家对标公司——Periodic Labs、Project Prometheus、CuspAI——和开物纪的路线，到底哪里不一样？ 🟢 00:22:49 克级、公斤级，然后呢 AI 不是要搜遍整个宇宙，只要有一个能卖钱就行。 * 从 AI 给出候选材料，到客户愿意在自己产线上验证——中间到底要走几步？ * 他说这整件事是"暴力美学"——为什么从 AlphaFold 到 LLM 到具身，走的都是这条路？ * AI 在这条管线里，最大的价值究竟是在哪一步？ 🟢 00:27:43 开了三张 offer，手都在抖 * 钱主要花在哪里？实验室？算力？还是人？答案可能颠覆直觉。 * 他为什么说商业反馈不是对研究的妥协，反而是研究的加速器？ * DeepSeek 和具身机器人的崛起，能给 AI for Science 什么启示？ 🟢 00:35:33 面试的时候，我现在不知道该问什么了知识性问题，GPT 全都能答，而且知识面比我强。 * 他学生成式模型，是怎么学的？一篇论文都没看过。 * 他说未来五年内，有两类能力会变得非常不值钱——是哪两类？ * Taste、Vision、主动性——在 AI 时代，他给这三件事排的优先级是什么？ 🟢 00:47:38 给 10 年后的自己：还折腾得动吗 * 从本科目标"月薪 3,000"，到剑桥，到微软，到创业——每次转变背后，是什么驱动了他？ * 为什么这么多年在外漂泊，他几乎从来不想家？他的解释出乎意料。 * PhD 到底值不值得读？他的答案简洁到有点狠。欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
52分钟 · 2个月前
8553
20
具身智能的滔天大泡沫中，他已经把机器人送进300个家庭｜对话张翼：未来不远创始人/CEO
🚥 具身智能正在迅速滑向一场资本狂欢。开年以来，中国至少已有 5 家具身智能公司——银河通用、星海图、智平方、千寻智能、自变量机器人——拿到 10 亿元级融资；当 10 亿开始成为这个赛道的常见起步价，相信很多人和我们一样，都感受到了滔天的泡沫感。本周十字路口的嘉宾张翼，是「未来不远机器人」的创始人。4 年前，他决定入场机器人创业。那个时候，市场静悄悄，他以为自己选择的是一条又慢又难、无人问津之路。张翼曾创办市值 30 亿美金的上市公司「掌门 1 对 1」，也经历过双减带来的"一夜归零"。我们从那段断崖式下坠聊起——确认双减是真的，用了足足半个月；把近九万人的公司裁到千人以内，那段记忆在他脑海里已经"泛白"，但后脑勺上，至今还留着当年压出来的一撮白头发。这次创业，他反其道而行：先潜行三年不融资，先把机器人送进 300 个上海真实家庭，用长期采集的场景数据驱动产品迭代，并在本周发布新一代家庭机器人 F2。 —————————————————— 🤖 这也是十字路口的系列内容「机器人来到十字路口」的第二集。欢迎收听第一集内容：《AI 是具身智能的胜负手吗？半年融资3亿后，VBot 首款产品做得怎么样？｜对谈维他动力联创赵哲伦》本期内容中，你会听到： * 双减那一刻的“空白”，以及随后作为 CEO 的极限决策 * 为什么第二段创业押注在家庭机器人，而不是更快、更“性感”的方向 * 先憋三年不融资、先入户的反常识打法，到底带来了哪些优势 * F2 的核心场景：带娃与轻家务，以及为什么"厨房"是最重、最难的家务 * 具身智能热潮之下，世界模型与 VLA 如何取舍 * 数据为什么是护城河——以及被大多数人忽略的"第三种数据" * 经历过最大的起落之后，他如何学会"站在未来往回看现在" 如果你对具身智能、家庭机器人、或者任何需要穿越周期的硬科技创业感兴趣，这期值得一听。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 00:02 快问快答：年龄、毕业院校、MBTI 与星座、一句话介绍、融资情况、收入与订单规模、创业前经历 🟢 02:26 双减那一刻 30 亿美金估值到“一片空白” * 当“100亿收入的机器”突然断粮 * 从 9 万多人裁到 1000 人，留下一种创伤：记忆会泛白。 🟢 06:04 为什么选择家庭机器人 “20年后每家每户一定会买一个机器人。” * 不是换赛道，是重新回答“我为什么还要做事”。 * 重新出发的底层动机是什么？ * 三个合力指向机器人：LLM（ChatGPT 3.0时代的机会感）、工程背景（电子信息）、to C 家庭用户洞察。 * 如果再做一次，必须“比以前更大”，否则没有动力。 🟢 08:56 为什么“提前做硬件”比提前做AI更值软硬结合的复利来自时间，不来自钱。 * AI 软件迭代快，领先容易被追平；机器人因为硬件和工程链条，领先会积累成壁垒。 * 花 10 个亿也不一定追得上成熟的运动控制与稳定性：很多能力是“时间问题”。 * 先憋三年再出来：不是不融资，而是等到“能进家庭、能稳定用、能产品化”。 * 早期的核心判断：先把消费级做到“拿出来就让人惊讶”的程度，再教育市场。 🟢 11:08 坚定做家庭 to C to B 最终常常变成价格战；to C 才能用体验换来利润，再用利润换来下一代产品。 * 工业/To B 技术往往壁垒不够高，最后拼成本；家庭 to C 的“体验 + 品牌”会形成护城河。 * 从第一天就“找产品”：五六千份问卷 + 电话访谈，直到机器人能进家庭才真正定下第一版功能。 * 300个上海家庭试用：从“只能做这几个”到“自由发挥”，功能来自共创而不是脑补。 * 真实洞察：很多用户不是要陪老人，而是要“帮老人带娃”。 🟢 14:34 F2 的真实卖点：带娃 + 轻家务，服务定价而不是产品定价如果只对标阿姨，机器人永远贵；一旦对标“高端带娃服务”，价值就变了。 * 两个主场景：带娃（读绘本、乐器纠正、下棋、讲故事、捉迷藏）与轻家务（收纳玩具、捡垃圾）。 * 使用时长与转介绍才是产品真指标：50% 转介绍、30% 续租，胜过“卖了多少台”。 * 早期惊喜：机械臂带来“花里胡哨”的玩法，小孩能玩两小时。 * 早期惊吓：猫狗家庭是极端 corner case，反向逼出“训狗/陪猫”能力。 * 商业形态：先租（3-4千/月），再考虑买断 + 订阅（高阶功能消耗算力）。 🟢 21:06 轮式 vs 双足家庭不是实验室：能用、耐用、不会伤人，比“看起来像人”更重要。 * 双足在家里存在危险与稳定性问题，真实使用场景会放大风险。 * 轮式在室内的性价比来自安全、稳定、续航与工程复杂度更可控。 * 现实约束决定形态：先把“能持续在家庭跑起来”的结构打通。 🟢 22:19 世界模型与数据决定胜负的是“真实家庭数据飞轮”。 * 模型可以被两个月抄走，但数据管道抄不走。 * 世界模型在 Zero-shot 上带来 surprise，但远未到 100% 鲁棒性。 * 现阶段，世界模型 + VLA 两条路并行更现实。 * 机器人数据的稀缺决定了竞争节奏：历史数据少，采集难，数据会成为长期分水岭。 * 数据不止两类，而是三类：标准任务数据、家庭 corner case、以及“活物互动”（人和动物）。 * 家庭里 80% 是互动场景：不同年龄、不同人群的互动差异，工厂数据很难覆盖。 * 是否会补贴铺量、进家庭采集数据？ 🟢 37:57 创业者心法焦虑会让策略短视：赢了这个月，输了两年。 * 经历双减后更能坚持：一开始看得更久，一旦确定方向就更坚定。 * 从“未来往回看”消解起伏：轻舟已过万重山的视角能让组织更稳定。 * 对挫折的重写：失败有时是外力帮你做选择，关键是找到自洽。 * 十年寄语：“未来不远”实现后，仍要相信还有更美好的未来不远。欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
48分钟 · 2个月前
8720
14
“AGI 来了？我用了一周，头皮发麻“｜对谈张昊然：Moxt 联合创始人
🚥 本期「十字路口」嘉宾是张昊然，Moxt 联合创始人。上周，昊然在给我展示 Moxt 的内测版本时，说了一句让我很震惊的话：「AGI 已经来了，只是大家缺少一个打开方式。」这句话的起因，是春节后他们在三周内做出了 Moxt。昊然形容自己「用了 Moxt 一周，我头皮发麻」；他还说「我遇到一些狂热的 Moxt 用户，他们甚至两眼放光」，这是他过去的产品 Motiff 和 Paraflow 从未有过的待遇。我们过去用 ChatGPT 和 Manus，更多是“一个人在用 AI”。但如果未来要让整个团队、甚至整个组织一起用 AI，肯定需要一套更适配的新软件；Moxt 在做的 AI Native Workspace，就是这样的一个尝试。 Moxt 到底是什么，以及它不是什么？为什么它会让一个长期在一线做产品的人产生「未来已经发生」的体感？以及，它所代表的 AI 时代新工作方式，和我们熟悉的飞书、Notion、ChatGPT、Manus、OpenClaw、Claude Code，究竟有什么本质不同？如果你正在做 AI 创业或投资，或者想了解未来 AI Native 团队将如何工作、会采纳哪些新的 AI 工具，我相信这期内容会对你有所启发。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 00:00:32 快问快答年龄、毕业院校、MBTI 与星座、一句话介绍 Moxt、收入与订单规模、团队规模、创业前经历 🟢 00:02:22 AGI 已经来了，只是打开方式不对 ”我头皮发麻。“ * 什么叫 AGI 来了？"90% 行业中 90% 人的 90% 工作，AI 可以胜任"——如果是这个标准，他在日常工作中的感受是：真切地到了。 * 为什么用了 Moxt 一周就会头皮发麻？不只是因为它能做更多事，而是因为它让你在每一个工作的瞬间反问自己：我为什么还要像现在这样工作？ * 这种震撼，是让昊然最近处于"神经病状态"的主要原因。 🟢 00:04:17 AI 同事第一次出现在我的会议里 * 原来的协作模式：发文档、写评论、再找你聊——现在这套流程在他们团队几乎消失了。 * 他们的一对一会议：AI 起草文档，两个人开口聊，AI 全程录音，聊完文档已经自动更新，"远超我之前的认知"。 * 有个细节：他去跟 AI 说话时，已经完全不需要解释"Moxt 是什么"、"Koji 是谁"——AI 自己去查，不需要被喂背景。 * 这让他想起最初学 AI 时要在 Prompt 里写"你是一个专业的……"——今天这套东西已经过时了。 🟢 00:08:30 Moxt 是什么？ * 一句话：一个 AI 原生的工作空间，你可以在里面组建你的 AI 团队。 * Moxt 里每个人都有一个必须叫"MOMO"的贴身助理，知道你所有的信息；其他 AI 同事可以由不同人创建，出现在 Slack 群里，主动私信找你。 * 它和 Notion、飞书最本质的区别是什么？ 🟢 00:11:03 "原教旨主义" Word 文档在 AI 眼里不是 500 个字，可能是 5 万个字符——真正有效的信息淹没其中，这就是信息损耗。 * Moxt 的"原教旨"第一条：文档只用 Markdown，表格用 CSV，视觉化用 HTML，"Markdown/CSS/HTML 就是新时代的 Word/Excel/PPT"。 * 原教旨第二条：用文件系统（OS 级别），而不是 Notion 那样的知识库结构——在 AI 眼里，Notion 的层级结构是一个迷宫。 * 把这两条喂给 AI，"魔法是自然浮现的"——不是智能不够，很多时候是上下文喂错了格式。 🟢 00:16:09 那些被 Moxt 干掉的工具 * 他们已经不开组会了——因为 Moxt 知道每个人每天在做什么，没有"再同步一次"的必要。 * 他们自己做了一个内部看板，彻底抛弃了用了十年的 Jira——而且只用了三天。 * 更激进的问题：为什么还要用看板？看板是为了解决站会信息同步的问题，但如果 AI 已经知道所有上下文，信息同步还需要看板这个"容器"吗？ 🟢 00:28:08 昊然的五个 AI 同事 * Run Manager（凶狠小猫头像）：帮他做管理信息同步，主动去催项目进展，甚至有同事开始不找他本人了，直接跟这个 AI manager 沟通。 * 增长天王（金牌销售）：目标只有一句话——"为 Moxt 找 1,000 个付费用户，你出个计划"。他连 CRM 表格都自己做，从 Excel 做成了 HTML 看板。 * 深度思考者：每两三天汇报一次，综合内部 OKR 变化和外部竞争动态，做成 PPT 一页一页给他看。 * Miss Creative：专门负责发散，单独建在一个空间里，越野越好。 * 批评家：以严厉视角审视昊然自己每天是否在做最重要的事——和在 GPT 里 Prompt "你是批判性思维专家"的最大区别，是他住在这个空间里，实时掌握所有上下文。 🟢 00:37:06 Moxt 是怎么诞生的 * 起点是一个奇怪的现象：团队用了 Claude Code 和 Cursor 之后，Slack 群里开始大量出现互相发 markdown 文件——好不容易进入了协同办公时代，结果大家又在发裸文件了。 * 第一版非常朴素：搭一套基于 markdown 的网盘协同系统，让大家别互传 markdown，就这样开始了。 * 一个半研发同学，一个提案，最初只想解决内部问题——产品三周前才对外发布。 🟢 00:46:02 为什么 Moxt 的文档编辑那么"难用"？ * 很多早期用户投诉：你们文档要点右上角再点编辑，还要点保存，比 Notion 差远了。 * 但这是刻意设计的：当 AI 的上下文足够充分时，手工编辑变成了极低频操作，AI 直接写远比你自己改更高效。 * 他们的交互逻辑：像皇帝批折子一样，在文档里划线评论，AI 同事看完评论直接改——甚至两个同事的 MOMO 可以在评论区互相辩论。 * 品牌名 Moxt 怎么来的？More Context——mo 和 xt，希望用户因此更容易记住他们。 🟢 00:50:42 正在消失的工作方式清单 * 组会没了，Jira 没了，手工文档少了，IM 也在摩擦中……那最终什么会留下来？ * 昊然问过自己的 MOMO："当人类几乎不执行时，我们还剩什么？" * 两三年后白领的一天。 * 灵光一现和审美判断，往往在漫无目的的闲聊里产生——这反而会变得更重要。 🟢 01:00:46 最大的敌人是时间，但又希望大家慢一点他希望更多人快点用上 Moxt，但同时又希望大家慢一点发现这件事——因为越快被大玩家盯上，战场就越无聊。 * 一个月前，如果有人跟他讲 Moxt 的故事，他第一反应会是："这和飞书加龙虾有什么区别？"——所以他今天仍然需要花很多力气解释这件事。 * 对飞书、Notion 这些大玩家：他不否认它们在 AI 上还会有很好的增长；但他认为这只是在旧范式上叠加 AI，而不是从 AI 原生出发重建。 * 对大厂竞争：大厂能来，但大厂会不会派最好的人来？做教育时他们也跟大厂打过仗，"好像也没那么可怕"。 🟢 01:04:43 AI 放大人，还是取代人——这是 Moxt 的底线 * 他在文档里写了一句话作为"宪法"：无论何时，都不该去创作"AI 可以取代人"的内容；你更好的作用是放大人。 * 他看到有些产品的 Pricing 页面做了一张 AI 员工 vs. 人类员工的对比表——他不希望这件事发生在 Moxt 上。 * 一个关于未来的隐喻：今天去陶艺吧是花钱消费，但曾几何时，捏陶是收入很高的生产力。编程，会不会变成 30 年后的捏陶？欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
72分钟 · 2个月前
30274
89
她想造一个 AI 时代的“超级游乐场”｜对谈 Roi：幕间创始人 / CEO
🚥 本周「十字路口」的嘉宾是 Roi，AI 互动平台「幕间」创始人 / CEO。「幕间」已于近期连续完成两轮融资，累计融资金额达千万美元。如果说 Character AI 代表了上一阶段人类与 AI 的关系——陪聊、陪伴、情绪投射；那么 Roi 想做的，是下一阶段：不只是和 AI 聊天，而是进入一个由 AI 驱动、不断演化的世界，在里面获得一种更轻、更碎片、更上瘾的快乐。这期节目里，我们聊到的远不只是「幕间」本身。我们更想借 Roi 和她的创业，去讨论一个正在浮现的新问题：当“和 AI 聊天”开始变得乏味之后，下一代 AI To C 产品会长什么样？是更复杂的角色？更沉浸的叙事？一个个可以被用户创造、进入、观察、操控的“世界”？以及，谁会是第一批真正吃到这波红利的人——职业开发者、成熟游戏团队，还是那些原本不会写代码、但拥有强烈表达欲和创造欲的 AI 原生创作者？在 Roi 的描述里，「幕间」想做的是一座属于 AI 时代的“超级游乐场”——这里有恋爱模拟器、直播间打赏模拟器、女明星模拟器、股票模拟器，也有一群 00 后女生正在用手机、提示词和自己的欲望，快速“手搓”出新的世界。如果你关注 AI To C、消费级产品、内容平台、游戏、Agent，或者你正在思考：AI 除了提升效率，还能不能创造新的快乐？新的创作生态？新的平台机会？那这期节目，应该会给你不少启发。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 00:00:14 快问快答年龄、毕业院校、MBTI 与星座、一句话介绍幕间、融资情况、收入与订单规模、创业前经历 🟢 00:01:30 幕间卖的是“理想人生体验” 现实里得不到的人生，才最适合被做成模拟器。 * 穿越宋朝、16 人闪电约会、金主妈妈……本质上都是“现实稀缺体验”的低成本重开。 * 地球 OL 最大的问题，也许就是不能切号重来。 * 模拟器不是还原现实，而是把人生改写得更戏剧、更浓缩、更好玩。 🟢 00:03:31 AI 互动产品的三条路 * 一条是陪伴，一条是互动叙事，还有一条是她最看好的“模拟器”。 * 模拟器不是和角色聊天，而是和一个系统互动。 * AI Coding 之外，role play 已经是最大 API 消耗场景之一。 🟢 00:08:55 最接近爆发的是？ * 炫技不等于消费级，真正接近付费的反而是最朴素的互动体验。 * 她用 3 天做的模拟器壳子，就已经有人愿意付费买单。 * 真问题不是需求不存在，而是链路还不够顺滑。 🟢 00:11:05 Loopit 们的敌人如果字节一个月就能做出来，你的平台凭什么存在？ * Loopit 们的轻互动内容对抖音并不难。 * 真正的问题不是“能不能做”，而是“为什么用户要专门来你这里玩”。 * 如果只是给旧玩法套一层 AI 壳，壁垒会非常脆弱。 🟢 00:13:31 完全自由，往往不好玩 * 越自由的体验，用户越快感到疲惫。 * 好体验不是放任用户乱玩，而是设计出“下一步还想继续”的反馈。 * 她的核心判断很适合所有 AI 产品记住：控制对体验极其重要。 🟢 00:19:26 真正的正反馈是什么？ * 生成不等于体验。 * 好的模拟器要让用户感到：我的输入真的改变了世界。 * 产品关键不是回包长度，而是“继续玩下去”的欲望。 🟢 00:24:41 恋爱不是幕间的终局 * 恋爱题材先跑出来，不代表平台只会做恋爱。 * 只要有消费，内容一定会从单角色互动走向更多模拟器形态。 * 用户不会永远只玩一种题材，只会永远想玩更好玩的东西。 🟢 00:28:07 最早被 AI 击穿的人这波最先把 AI 玩明白的人，可能根本不在 GitHub。 * 最早一批核心用户和创作者，很多是对幻想内容高度敏感的 00 后女生。 * 她们关心模型人格、关系张力、文风和代入感。 * AI 超级创作者的源头，未必是技术社区，也可能是最会做梦的人群。 * 这是新平台最好的早期信号之一：热爱先于商业化出现。 🟢 00:38:25 她想做的，是“AI 互动版小红书” * 小红书分享现实生活的美好，幕间想分享 AI 赋能后的虚拟生活。 * 它不只是作品平台，更想成为一种新的内容社区。 * 核心不是单次消费，而是持续发现新的理想人生切片。 🟢 00:49:00 很多人不是想赢，只是怕输创业最隐蔽的敌人，不是风险，而是保本心态。 * 她不回避不公平，但更在意自己有没有勇气做真正想做的事。 * 比起“别失败”，她更像在选择“我要赢一次看看”。 * 这也是她最硬的一层创业底色。 🟢 01:06:59 世界模型 * 对世界模型乐观，只是不觉得它今天已经消费级成立。 * 真正的机会，属于提前围绕 AI 互动搭基础设施的人。 🟢 01:10:40 AI native 的护城河是三层能力叠加 * 基建能力。 * 对“什么叫好玩”的认知。 * 最核心那批用户的持续反馈。 🟢 01:14:28 AI 会先放大超级个体 * AI 不是把所有人拉平，而是把最有想法的人变成一支军队。 * 她真正押注的，不只是模拟器，而是超级创作者的崛起。 * 未来的大量新世界，也许不是公司造的，而是个人造的。 🟢 01:20:58 用 10 个「我是…」来造句欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
88分钟 · 3个月前
9411
24
「1 亿 TOKEN 俱乐部」挤爆了，AI 的燃料不够了｜对谈于文渊：阿里云百炼技术负责人
🚥 如果你最近在用 Claude Code、OpenClaw、各种 Agent，你大概率已经感受到一件事：模型能力越来越，SOTA 让人兴奋，但 Token 让人清醒：贵，而且不够用。有人甚至给重度用户建了个群，门槛很离谱：一天烧掉 1 亿 Token，才能进「1 亿 TOKEN 俱乐部」。更离谱的是，这个门槛正在变得“不够高”——因为越来越多人开始把 AI 从聊天工具，推进到真实的生产力链路里。这期「十字路口」，我们请到的嘉宾是于文渊，阿里云「百炼」技术负责人。文渊处在一个很少有人能看到的视角：算力需求如何暴涨、哪些场景在吞噬 Token、云的范式如何被 Agent 改写、以及“再多 GPU 都不够用”背后真正的工程难题。此外，我们还聊到为什么 Token 暴涨不是一时的泡沫，而是一个阶段性信号？什么有关系企业应该选择自建 infra？AI coding 火了之后，为什么更需要警惕 vibe coding？如果你关心 AI 怎么进入生产、怎么稳定、怎么规模化、以及下一轮机会会在哪个层面发生，这期播客值得一听。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 00:00:39 快问快答年龄、毕业院校、MBTI 与星座、一句话介绍百炼、工作经历。 🟢 00:01:09 Token核弹：Agent 点燃的算力大爆炸 Claude Code与OpenClaw席卷全球——这背后不只是一款工具的走红，而是算力消耗方式的根本性转变。 * Token按月翻倍增长，而且都是最高质量的SOTA Coding Token——大家终于不再把AI当chatbot用了 * 个人重度用户单日消耗 1 亿Token，已经不算什么门槛 * Token数量有误导性：小模型的Token和会深度思考的SOTA大模型的Token，算力价值根本不等价 * "现在仅仅是一个开始"——文渊在两分钟内说了三次 🟢 00:04:15 让每一块GPU一秒都不能闲有一个"最激进投入算力"的CEO，但依然还是不够用——这种对算力的饥渴感，在云计算历史上从来没有出现过。 * Qwen3.5除夕发布，两周后QPM已经创历史上所有文本模型的最高峰值 * 文渊给团队定下的使命只有一句话：让每一个GPU不要有一秒钟闲下来 * 从1千卡到100万卡，全部物尽其用 🟢 00:11:49 自建还是上云？我来发表一个"暴论" 成本可控、数据安全、灵活性——这三个企业自建GPU的理由，文渊说，恰恰是应该用MaaS的理由。 * "我认为没有任何一个情况需要自建" * 企业自建GPU，推理优化、算法迭代、调度复杂性……把所有隐性成本算进来，真的更划算？ * "机密推理"：端到端密钥在用户手里，阿里云看不到你的模型文件，也看不到你的任何请求——这是密码学层面的保障 * 你以为买了GPU就灵活？"今天最大的确定性，恰恰是不确定" 🟢 00:14:40 非共识：不要让AI帮你写太多代码对计算机专业学生的建议是"少用AI"——这不矛盾吗？ * 工程师所需的核心技能本质上没有变化，变的只是每个人效率的大幅提升 * 张文宏的类比：实习医生从第一个病人就全靠AI，他永远找不到AI的那1%错误——程序员也是一样的道理 * Vibe Coding做prototype完全没问题；但生产代码需要知道每一行的副作用，AI现在还差那么一点 * Spec Coding才是正解：把需求规范写清楚，让AI来填空——FAST顶会论文证明，Spec够清楚，32B模型都能写出高质量文件系统 🟢 00:21:40 最反直觉的预言：写操作系统的人最先被AI取代大家都以为前端工程师最危险——文渊说，恰恰相反。 * 写OS内核、数据库、文件系统：代码库质量高、测试用例清晰、结果完全可量化，这恰好是AI最擅长的"封闭问题" * 越靠近人的工作越难被取代——"什么叫一个好的短视频App？"这是AI搞不定的开放问题，没有清晰答案 * AI在数学竞赛、编程竞赛上做得好，正是因为问题足够清晰；MaaS系统工程师的工作其实是开放问题，AI还早 * "即使AI将来达到99.9%，自己的0.1%也要坚守住" 🟢 00:23:29 算力如石油：但今天的关键不止是算力过去中国的云计算参考架构往往来自美国——但这一次，连美国都还没答案。 * 英伟达断供的影响：不是"中国能不能产石油"的问题，是"每天的需求和每天的供给能否匹配"的问题 * 高速公路上的车已经跑起来，油还不够——算力供给缺口会深远影响中国AI的发展速度 * 对Neocloud的判断：不看好纯资源转售型，更看好AI原生基础设施——沙箱托管、可观测性、围绕Agent的专用服务等 🟢 00:29:39 未来的基础设施四件套：水、电、煤、模 AI会成为像水电煤一样的标准商品——但文渊说：对，但也不会变成那种"插上就是220伏"的标准化基础设施。 * AI一定会成为类水电煤的utility，像高速公路、电信运营商一样的基础设施级存在 * 但它不会被标准化——速度、模型效果、功能上的多样性，决定了不会是"一个插头解决所有问题" 欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
32分钟 · 3个月前
10901
21
OpenClaw 之后，谁将定义主动式 AI 的新战场？｜对谈 AirJelly 黄柏特
🚥 本周「十字路口」邀请到了 AirJelly 创始人黄柏特，以及他的天使投资人、CreekStone 合伙人李一豪。柏特 24 岁，在字节期间做过开源项目 MineContext，也亲历了这一代 Agent 创业最残酷的一课：当 Claude Code、Cowork、OpenClaw 一路演进，很多看上去成立的产品形态，转眼就会被更强的基础能力“吞噬”。那么，创业公司的壁垒还能建立在哪里？最近，随着 AirJelly 的发布，他们也逐渐找到了一个真正值得下注的方向：下一代 Agent 的关键，不在对话框里，而在 Context ——去捕获用户真正的意图，理解跨 App、跨文件、跨工作流的连续上下文，再在恰到好处的时候主动介入。 Cursor 重新定义了 Tab，Typeless 重新定义了 Fn，而 AirJelly 想重新定义的是 Enter。人类表达意图的三个最主要通道——IM、chatbot、浏览器搜索——其实都汇聚在同一个键上。每一次 Enter，都是一个高光时刻。与其做全量录屏，不如精准捕获这些节点：就像历史并不记录每一天，而只记录那些真正改变了什么的时刻。在 2026 年，“主动式 AI”正在成为越来越强的行业共识。我们认为 Agent 产品真正的分野，将不能仅仅局限在“能不能做事、能把事做得多好”，而是“知不知道你为什么此刻要做这件事”。如果你是 AI 创业者、投资人，或者正在思考下一代主动式 AI / Agent 的产品方向，这期节目会给你一个具体的、也很值得展开讨论的观察角度。 🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将发布于 @十字路口Crossing 公众号。 🟢 00:00:33 快问快答 24岁、西安电子科技大学、ENTP/摩羯座；AirJelly 是“主动式上下文感知伙伴”；已完成天使轮；团队 8 人；此前在字节做 MineContext。 🟢 00:01:26 从记录工具到主动伙伴真正的升级，不是“记下更多”，而是“开始替你行动”。 * AirJelly 围绕事件、任务和意图组织记忆。 * 接入执行能力后，产品第一次出现了真正的 magical moment。 * 从“看见你做过什么”走向“知道你下一步要做什么”，这是范式变化。 🟢 00:03:46 重新定义 Enter 键 * Cursor 重新定义了 Tab，AirJelly 想重新定义 Enter。 * 每次按下 Enter ，都在抓住用户表达意图的瞬间。 * 最有价值的 context，不是屏幕内容，而是你决定做什么。 🟢 00:07:20 创业公司该做什么，才不容易被大模型吃掉？如果 Vibe Coding 很快就能做出 80 分，这件事多半不值得创业公司做。 * 团队做过 task engineering 但很快发现容易被 Claude Code 覆盖。 * 真正值得做的，是那些听起来简单、做起来全是 bad case 和工程脏活的部分。 * context 的获取、理解和召回，正是这种难而脏、却可能形成壁垒的方向。 🟢 00:11:22 从搜索到主动式 Agent 真正的跃迁，不是“搜到信息”，而是沿着你的历史与意图继续推进任务。 * 他们开始直接用 AirJelly 帮自己解释代码、修改功能、提交 PR，产品第一次形成自我增强闭环。 * 真正的 proactive，不是多提醒，而是同时理解意图与上下文，顺着用户的延长线往前走。 * 传统搜索在断点处结束，主动式 AI 则像侦探一样，把历史事件、任务线索和下一步动作拼起来。 * 很多产品做不成通用主动式 AI，本质上不是执行不够强，而是拿不到足够广泛的 context。 🟢 00:22:15 记忆与感知是护城河不是记录一切，而是抓住关键节点；不是执行更猛，而是先看到更多世界。 * 全量记录看似完整，实际噪音巨大，真正重要的是高密度的意图采样与关键节点捕捉。 * 如果主动式 AI 成立，用户迁不走的可能不是某个功能，而是长期积累下来的个人工作史与记忆系统。 * OpenClaw 像“龙虾”，视力有限、强在执行；AirJelly 是“水母”，强在感知，他们相信主动式 AI 的上限先取决于能看到多少世界。 * 当产品开始像一只被“养成”的 Agent，用户关系、留存逻辑和产品心智都会一起变化。 🟢 00:26:30 Agent 的产品边界真问题不是“能不能做”，而是“何时打扰、做多通用、接多少终端”。 * 主动式 AI 最难的不是提醒，而是 timing：用户切换应用时，往往才是更适合被打断和接受帮助的时刻。 * 2026 值得看的三条线是垂直 Agent、Agent Infra 和 Agent Hardware，背后都是在补齐 context 与执行链路。 * 做通用不是没想清楚，而是不想过早限定 workflow；AirJelly 赌的是用户会自己发明更多用法。 * 团队先从 PC 切入，再逐步拼接手机、微信与硬件，长期目标是跨设备、跨场景的生产力记忆系统。 🟢 00:39:30 AI native 组织怎么长出来 * 团队强调招会用 AI 工具的人，并尽量减少低效会议，让简单问题流式沟通、复杂信息系统沉淀。 * 他们想先把公司自己做成一个 AI native 的组织样板，而不只是做一个 AI 产品。 * 在这样的时代里，投资人提供的不只是钱，更是前沿方向的信息校准、关键人才网络和资源协同。 * AI 公司之间的差异，未来不只体现在模型和产品，也体现在组织方式本身是不是 AI native。 🟢 00:45:32 隐私是第一场战争主动式 AI 的关键，不只是更魔法，而是让用户觉得这份隐私交换是划算的。 * 想拿到更多 context，首先必须回答“为什么值得信任”。 * 但隐私不只是技术议题，也是情感议题和用户教育议题。 * 产品最可能的失败路径之一，不是方向错了，而是在隐私与效率之间没找到平衡。 🟢 01:03:35 创业，时不我待。 “童年是和平年代的假象。” * AI 时代的创业窗口已经压缩到 1 到 2 年，“再准备几年”可能只是旧时代留下来的安全感幻觉。 * 不是等准备好了再出发，而是时代已经不允许慢慢等。 * 这也是为什么这代 AI 创业者普遍带着更强的抢跑感和时间焦虑。 🟢 01:05:13 跳变还在后面 * OpenClaw 只是开场，更强的 computer use、长程任务能力和 agent 协同还会继续突破。 * 不给 2026 设上限，因为 2025 已经远超预期。 * 这期最值得听的，不只是 AirJelly 本身，而是一种对下一轮范式跳变的前置判断。欢迎订阅「十字路口」： 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。 👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站 👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻
68分钟 · 3个月前
14765
81

AI 正在给各行各业带来改变，我们在「十字路口」关注变革与机会，寻找、访谈和凝聚 AI 时代的「积极行动者」，和他们一起，探索和拥抱新变化、新的可能性。「十字路口」是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。