2 月 16 日,OpenAI 文生视频大模型「Sora」横空出世,一石激起千层浪。
从文生视频中斑点狗落脚的位置、游戏 demo 的光标颜色,到「世界模拟器」畅想,在 Sora 开放使用之前,我们的思考早已出发。通过深度对话与观点碰撞,我们尝试把握泡沫之下真正的潮流动向。
本期节目,我们邀请到真格基金管理合伙人戴雨森,十年的 AI 创业者季逸超 Peak, 从投资人和创业者的身份出发,聊聊商业与投资视角下 Sora 的意义。我们还探讨了 Sora 是不是所谓的 GPT 时刻?Sora 的突破对于创业公司意味着什么?对近期 AI 应用创业与投资有哪些独家观察?
【主持人】
谢岩 真格基金投资副总裁
【嘉宾】
戴雨森 真格基金管理合伙人
季逸超 真格基金 EIR、Magi创始人
【本期要点】
Sora 初印象
- 03:04 合乎逻辑、可延续:对世界模拟的重大突破
- 08:35 投资人的关注点:算力成本、训练数据、模拟效果
- 11:06 产品视角的关注点:视频生成速度、使用门槛
- 12:57 好莱坞 3D 渲染也得好几天:现阶段速度对于大模型意味着什么?
现阶段对于文生视频技术的高估与低估
- 15:49 被低估的 scale up 潜力和被高估的模型效果
- 18:19 只有理解世界底层规律,才能做出合理行为吗?
- 19:40 背锅理论:为什么我们不能相信 AI?
- 26:49 科技进步早期,从 0 到 1 的门槛很高
- 29:52 风险投资就是要投泡沫下有啤酒的公司
- 32:47 真正能够泛用的世界模拟器,可能不是 Sora
两种技术路径:Diffusion VS Autoregressive Transformer
Sora 是不是视频生成的 ChatGPT 时刻?
机遇与挑战
- 45:43 如何看待「套壳公司」?
- 47:11 不能只做「生鱼片型」的创业公司
- 48:40 做工具并不是赚不了钱
- 56:50 技术创新和需求洞察:AI 创业者的两板斧
- 01:00:56 AI Native 时代还没有形成特别好的商业模式
- 01:07:17 世界模拟器或改写人类对现实的定义与认知
- 01:08:07 对世界的高速模拟也是对生命的节约与拓展
【延伸阅读】
相关阅读:
深度拆解 Sora: 技术的惊喜与失望,「世界模型」的可能与想象|串台OnBoard!
相关资料:
Transformer 结构
Transformer 模型本质上是预训练语言模型,大都采用自监督学习 (Self-supervised learning) 的方式,在大量生语料上进行训练。也就是说,训练这些 Transformer 模型不需要人工标注数据。自回归模型是 Transformer 模型的一种。
自回归模型(Autoregressive Model)
自回归模型(Autoregressive Model),通常简称为 AR 模型,是一种用于时间序列分析和预测的统计模型。它基于时间序列自身的历史值来预测未来值,通过将当前时刻的观测值与前一时刻的观测值之间的关系进行建模。
扩散模型(Diffusion Models)
扩散模型能够实现从噪声(采样自简单的分布)生成目标数据样本。通过学习把图像逐步变成纯噪声的逆操作,扩散模型可以把任何一个纯噪声图像变成有意义的图像,从而完成图像生成。
VideoPoet
VideoPoet 是 Google 于 2023 年底发布的专注于视频生成的大语言模型,能够执行各种视频生成任务,包括文本到视频、图像到视频、视频风格化、 视频修复和扩展,以及视频转音频。和绝大多数视频领域模型不同,VideoPoet 并没有走 diffusion 的路线,而是沿着 transformer 架构开发,将多个视频生成功能集成到单个 LLM 中,证实了 transformer 在视频生成任务上的极大潜力。
【Staff】
监制:加分、Yifei
后期:Keyone Studio
【关于真格】
《此话当真》是一档由真格基金出品的泛商业类播客,真格基金投资团队将在此和各领域的领军人物一起分享最新热点和行业洞察。
真格基金创立于2011年,是国内最早的天使投资机构之一。自创立伊始,真格基金一直积极在人工智能、芯片与半导体、机器人与硬件、医疗健康、企业服务、新能源、跨境出海、消费生活等领域寻找最优秀的创业团队和引领时代的投资机会。
真格,你的创业第一站!
【联系我们】
公众号:真格基金(ID: zhenfund)
官网链接:www.zhenfund.com
邮箱:media@zhenfund.com
你可以通过小宇宙、苹果Podcast、喜马拉雅收听我们。
如对节目有任何的建议与期待,也欢迎大家在留言中互动~