OpenAI Sora发布:背后的商业洞察与技术创新

OpenAI Sora发布:背后的商业洞察与技术创新

70分钟 ·
播放数43698
·
评论数44

2 月 16 日,OpenAI 文生视频大模型「Sora」横空出世,一石激起千层浪。

从文生视频中斑点狗落脚的位置、游戏 demo 的光标颜色,到「世界模拟器」畅想,在 Sora 开放使用之前,我们的思考早已出发。通过深度对话与观点碰撞,我们尝试把握泡沫之下真正的潮流动向。

本期节目,我们邀请到真格基金管理合伙人戴雨森,十年的 AI 创业者季逸超 Peak, 从投资人和创业者的身份出发,聊聊商业与投资视角下 Sora 的意义。我们还探讨了 Sora 是不是所谓的 GPT 时刻?Sora 的突破对于创业公司意味着什么?对近期 AI 应用创业与投资有哪些独家观察?

【主持人】

谢岩 真格基金投资副总裁

【嘉宾】

戴雨森 真格基金管理合伙人

季逸超 真格基金 EIR、Magi创始人

【本期要点】

Sora 初印象

  • 03:04 合乎逻辑、可延续:对世界模拟的重大突破
  • 08:35 投资人的关注点:算力成本、训练数据、模拟效果
  • 11:06 产品视角的关注点:视频生成速度、使用门槛
  • 12:57 好莱坞 3D 渲染也得好几天:现阶段速度对于大模型意味着什么?

现阶段对于文生视频技术的高估与低估

  • 15:49 被低估的 scale up 潜力和被高估的模型效果
  • 18:19 只有理解世界底层规律,才能做出合理行为吗?
  • 19:40 背锅理论:为什么我们不能相信 AI?
  • 26:49 科技进步早期,从 0 到 1 的门槛很高
  • 29:52 风险投资就是要投泡沫下有啤酒的公司
  • 32:47 真正能够泛用的世界模拟器,可能不是 Sora

两种技术路径:Diffusion VS Autoregressive Transformer

  • 33:36 Sora 是扩散模型的延续,而 VideoPoet 是自回归模型的延续
  • 35:28 大模型「打死」小模型:通用模型统一了不同任务
  • 36:34 基于泛用性打造更广阔生态

Sora 是不是视频生成的 ChatGPT 时刻?

  • 37:56 如何定义 ChatGPT 时刻?
  • 39:48 为什么说 Sora 不是视频生成的 ChatGPT 时刻

机遇与挑战

  • 45:43 如何看待「套壳公司」?
  • 47:11 不能只做「生鱼片型」的创业公司
  • 48:40 做工具并不是赚不了钱
  • 56:50 技术创新和需求洞察:AI 创业者的两板斧
  • 01:00:56 AI Native 时代还没有形成特别好的商业模式
  • 01:07:17 世界模拟器或改写人类对现实的定义与认知
  • 01:08:07 对世界的高速模拟也是对生命的节约与拓展

【延伸阅读】

相关阅读:

深度拆解 Sora: 技术的惊喜与失望,「世界模型」的可能与想象|串台OnBoard!

相关资料:

Transformer 结构

Transformer 模型本质上是预训练语言模型,大都采用自监督学习 (Self-supervised learning) 的方式,在大量生语料上进行训练。也就是说,训练这些 Transformer 模型不需要人工标注数据。自回归模型是 Transformer 模型的一种。

自回归模型(Autoregressive Model)

自回归模型(Autoregressive Model),通常简称为 AR 模型,是一种用于时间序列分析和预测的统计模型。它基于时间序列自身的历史值来预测未来值,通过将当前时刻的观测值与前一时刻的观测值之间的关系进行建模。

扩散模型(Diffusion Models)

扩散模型能够实现从噪声(采样自简单的分布)生成目标数据样本。通过学习把图像逐步变成纯噪声的逆操作,扩散模型可以把任何一个纯噪声图像变成有意义的图像,从而完成图像生成。

VideoPoet

VideoPoet 是 Google 于 2023 年底发布的专注于视频生成的大语言模型,能够执行各种视频生成任务,包括文本到视频、图像到视频、视频风格化、 视频修复和扩展,以及视频转音频。和绝大多数视频领域模型不同,VideoPoet 并没有走 diffusion 的路线,而是沿着 transformer 架构开发,将多个视频生成功能集成到单个 LLM 中,证实了 transformer 在视频生成任务上的极大潜力。

【Staff】

监制:加分、Yifei

后期:Keyone Studio

【关于真格】

《此话当真》是一档由真格基金出品的泛商业类播客,真格基金投资团队将在此和各领域的领军人物一起分享最新热点和行业洞察。

真格基金创立于2011年,是国内最早的天使投资机构之一。自创立伊始,真格基金一直积极在人工智能、芯片与半导体、机器人与硬件、医疗健康、企业服务、新能源、跨境出海、消费生活等领域寻找最优秀的创业团队和引领时代的投资机会。

真格,你的创业第一站!

【联系我们】

公众号:真格基金(ID: zhenfund)

官网链接:www.zhenfund.com

邮箱:media@zhenfund.com

你可以通过小宇宙苹果Podcast喜马拉雅收听我们。

如对节目有任何的建议与期待,也欢迎大家在留言中互动~

展开Show Notes
Ragn
Ragn
2024.2.23
我最近听了很多 SORA 播客,我觉着是目前我听的最好的,或者是最适合大众的。三位嘉宾(包含 Monica😇)逻辑非常清晰整个产出干脆不带废话,就像几个 Tier 1 的大模型,输出非常稳定且专业(更少的 hallucination)。 其次因为三位背景都有创业/投资/一二级市场的相关知识,让整个 AI 相关话题可以更好的泛化和结合,反正就是很喜欢。 种草了
晨萱I语迟者说:但不得不说真格自己的月之暗面投对了,但reel.ai投错了
Ragn:投对一个足够了😁
感觉现在迭代越来越快了,希望下一次能有更大的惊喜,期待应用爆发的时期。
智能饭
智能饭
2024.2.23
36:10 说的好好,Diffusion路线目前最大的问题就是可控性和通用能力,而AT路线已经通过few-shot / zero-shot的方式证明了其能力
深夜1点46,100+正在人收听,大家都被震撼到失眠吗hhhh
Lula1900
Lula1900
2024.2.26
28:40 技术带来技术基础设施的爆发,引发泡沫,但会让后续应用得以落地
独托邦
独托邦
2024.2.23
这一期知识点密集又有趣!感谢主播们
弹跳曲奇
弹跳曲奇
2024.2.23
44:56 不要跟巨头在同一条赛道上赛跑
独托邦
独托邦
2024.2.23
08:29 前面对于Sora如何理解物理世界的细节真的很到位!
精神水豚
精神水豚
2024.2.23
非常有收获哦
Ccchuck
Ccchuck
2024.2.25
06:28 季逸超,我说这名字咋这么熟悉感觉很久之前听说过,一看果然原来是写magi的那位大佬
52:03 编辑和生成有矛盾,说的很棒
sparky_cZXB
sparky_cZXB
2024.3.21
如果世界能够被模拟 岂不是证明我们都是npc
LearnWise
LearnWise
2024.3.12
3 月 8 日,OpenAI 的 Sora 团队接受了油管知名博主 Marques Brownlee (简称 MKBHD) 的采访中,有个问题就是:用一个提示让 Sora 生成一个视频需要多长时间?答案是:得看具体情况,但你可以去买杯咖啡回来,它可能还在忙着生成视频。所以,答案是「需要挺长一段时间」。
artyou
artyou
2024.2.23
聊得清晰透彻,好节目,期待更多精彩
glass_heart
glass_heart
2024.2.22
这期的两个嘉宾是真·大佬。
陈壹舟
陈壹舟
2024.3.30
主持人的声音真的很有磁性,逻辑也很清晰✌️
LearnWise
LearnWise
2024.3.12
39:15 物体恒常性
睿杰
睿杰
2024.3.06
1:02:02 想的太多了。
PasIvre
PasIvre
2024.3.02
46:16 不能简单用“套壳”来给基于大模型底座的应用下定义
Fantasy003
Fantasy003
2024.3.02
中间提到的涌现这篇paper叫什么呀?先看看例子