从OpenAI看AI的发展：从GPT-1/2/3、ChatGPT、Sora、GPT-4o到o1/3

AGI知益型男

65分钟 ·3个月前

19

·

0

从GPT-1/2/3、ChatGPT、Sora、GPT-4o到o1/3，OpenAI持续地引领AI技术方向，一次次展示了技术可能达到的程度，从而给行业以信心。ChatGPT上线两周年、2024年终之际，以这些模型为线索，和大家一起回顾最近几年AI的发展。

01:05（一）大模型：从“专用”到“通用”

01:38 “专用AI”：图灵测试

04:25 “通用AI”：任务的统一

05:37 1. GPT-1/2/3：预训练和语言模型 (2018-2020)

06:43 下一个词元预测为什么可以获得“通用”能力？

09:18 从GPT-1到GPT-3：更大的模型容量+更多的预训练数据 = 更强的能力

10:35 2. ChatGPT：后训练和对话应用 (2022.11)

10:45 为什么需要后训练？

13:23 大模型训练的三个阶段

14:45 3. Sora：视频生成和世界模拟器（2024.02）

17:56 Sora: 通向AGI的视觉路线

21:11 视频生成 --》交互式内容生成 --》世界模型

23:01（二）AIAgent：从“工具”到“工具的使用者”

24:24 beyond内容理解和生成：规划任务+使用工具

25:31 从助手CoPilot到工具使用者AI Agent

27:38 1. GPT-4o：端到端多模态和自然语言界面（2024.05）

28:13 GPT-4o展现的能力和可能的实现方法

29:44 设备自动控制Agent（DeviseUse）的发展

31:39 特点1：自然交互

34:21 特点2：自动化-越来越高的抽象级别

36:18 特点3：定制化-从软件1.0到软件2.0

38:38 Devise Use的发展阶段和对应技术

41:39 Devise Use的实现形式：模型-系统-规则

45:17 2. o1/3：强化学习和系统二推理 (2024.09/12)

45:27 OpenAI“双十二”：大模型推理和AI Agent

49:00 实现大模型推理的三种方式

49:42 监督学习vs强化学习：过程奖励的重要性

55:47 o1的复现工作总结（截止11月底）

58:30 IIya Sutskever：AlexNet、AlphaGo、GPT系列、Sora、o系列

1:01:30 OpenAI的启发：领先的认知+始终如一的坚持

在小宇宙打开