从GPT-1/2/3、ChatGPT、Sora、GPT-4o到o1/3,OpenAI持续地引领AI技术方向,一次次展示了技术可能达到的程度,从而给行业以信心。ChatGPT上线两周年、2024年终之际,以这些模型为线索,和大家一起回顾最近几年AI的发展。
01:05(一)大模型:从“专用”到“通用”
01:38 “专用AI”:图灵测试

04:25 “通用AI”:任务的统一
05:37 1. GPT-1/2/3:预训练和语言模型 (2018-2020)
06:43 下一个词元预测为什么可以获得“通用”能力?

09:18 从GPT-1到GPT-3:更大的模型容量+更多的预训练数据 = 更强的能力
10:35 2. ChatGPT:后训练和对话应用 (2022.11)
10:45 为什么需要后训练?
13:23 大模型训练的三个阶段

14:45 3. Sora:视频生成和世界模拟器(2024.02)
17:56 Sora: 通向AGI的视觉路线

21:11 视频生成 --》 交互式内容生成 --》 世界模型

23:01(二)AIAgent:从“工具”到“工具的使用者”
24:24 beyond内容理解和生成:规划任务+使用工具

25:31 从助手CoPilot到工具使用者AI Agent

27:38 1. GPT-4o:端到端多模态和自然语言界面 (2024.05)
28:13 GPT-4o展现的能力和可能的实现方法

29:44 设备自动控制Agent(DeviseUse)的发展

31:39 特点1:自然交互

34:21 特点2:自动化-越来越高的抽象级别

36:18 特点3:定制化-从软件1.0到软件2.0

38:38 Devise Use的发展阶段和对应技术

41:39 Devise Use的实现形式:模型-系统-规则

45:17 2. o1/3:强化学习和系统二推理 (2024.09/12)
45:27 OpenAI“双十二”:大模型推理和AI Agent

49:00 实现大模型推理的三种方式

49:42 监督学习vs强化学习:过程奖励的重要性
55:47 o1的复现工作总结(截止11月底)

58:30 IIya Sutskever:AlexNet、AlphaGo、GPT系列、Sora、o系列

1:01:30 OpenAI的启发:领先的认知+始终如一的坚持

