DeepSeek 之后,黄仁勋的「AI 平台」故事能讲得通么?|英伟达 GTC 2025  S9E08

DeepSeek 之后,黄仁勋的「AI 平台」故事能讲得通么?|英伟达 GTC 2025 S9E08

32分钟 ·
播放数12449
·
评论数17

3月17日,全球科技界迎来 AI 领域的「超级碗」-- 英伟达 GTC 大会。英伟达 CEO 黄仁勋在 Keynotes 的演讲中揭晓了英伟达所布局的 AI 发展路线图:从生成式 AI 到代理式 AI(Agentic AI),最终迈向物理 AI(Physical AI)。一方面,英伟达发布了比如 Blackwell Ultra 等更快更强的硬件设备,另一方面,英伟达则致力于打造 AI 时代的「操作系统」,将开发者绑定在英伟达的 「AI 工厂」生态当中。老黄的演讲结束之后,英伟达股票先是下跌 3.4%,第二天又有所反弹,反应出资本市场情绪的改变。
「科技早知道」主播丁教 Diane 也是去了 GTC 大会现场,为大家带回了第一手的报道。我们今天的节目聚焦英伟达以「推理主战场」为核心的软件生态,为大家详细解析英伟达技术飞轮的各个环节 -- 从开源推理框架、到 GPU cloud,再到机器人模型。可以肯定的事,英伟达的野心已经不再是一家「卖卡」的硬件公司,而是将 AI 时代的软件平台牢牢掌握在自己手中。

本期人物
丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播
Yaxian,「科技早知道」节目监制

主要话题
01:01 英伟达股价先跌后涨,黄仁勋讲的不是「新故事」,但却是「新现实」
03:55 英伟达三大推理基础设施:Llama Nemotron 开源大模型,Dynamo 推理系统、AI 数据模型
07:22 Dynamo 软件 :AI 厨房的中央调度系统,让推理更快更高效
11:40 原生 GPU cloud 服务商崛起:AI 时代云计算格局大洗牌
15:16 拼大模型训练的时代已经过去,为什么推理才是未来 AI 的主战场?
20:46 Agentic AI 全面爆发,Physical AI 即将到来
23:04 机器人赛道突飞猛进:Cosmos 生成模拟数据,Issac GR00T N1 提供基础模型
26:45 自动驾驶技术的未来:Road AGI 指日可待

延伸信息
NIM
NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,为自托管 GPU 加速推理微服务提供容器,基于优化推理引擎构建,能自动优化模型和 GPU 组合的性能,还提供标准数据源和自动扩展支持。

Llama Nemotron
Llama Nemotron 是 NVIDIA 推出的开放式大语言模型系列,基于商用开源 Llama 基础模型构建。该系列为 AI 智能体开发提供优化基础模组,可通过 NVIDIA NIM 微服务等形式提供,能在多种计算平台上运行,为企业代理式 AI 奠定基础。

Dynamo
Dynamo 是 GTC 大会发布的开源推理软件,通过协调数千个 GPU 间的推理通信,降低成本、提高效率,集成了 GPU 规划器等四大创新组件,兼容多种主流推理后端。

Isaac GR00T N1
Isaac GR00T N1 是 NVIDIA 推出的全球首款开源人形机器人功能模型。它采用双系统架构,系统 1 基于扩散变换器,能实时生成精准连续动作轨迹,执行高频率操作;系统 2 基于视觉 - 语言模型,负责环境感知、任务推理与规划。

Cosmos
是英伟达的世界基础模型平台,包括 Cosmos Transfer 和 Cosmos Predict 等模型,可将 3D 仿真数据转换为逼真视频,用于生成合成数据,能加速机器人和自动驾驶领域的物理 AI 开发。

VLA 技术
是视觉 - 语言 - 动作模型(Vision - Language - Action Model)。它是一种融合了视觉、语言和动作的多模态大模型范式。它可以从传感器数据中提取丰富的环境信息,借助语言模型理解人类指令并生成可解释的决策过程,最后转化为驾驶操作指令。

内容研究志愿者招募
Hi 你好呀,这里是《科技早知道》内容研究志愿者招募。如果你是前沿科技行业的从业者(包括但不限于半导体、先进制造、计算机、AI、生物医药、航空航天等等),欢迎加入我们分享你在行业内的一手观察和见解。
你将有机会参与到节目的制作当中,你的知识和见解也可能成为未来节目的一部分!
志愿者招募入口

加入声动活泼
声动活泼目前开放全职设计师、商业发展经理、商业内容策划、内容编辑实习生、早咖啡内容研究实习生、社群运营实习生等6个职位,详情点击招聘入口

声动活泼年度新节目上线!

Untitled
这次,我们倾全团队之力为 AI 时代的青少年做了一件微小但重要的事。

每期 10 分钟,从一个青少年感兴趣的现象谈起,涉及商业科技、社会人文等话题,解读表象背后的深层逻辑,启发青少年提出自己的好奇。每周一、三、五早晨 6 点在各大音频平台准时更新。

🧧前 3 期内容可以免费试听。现在购买,即可享受早鸟价 292 元,2025 年 4 月 30 日之后,将恢复原价 365 元。现在就去节目主页试听吧 ↓
小宇宙听友请点这里
Apple Podcast 听友请点这里

幕后制作
监制:Yaxian
后期:Jack
运营:George
设计:饭团

商务合作
声动活泼商务合作咨询
Untitled

关于声动活泼
「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声动早咖啡声东击西吃喝玩乐了不起反潮流俱乐部泡腾 VC商业WHY酱跳进兔子洞不止金钱
欢迎在即刻、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。
期待你给我们写邮件,邮箱地址是:ting@sheng.fm
声小音
欢迎扫码添加声小音,在节目之外和我们保持联系。

Special Guest: 雅娴.

展开Show Notes
置顶
我们为 AI 时代的青少年打造的晨间新播客「Knock Knock 世界」已上线!欢迎 9 岁以上的青少年和家长们免费试听→ 《Knock Knock 世界|第一季》
HD594383c
HD594383c
5天前
有没有发现deepseek在入编之后变傻了,当一个工具成为政治家的盘中餐后无论他多么优秀都会变得人情世故,不在像初出茅庐的青年人那样无所畏惧的回答你的任何问题。
HD944777l:你本地部署嘛
约小亚
约小亚
5天前
的地得错误出现在标题里,运营同学扣鸡腿🐶
Yaxian:感谢约老师捉虫!马上改正~这是监制同学的锅,与运营同学无关😅😅
约小亚:抱歉,送回一只鸡腿🍗
期待科技早知道聊量子计算!
陈乐群
陈乐群
3天前
12:41 不仅是需要GPU,还需要配套的网卡。众所周知,N卡网速快。这句话在 NVIDIA 收购了 Mellanox 之后就从梗变成了事实。Mellanox 的 ConnectX 网卡支持一个技术叫做 IBGDA,就是能让显卡直接向网卡发消息,不需要经过CPU。IBGDA 和 RDMA 不同,RDMA 只是数据传输不需要经过 CPU,而 IBGDA 甚至连发起传输这个操作都不需要经过 CPU。这个技术可以大幅度地降低延迟,对 DeepSeek 这样的 MoE 模型特别重要,因为生成一个token就需要进行116次跨机通讯。然而 AWS 的自研网卡现在还不支持这个功能。AWS P5和P5e实例搭配的 EFAv2 从硬件上就不支持这个功能。P5en 实例搭配的 EFAv3 倒是可以在硬件上增加这个支持,但是从安全审核到 BIOS 到驱动到上层的软件接口,全部都还是空白。
cloudtoday
cloudtoday
20小时前
支持科技早知道
双方都知道对方要说什么,明知故问的对话形式很奇怪
国内非常多的公司为了本地部署DeepSeekAI模型,英伟达特供国内的H20 GPU似乎已经爆单了,正好符合上期Yaxian说的某部分市场增长的情况。
来啦!之前是aws/gcp的gpu cloud + AI (sage maker/vertexAI),老黄这回是要基于自己的优势,把大家拉回Nvidia从硬件到软件的生态系统嘛🤣
Shawn998
Shawn998
6天前
00:06 来了来了
cool!
imakoala
imakoala
6天前
盼来了🤩🤓🥸!