作者拆书 | 解密妙鸭相机背后的扩散模型 - 先见未明

AI在人类世界的应用，从理解、识别拓展到生成，离不开模型的进步。当下热门AIGC产品背后，主要有两类生成式模型：大语言模型，源自AI的自然语言处理分支，代表产品ChatGPT；扩散模型，源自计算机视觉分支，代表产品妙鸭相机。

本期请到新书《扩散模型：生成式AI模型的理论、应用与代码实践》的作者杨灵，带我们入门这个适配场景极丰富（远不止于图像）的模型。

*感谢出版社友情赠书！评论区留言，先到先得。

【本期嘉宾】

【时间轴】

02:22 什么是扩散模型？与早期生成式模型、大语言模型的区别

09:58 都是AI，过去的美图秀秀P图和今天的妙鸭，技术有何差别？

12:20 如何基于扩散模型开发你自己的“妙鸭相机”

14:18 扩散模型生成速度慢，有什么解法？

18:40 视觉生成模型很难效仿语言模型的大力出奇迹

22:34 多模态还处于早中期，要解决数据间的语义对齐

28:08 扩散模型在生物医药领域是新宠

30:52 中、美在研究上基本平齐，落地应用上有些差距

【很高兴认识你】

散装智能，一档有人情味的科技播客。我们寻找科创和商业的交叉点，挖掘真价值，讲好真故事。

想交流？想表达？微信添加ziyuanao，或关注公号：散装智能