作者拆书 | 解密妙鸭相机背后的扩散模型先见未明

作者拆书 | 解密妙鸭相机背后的扩散模型

33分钟 ·
播放数242
·
评论数4

AI在人类世界的应用,从理解、识别拓展到生成,离不开模型的进步。当下热门AIGC产品背后,主要有两类生成式模型:大语言模型,源自AI的自然语言处理分支,代表产品ChatGPT;扩散模型,源自计算机视觉分支,代表产品妙鸭相机。

本期请到新书《扩散模型:生成式AI模型的理论、应用与代码实践》的作者杨灵,带我们入门这个适配场景极丰富(远不止于图像)的模型。

*感谢出版社友情赠书!评论区留言,先到先得。

【本期嘉宾】

杨灵 | 《扩散模型:生成式AI模型的理论、应用与代码实践》作者

【时间轴】

02:22 什么是扩散模型?与早期生成式模型、大语言模型的区别

09:58 都是AI,过去的美图秀秀P图和今天的妙鸭,技术有何差别?

12:20 如何基于扩散模型开发你自己的“妙鸭相机”

14:18 扩散模型生成速度慢,有什么解法?

18:40 视觉生成模型很难效仿语言模型的大力出奇迹

22:34 多模态还处于早中期,要解决数据间的语义对齐

28:08 扩散模型在生物医药领域是新宠

30:52 中、美在研究上基本平齐,落地应用上有些差距

【很高兴认识你】

散装智能,一档有人情味的科技播客。我们寻找科创和商业的交叉点,挖掘真价值,讲好真故事。

想交流?想表达?微信添加ziyuanao,或关注公号:散装智能

展开Show Notes
floweryou
floweryou
2023.10.09
语速过快了!!来不及过脑子🧠
老王不姓王
:
本期内容确实偏干,建议0.8倍速用水冲服
Yummy_AI
Yummy_AI
2023.9.25
求书求书!播客听了好有收获
老王不姓王
:
啊抱歉!书已经送完了,不介意的话私信留个地址,我把我那本寄给你