AI在人类世界的应用,从理解、识别拓展到生成,离不开模型的进步。当下热门AIGC产品背后,主要有两类生成式模型:大语言模型,源自AI的自然语言处理分支,代表产品ChatGPT;扩散模型,源自计算机视觉分支,代表产品妙鸭相机。
本期请到新书《扩散模型:生成式AI模型的理论、应用与代码实践》的作者杨灵,带我们入门这个适配场景极丰富(远不止于图像)的模型。
*感谢出版社友情赠书!评论区留言,先到先得。
【本期嘉宾】
杨灵 | 《扩散模型:生成式AI模型的理论、应用与代码实践》作者
【时间轴】
02:22 什么是扩散模型?与早期生成式模型、大语言模型的区别
09:58 都是AI,过去的美图秀秀P图和今天的妙鸭,技术有何差别?
12:20 如何基于扩散模型开发你自己的“妙鸭相机”
14:18 扩散模型生成速度慢,有什么解法?
18:40 视觉生成模型很难效仿语言模型的大力出奇迹
22:34 多模态还处于早中期,要解决数据间的语义对齐
28:08 扩散模型在生物医药领域是新宠
30:52 中、美在研究上基本平齐,落地应用上有些差距
【很高兴认识你】
散装智能,一档有人情味的科技播客。我们寻找科创和商业的交叉点,挖掘真价值,讲好真故事。
想交流?想表达?微信添加ziyuanao,或关注公号:散装智能