#128. 计算机视觉遇上大语言模型牛油果烤面包

#128. 计算机视觉遇上大语言模型

55分钟 ·
播放数3008
·
评论数7

整整4年前,计算机视觉领域专家孙晨首次做客节目,介绍了计算机视觉领域的发展。如今,他再次做客,详细讨论了大语言模型对计算机视觉带来的巨大冲击与新机遇,并回顾了过去4年的显著变化。他提到生成式模型的崛起,使图像和视频生成技术取得了突破性进展,以及扩散模型在生成高保真度图像中的应用。孙教授分享了他的研究成果,包括一个用于测试模型在新环境中表现的宇航员测试集。他还探讨了大语言模型在医学、教育等领域的广泛应用和未来趋势,强调了工程能力在该领域的重要性,并提出了未来发展的挑战与机遇。

嘉宾:孙晨
主播:斯图亚特、Vindy
剪辑&时间线:季雨清

  • 00:01:53 学校做科研和企业做研究的区别
  • 00:09:39 短短4年,做菜视频生成菜谱的理想已经实现
  • 00:19:34 学术界寻找自我
  • 00:22:37 计算机视觉的最新进展
  • 00:29:01 AI具备“理解”能力吗
  • 00:37:16 给AI打工
  • 00:44:41 计算机视觉的可能未来
  • 00:51:24 如何进入计算机视觉领域

欢迎您在每期节目下方给我们留言,和我们的主播互动交流。如果您对我们的志愿者工作有兴趣,请点击 这个链接 看我们的招募帖;你有什么有趣的话题,想来作牛油果烤面包的嘉宾,或是对节目有任何的意见或建议,欢迎发邮件和我们联系。我们的邮件地址是:host@avocadotoast.live

片头片尾音乐:
Courante 1st Cello Suite
Exzel Music Publishing (freemusicpublicdomain.com)
Licensed under Creative Commons: By Attribution 3.0
creativecommons.org

展开Show Notes
Stone-Wang
Stone-Wang
2024.6.09
所有对于ai负面影响的评价:已经是这样了还能怎么样,你无法阻挡。这句话从科研人员嘴里说出来就特别讽刺
Kinozco
Kinozco
2024.6.21
感觉主持人信息有点太滞后了
MingChung
MingChung
2024.6.16
斯图亚特捧哏的好认真呀😄
小端午dd
小端午dd
2024.6.09
能给整理一个牛油果教授专辑吗?
小端午dd
小端午dd
2024.6.09
33:04 是的,我让它把某个单词放到图里,总是会给一个错误的甚至不存在的单词
CC023
CC023
2024.6.09
谢谢。
小端午dd
小端午dd
2024.6.09
哈哈哈哈斯图亚特起码说了四次藤校教授