从图形学到 AI 生成 3D:我们离 3D 版 Midjourney 还有多远? | 对谈 Meshy.AI 创始人渊鸣

从图形学到 AI 生成 3D:我们离 3D 版 Midjourney 还有多远? | 对谈 Meshy.AI 创始人渊鸣

44分钟 ·
播放数12509
·
评论数71

大概 2020 年初的时候,胡渊鸣在知乎上发表过一个爆文,叫《99 行代码的冰雪奇缘》,那个时候他还在 MIT 读图形学的博士,在这篇文章下,第一名的评论是这么说的:“太巨了,图形+系统+编译,真的是创世的快乐”。

在这个之后他在图形学领域创业了几年,最近刚发布了新产品 Meshy.ai,一个 AI 生成 3D 的项目,这也是今年 AI 生成下最热门的方向之一。AI 生成文字、图片、视频、3D,基本是生成类方向的四块基石,前三者很多人大概都有些概念或者看过一些实际的产出,但相信还有不少人对 AI3D 领域很陌生,所以这期播客我就请来了图形学的专家渊鸣来一起聊聊这个领域的发展和 knowhow。

在这期播客中,我们理清了很多基础的概念,比如到底什么是图形学、如何理解渲染这件事、实现 3D 的一些基础技术路径等等,我们希望每个人都能通过这期播客了解到 AI3D 领域的基础知识,也能更好的理解图形学和未来世界的可能性。此外,我们也聊到了一些他作为科研 PhD 创业的心得体会等。

人类博物馆】

导游:曲凯,42章经创始人

十号珍藏:胡渊鸣,Meshy.AI 创始人,清华大学姚班本科,MIT 计算机科学博士

时光机】

  • 1:42 当我们聊到图形学,我们到底在聊什么?
  • 12:36 3D 数据的不同表达方式
  • 21:07 2D+时间维度=视频,2D+空间维度=3D
  • 22:25 AI 生成 3D 要解决的三类任务
  • 29:49 当 VR 设备成为了下一代 iPhone,3D 资产会成为日常生活的重要组成
  • 32:08 AI 生成 3D 的市场需求
  • 33:29 我们距离一个 3D 版的 Midjourney 还有多远?
  • 34:50 AI 生成视频与生成 3D,哪个会更快一些?
  • 38:48 创业最深的感悟:Why 是比 How 更重要的事情
  • 39:51 忘记自己从一个科学家角度对这个世界的理解
  • 43:11 上帝说:要有光

The gang that made this happen】

  • 制作人:Celia
  • 剪辑:思娜
  • 片头 bgm:Mondo Bongo - Joe Strummer & The Mescaleros

【Reference】

最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看)

渊鸣 (左),我,又在我家沙发

展开Show Notes
经常听小宇宙吸收能量,没想到自己也能录一期分享所学。谢谢 42 章经的邀请、曲凯老师的主持。如果大家有其他关于图形学、3D AI、Meshy 的问题也欢迎留言,我尽可能回复 ^_^
UltronFG:有个问题不知道是不是方便回答,想问下meshy.ai和太极图形的关系是什么呀?
Musisi:非常期待后续的进展~
15条回复
Jacknow
Jacknow
2023.12.17
主持节奏把得好,嘉宾回答的专业。
曲凯
:
听众回复的又好又专业😃
我是凯撒
我是凯撒
2023.12.17
非常硬核的一期。听完,有几点启示:
1/ 在数字化时代,信息获取越来越容易,同时,也带来信息过载的问题;

2/ 在做决策时,需要考虑信息的来源和可靠性。信息来源可靠,才能保证信息的真实性和准确性;

3/ 信息的相关性和实用性是重要的考虑因素。需要选择与自己的需求和目标相关的信息。个人的需求和偏好也是影响决策的重要因素;
琳琳Celia:哈哈哈还可以得到这种启示,是走错地方了吗?
llYaQoo
llYaQoo
2023.12.19
作为前影视从业者,现在转到游戏pcg方向的TA已经快两年了,越来越发现其实程序化生成这个方向在中小团队里很难搭建起来完善的工具流,如果大部分操作需要在DCC软件内部去操作再导出,美术人员会很抵触,更希望所有操作能再引擎内去完成,这也让c++或者c#成为一项必备技能,很多之前转过来的人会说,现在如果再想从影视转游戏TA的门槛真的越来越高了…而且经历了前段时间装找工作的经历,发现现在pcg这个方向的需求好像变得越来越少,挺想问问嘉宾怎么看未来这个方向的一个发展前景
maajor:程序化TA都是从Faycry那波火起来的,大家一股脑做大世界,现在看看没几个公司做出来了。我感觉这一小波是技术过热了。游戏根据自己的玩法一定有适合的工程方式,houdini也只是大世界玩法需求下特定的产物,大世界制作成本太高,只有少数公司玩得起,玩法需求少了对这种技术需求就肯定少了,但游戏开发无论如何都是更依赖引擎的。我感觉迷茫的pcg从业者要么想想怎么用ai技术提升大世界制作效率,要么把经验当个游戏行业敲门砖多学学游戏开发别的方面的技能。
游戏人有态度--大盛:而且你不觉得我们当年学的软件技术都从很基础开始,但是后来者学习理论缺乏很多基础理论和实操,上来就用实际案例教初学者,这也是人才断档的开始
10条回复
这期内容真棒!
HD566301q
HD566301q
2023.12.19
开头bgm好好听啊
李不多
李不多
2023.12.19
32:41 作为渲染师,prompt 生成 3d 是一场灾难
jiaxzheng
jiaxzheng
2023.12.19
听下来能明显感受到 Yuanming 对商业和产品的理解越来越成熟了
可惜meshy在目前的AI 3D中是比较垫底的存在
雨萌yumeng
雨萌yumeng
2023.12.20
曲老师帮我们科普的贼好
zooooooooooe
zooooooooooe
2023.12.17
29:02 游戏3D建模从业者报道
Diiiiiiiii
Diiiiiiiii
2023.12.23
速记:目前2D 图像的生成通过 Diffusion 已经解决得不错,接下来有两个发展维度,一个是时间上加一维,从图像到视频,另一个是空间上加一维,从 2D 图像到 3D 图像。难度上二者差不多,但是需求场景上差了不少。前者的受众是几十亿人,而后者如果看 ARVR 设备的 MAU 则只有几百万人,差了三个数量级(但如果加上 3D 游戏的用户,差距会少一些)。这直接导致了训练的数据量、商业价值 TAM 也是 3 个数量级的差距。所以大量的团队选择了前者,蜂拥过去做视频生成,而后者则现阶段更多寄生在游戏创作上。
13:21 虽然都是专业术语,但是都是我日常工作接触的内容
HD597947z
HD597947z
2023.12.20
看shownotes感觉在听专业课hhh
stargazering
stargazering
2023.12.18
招人吗 如何联系胡渊明
Alance
Alance
2023.12.18
what Andy gives, what Bill takes.
33:42 其实生成的资产好解决,但是生成的资产标准化是关键,只有统一标准化,资产才有利用价值
28:50 其实在iPad上普及 MUDBOX或者类似的Autodesk会好一些
milanow
milanow
2023.12.19
(恳求多聊一期技术
Beta__
Beta__
2023.12.18
要有光👍