GPT-4o长了眼睛,邀请他看我们看到的世界Zero Shot

GPT-4o长了眼睛,邀请他看我们看到的世界

53分钟 ·
播放数4248
·
评论数13

OpenAI:“今天,把大家聚到一起...“ 介绍了最新的 GPT-4o

We’re announcing GPT-4o, our new flagship model that can reason across audio, vision, and text in real time.

我们在第一时间探讨了 GPT-4o 发布的最新进展,特别是其新获得的视觉能力。通过这一突破性的技术革新,AI不仅能看见世界,还能理解并实时提供反馈。为什么“看到”重要?从“看”到“懂”,前所未有的应用可能和商业机遇又会是什么?

🎙️ 主播

任鑫Mars,Sky9 Capital 合伙人,《AI炼金术》主播,连续创业者:Get CEO,前京东O2O副总裁,前今夜酒店特价创始人

芒果Mango,Sky9 Build CTO,斜杠中年:架构师 /产品 /CTO /COO /交互设计 /创业者 /服务设计  /社会创新 /演员  /即兴戏剧 /一人一故事 /论坛剧场 /引导师  /社会工作者  /人类学调研员 /OD /合弄制实践者 /青色组织实践者

🎯 Highlight

GPT-4o “长眼睛”意味着什么?

03:00 GPT-4o 在情绪方面有了表达和理解

04:18 创造力和理解力的革命:音乐和3D方面非常吓人

07:14 人90%的信息来自于视觉,现在 GPT-4o “长眼睛”了:能看得见、看得懂,还能给你建议

09:15 未来有哪些职业有了新的可能与影响

34:41 加速发展下的成本控制策略

38:08 音乐与技术的融合无限可能

42:45 马克杯不够好,或许差一个:手机支架?

50:09 邀请GPT去看我们看到的世界,并与他共存

制作人

严格

🎵《Virtual Insanity》- Jamiroquai

forget your virtual reality, 忘记你那虚构的现实,
Futures made of virtual insanity, 这充斥疯狂与混乱的未来,
now always seem to be govern'd by this love we have, 现在看来,我们的爱,
for useless twisting our new technology, 都被扭曲先进的科技所掌控。
展开Show Notes
严格严格
严格严格
2024.5.14
👁️ 微观到极致,再宏观至宇宙的深处,自此,与Ta共生
催更~(^O^)
吴国宁
吴国宁
2024.6.28
hello 这集内容很棒 我们已经做出来了 叫multi modal agents
汤姆_ucsu
汤姆_ucsu
2024.6.01
嗨,up谢谢分享,还在英国吗
内容很好,小声建议:sh q 声母有破音😭😭
怎么能用上?
李莉_SYP
李莉_SYP
2024.5.31
09:31 鼠标和键盘的诞生是因为人类需要用手来控制物理世界、和虚拟世界互动。进入数字世界之后,鼠标键盘这些中介都不需要啦
SmartGalilei
SmartGalilei
2024.5.31
等我的plus账号获得了眼睛能力,我就开始自动驾驶项目
Koji
Koji
2024.5.15
40:45 我们最近在播客里面review Y Combinator 投资的 260 间 AI 公司,发现其中有两个已经可以做到这里你们提到的“AI,文生一段采样,控制单乐器、单音轨的采样,最后按音轨编辑音乐工程”:Soundry AI 和 Sonauto AI 两个公司
Mars任鑫
:
改天来一块儿聊聊连麦串台 :)
杨士奇
杨士奇
2024.5.15
所以先别急着结婚,可以再等等,老公已经在开发了
毛毛土豆:大胆一点以后会发展出新的伦理关系😆两类老公不冲突🤭
ZYDuan
ZYDuan
2024.5.15
08:28 好观点 客观观察世界