S8E05 | 深度解析GPT4o、谷歌AI助理:留给OpenAI和Google的时间不多了  | 硅谷徐老师

S8E05 | 深度解析GPT4o、谷歌AI助理:留给OpenAI和Google的时间不多了 | 硅谷徐老师

71分钟 ·
播放数44561
·
评论数84

5 月 14 日,OpenAI 在产品发布会上发布了最新 GPT-4o 多模态大模型,通过实时的语音、视频和文本交互震撼了全世界。然而就在这场发布会后一天,谷歌举办了 2024 年 I/O 开发者大会,发布了令人眼花缭乱的AI产品,名字都快多的记不过来了。当然最令人瞩目的还是和 GTP-4o 对标的 Project Astra。

本期节目邀请到三位业内人士进行访谈,其中包括两位 AI 领域的创业者:出门问问创始人兼 CEO 李志飞与 jobright.ai 联合创始人郑玉典。大家分享了在这两场发布会后的感受和思考,志飞从行业以及技术的角度大家分析了 AI 助理发展成真正可以日常使用的产品还需要解决的问题,以及 Open AI 和谷歌这两家科技公司各自现存的问题与挑战等。

本期人物

  • 丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播
  • 硅谷徐老师,AI高管、连续创业者、斯坦福客座讲师,小红书和微信视频号:硅谷徐老师 |公众号:硅谷云| YouTube: Byte into Future
  • 李志飞,出门问问创始人兼 CEO,美国约翰霍普金斯大学计算机系博士,自然语言处理及人工智能专家,前 Google 总部科学家
  • 郑玉典,AI /数据库博士,ex-Twitter/Newsbreak 广告推荐负责人,jobright.ai 联合创始人

主要话题
05:19 嘉宾来自 OpenAI 发布会现场的观察
11:51 多模态虚拟助理将引发新一轮人机交互革命
16:36 Demo啥时候能照进现实,GPT-4o 是否过度抬高期望值?
24:26 GPT-4o VS Astra,多模态模型第一轮较量谁胜谁负?
31:33 「小而美」的 OpenAI,与「大而全」的谷歌
34:23 「船大难掉头」? 皮查伊应该辞职
39:36 智能硬件成为主流设备还有多远的距离?
47:41 “渣男”苹果选 OpenAI 还是谷歌?可能是一招定生死
53:36 OpenAI 两大挑战:产品形态与商业模式
01:01:34 开源闭源的终局,留给 OpenAI 的时间还多吗?

关联阅读
GPT-4o让人机交互这个渣男有望重新做人

幕后制作
监制:丁教、Xinlu
后期:Jack、迪卡
运营:George
设计:饭团

商务合作
声动活泼商务合作咨询

支持我们,加入新一年的播客创新
2021 年我们发起了「声动胡同会员计划」,这是一个纯支持项目,支持「声动活泼」在播客内容上不断探索和创新。回顾 2023 年,得益于这些支持,「声动活泼」的每档节目都不断突破,不仅荣登苹果中国的年度热门节目榜单,还在 CPA 和喜马拉雅等平台都榜上有名。2024 年全新付费节目「不止金钱」现已上线,欢迎收听。同时,新一季「跳进兔子洞」即将上线,敬请期待!
胡同

加入我们
声动活泼正在招聘全职「节目监制」、「节目营销」、「商业化项目管理」,查看详细讯息请 点击链接。如果你已准备好简历,欢迎发送至 hr@shengfm.cn, 标题请用:姓名+岗位名称。

关于声动活泼
「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声动早咖啡声东击西吃喝玩乐了不起反潮流俱乐部泡腾 VC商业WHY酱跳进兔子洞
欢迎在即刻、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。
期待你给我们写邮件,邮箱地址是:ting@sheng.fm
声小音

欢迎扫码添加声小音,在节目之外和我们保持联系。

Special Guests: 李志飞 and 郑玉典.

展开Show Notes
_YE0N
_YE0N
2024.5.18
1:05:38 都这么急功近利,所以我们中国不会有谷歌和openai啊🤣
张萌MengZhang:还是中国竞争太激烈了 不这样可能就死了
摸摸摸摸摸摸鱼:嘉宾的发言就像在问:初中毕业还不赶紧进厂打螺丝挣钱啊,为什么还要读高中大学?!殊不知人家的目标是读博士 lol
3条回复
这期很精彩
丁教Diane
:
感谢
晨萱-语迟者说-INFJ:还是得多请硅谷徐老师来,品质的保障
HD738974t
HD738974t
2024.5.19
50:02 Google花钱让苹果Safari把google search做default就已经被美国政府反垄断盯上了(还在官司中),如果像访谈里说的花钱来抢合同,那ceo又得天天去听证会了。还有关于服务收费这个问题,Google advanced收费模式里包括2tb的Google one,实际上模型用户月供差不多10块。api部分现在成本应该是不低的,所以没法做到免费,不然也没有必要有趋势是把模型做小了。这次IO发布的Gemini flash api就用1/10的定价提供了decent的效果,说明不是不想定低价抢用户实在是成本压不住。甚至我还在想如果苹果用了OAI,OAI的server能不能撑住,会不会苹果还得出钱帮oai在azure上租机器.
HD738974t:而且还有一个点,个人感觉Google的从炫技慢慢过渡到深耕产品,我觉得反而是一个好事情。工程师和用户之间的vide和taste上的差异有时候不可逾越。另外Google的主要商业模式还是在提供免费服务的基础上卖广告,次要的部分是近几年大力发展了云和device来diversified,本质上还是toB挣企业的钱。所以Ai发展到哪个阶段完全凭借外面企业需要它到哪个程度,long context能让应用部署层很好做,所以把ai做的很像“人”更像10年前放荡不羁的Google,应该不属于现在“主流”ai落地的大方向。
56:36 这个思路也太中国了。完全就是做应用的思路。openai更底层,资本也更充足,上限还早呢。这样想太窄了。
vigos:没办法,老钟就这样
不喜欢志飞嘉宾...🙄
Eason_听唠叨:也不会用他家产品。
粒粒安07:用过…难用
HD205565x
HD205565x
2024.5.18
01:09:42 都希望开源,然后我们就可以抄了
51:38 中外思路真的差异太大了,李志飞总出门问问公司竞标一汽的座舱语音项目。预算200多万,问问报价100多点,卷死大家。在这里夸夸其谈Google也是挺没意思的。
CNL
CNL
2024.5.20
这期国内外经验的嘉宾有不同视角,对几家公司的AI竞争、市场dynamics有更深理解。
嘉宾表达的信息密集,赞👍🏻徐老师的提问和对嘉宾观点的 paraphrase,帮助普通听众确认理解观点是什么。
Ming_Stacey
Ming_Stacey
2024.5.17
还是这么有时效性!Diane还问了我想问的硬件问题!🥳 p.s. Google产品那么多名字,原来侧面反应了机构的管理/层级。这确实忽略了。
https://blog.google/technology/ai/google-gemini-update-flash-ai-assistant-io-2024/
我想请问下gpt4为什么会瞎编,比如我问醉翁亭记是谁写的,它和我说是贾谊❓然后我说你胡说的话我会投诉你哦,它又马上更正是欧阳修。它是故意的还是不小心的。。。
HeyAlaia:产生幻觉目前是没办法解决的,也不是故意说谎,你的每一次修正也是一次微调
冰糖_FySG:Gpt喜欢自己编,我也不知道为何要这样,可以说不知道,但是就爱编,你戳穿它后,它说抱歉,但是还是继续编
Reiz
Reiz
2024.5.17
来了!昨天就在等了!
LyuDs
LyuDs
2024.5.17
1:06:10 风度太差了。是不是谷歌坍台,急需心理慰藉所以塑了尊新神奥特曼说不得碰不得,否则马上急眼阿?
living_ROjv
living_ROjv
2024.5.20
48:16 笑,国内厂原来都这么狭窄,技术不行,搞补贴挤竞争对手,还觉得是好点子,且不说openai背后的财团,就说谷歌这么做,直接被北美圈内外喷死,不正当竞争,等着股价下跌吧
10:38 好讨厌啊 这个人为什么要插话 让人家说完不好吗
文森正在听:12:25 12:07 就是来找你这条的,hhh
Tsingy
Tsingy
2024.5.28
个人观点:1. Google恶意竞争驱逐OpenAI的简历里,把OpenAI当做预算有限的小公司。其实忽略了它背后的微软。2. 现在美国AI军备竞赛不是要以现有的模型做产品,而是在开发下一代模型。3. 以目前的用户产品来评价公司上限和前景没有意义。开发出远超竞品模型的厂家会占据整个市场。4. 志飞老师应该是国内的PMF派,不是模型至上派。
Mengyu_gT9T
Mengyu_gT9T
2024.5.25
我觉得不能把大模型的渗透率跟Facebook, search engine这些日常应用和娱乐工具比,目前看来大模型更多是生产工具效率工具,像excel不是人人都用的,但是用的人是离不开的。我不觉得open ai目前用户不增长就代表它要完了
1:04:57 Google 就应该像开源 tensorflow 一样尽快开源自己的大模型了,让客户在谷歌云上部署开源的大模型。
1:06:00 好搞笑,徐老师很好地说出了我想说的,哈哈~
黑咖黑咖
黑咖黑咖
2024.5.21
55:22 55:18 GPT store 现在看到的几个问题:1.马太效应(这或许与搜索排序机制的设计有关 我自己觉得设计得太蠢了🥴)2.对于技能的 owner 来说还能怎么样去优化,自由度是非常低的现在看起来 3.如何保护开发者的知识产权,比如防伪。 4. 到底要走向哪里,是成为 agents 还是 agents 的中间件还是啥。目前看起来这个生态是有点问题的。
04:1204:11 我记得主持人只打了个招呼 他为什么自顾自说一堆而且收音效果那么差?