“我想击碎你们对于 AI 不切实际的幻想,并重建一个正确的认知”| 对谈李乐丁,战壕里的百度主任架构师十字路口Crossing

“我想击碎你们对于 AI 不切实际的幻想,并重建一个正确的认知”| 对谈李乐丁,战壕里的百度主任架构师

85分钟 ·
播放数38250
·
评论数171

有史以来最干货的一期「十字路口」来了!

在本期内容中,嘉宾李乐丁深入浅出地介绍生成式 AI、解读 AI 创业方向、畅聊硅谷巨头 AI 战略,还全面介绍了杨立昆教授、世界模型、 AI 搜索等行业热点。这是「十字路口」的第 20 期播客,也是我认为最有价值的一期,有常识、有新知、有大量的启发。

——

今天的嘉宾李乐丁是我认识超过十年的宝藏朋友,我们一起自驾去内蒙古、一起吃遍了北京日料,聊着五花八门的天,见证着彼此的成长。

李老师从 2010 年加入百度,作为主任架构师,一直承担着最艰巨的任务。

如今,科技行业普遍共识生成式 AI 将成为未来最重要、规模最大的技术基础设施。在生成式 AI 之前,科技行业的历史上最重要的、规模最大的两次技术基础设施建设分别是搜索和云服务。而李老师在百度的 12 年工作履历中,前面 6 年是搜索的架构师,后面 6 年是云服务的架构师。可以说,经历过这两大规模技术基础设施的架构师,放眼全球也屈指可数。

要胜任大规模技术基础设施的架构工作,不仅需要对技术有深刻的理解,还需要对系统中每个角色和环节有深入的认识,才能制定系统性的策略,完成架构设计。

在当今的 AI 领域,各种观点层出不穷,许多人言辞激烈。然而,值得注意的是,今天积极发言的大多是行业观察家,尤其是媒体老师和投资人。因此,「十字路口」邀请李老师来与大家分享生成式 AI 的过去、现状与未来,正是基于这个原因:

只有在战壕里面的人,才能听得到炮火的声音;并且,只有经历过同等规模战役的指挥官和架构师,才听得懂炮火声中的深意。

——

🎈 特别感谢:北京 Keyone Studio 提供录音场地。

——

🎬 时间轴:

Part 1 击碎吧!对 AI 不切实际的幻想们

关于 AI:幻想太多,理性太少。不被击碎的幻想是泡沫,击碎的幻想就可能是机会。

02:19 几个层次的幻想

04:42 为什么有这么多幻想?

05:55 如何击碎幻想?从了解 AI 的原理开始

09:44 沉浸在不切实际的幻想中,会带来哪些伤害?

10:50 关于 AI 的泡沫:必然出现、值得迎接;但也要看到它真的是泡沫。

12:05 ChatGPT 3.0 发布 18 个月的变与不变有哪些?

Part 2 颠覆吧!Google

李老师曾担任百度阿拉丁的首席架构师,在 AI 搜索这件事上,他是最有发言权的人之一。

15:07 AI 搜索会不会颠覆 Google?

16:45 Perplexity 的价值是什么?

18:42 Google 的软肋是什么?这里藏着 Perplexity 的机会

19:47 做 RAG 的时候,谁先明白 AI 是关键要素中最不重要的那一点,可能谁赢。

Part 3 纵身一跃吧!AI 创业者们

了解生成式 AI 的技术原理、洞察用户需求与场景特点后,会做出什么样的创业选择?

错误的 AI 创业方向:

  • 25:18 方向1:用 AI 制定旅行攻略;人们的目标,经常是在搜索和翻阅资料的过程中,才被明确下来的。

  • 27:50 方向 2:用 AI 直接全托管打车、订机票和酒店

适合 AI 创业的场景:

  • 29:58 特征:高毛利 + 高容错

  • 31:28 低垂的果子:数字化广告、云上卖卡

33:01 生成式 AI 让抖音的推荐算法更牛逼了

37:01 从中国 AI 创业项目看到的两个闪光点

39:20 缺乏独特性的 AI PaaS 项目

关于 Scaling Law:

  • 40:49 此刻的现状,就是 Scaling Law 的天花板;不能因为汽车是一个交通工具,就认为它会飞上天。

  • 41:57 可以期待的迅速进步来自:模型的知识覆盖面、响应速度

未来 6-12 个月,有哪些高度确定性的事会发生?

  • 43:04 多模态 + 机械控制、传感器

  • 44:25 端侧小模型

  • 44:55 其实 AI 已经无处不在了

  • 46:56 AI 编译器的进步将打破 Nvida 的垄断

  • 47:52 AI 与前沿科学领域的结合

Part 4 防守吧!硅谷巨头们

巨头们掌握着行业壁垒的最高形态:生态;因此它们的 AI 策略都是防守。

49:24 Meta:整个 AI 行业都要感谢 Meta

54:55 Microsoft:涨到今天 3 万亿是他应得的结果

  • 56:29 OpenAI 已被微软圈定到了一个模型研究者的位置上

  • 58:41 预测 GPT 5

59:13 Apple:永远体验为先,值得欣赏

01:01:31 Amazon:给出了非常好的三层 AI 体系

  • 01:03:39 对 Dify 和 Langchain 的建议:非常卓越的产品,但如果是我,我会建议它们尽早卖给某一个巨头。

01:05:03 Tesla:FSD 方向正确,但道路漫长;不值得 price in Robotaxi

Part 5

01:10:46 国内大厂们的 AI 战略都挺好,不是客套话

01:12:16 推荐 AI 资讯渠道

01:20:19 如果可以穿越到未来,最想偷看的答案是什么?

01:22:30 未来 6-12 个月,最值得关心的问题有哪些?

Part 6 yyds!杨立昆教授

这个星球上,对 AI 的理解最深刻、最正确的人。

01:13:45 在 AI 行业中,做得好的和做得顶尖的人,他们的差别在哪里?

01:14:40 这个星球上,对 AI 的理解最深刻、最正确的人是谁?

01:14:54 杨立昆广受争议的观点,为何是正确的?

01:17:59 科普一下什么是「世界模型」?

——

🚦 欢迎订阅「十字路口」,我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱,新变化,新的可能性。

👦🏻  主播 Koji:新世相/躺岛的联合创始人,也是一个正在积极行动投身 AI 的人,Koji 的即刻一份 Koji 的自我介绍

👧🏻 主播 Ronghui:供职于科技 VC,前《第一财经周刊》驻硅谷记者,Ronghui 的即刻

——

欢迎加入十字路口的会员群:

☀️ 每天放送《AI 新鲜事小报》

👫🏻 鼓励大家谈恋爱/交朋友/寻找未来的同路人

🦀 添加小助理微信入群:Rwkfbcianvd

——

💡 灵感海报

💡

💡

💡

——

🎄 本播客由「新世相声音森林播客计划」支持。

展开Show Notes
自牧生
自牧生
2024.7.15
说个题外话,李老师无论从语音、语调、乃至停顿的节奏都和 Robin 好像啊,这是内部对齐的结果吗?😂
cctaro:🫡
Koji
:
lmao
4条回复
cdq_cklR
cdq_cklR
2024.7.16
百度也好意思和谷歌谈用户体验?
一只老男人:百度云盘的用户体验就比google好,就某些具体产品的细节而言google也并不完美
风中摇荡:大厂里可能也就苹果能批评谷歌用户体验不行吧,别的自己都顾不来。不是不能批评,但总听起来怪怪的
3条回复
难怪百度不行,架构师有点自以为是啊
嘉宾说的我真是太认可了,作为一个8年NLP老兵,23年也在百度干了半年大模型,不得不说百度内部对大模型的认知非常清晰和专业,当然也有问题,就是产品能力感觉有点欠缺~~~遗憾离开。但是嘉宾超棒。
嘉宾对LLM和压缩的理解深入简出,也深刻的洞察了当前LLM本质上是搜索的另一种变体,写prompt其实就是通过prompt中的token来借助注意力机制牵引出来LLM中压缩的内容,这个观点我超级认同。这其实是降低了搜索的门槛,让搜索更加的定制化了,但是并不代表NLP推理能力增强了很多。
港大的马毅老师之前说:现在的一个混淆是把知识当成智能,它们相关,但不同。知识是存量,智能是增量。这可能是很多人将大模型看作无所不能的误区。
嘉宾举的旅行规划的例子也超级棒,一看就是落地过很多项目的架构大佬,很多时候做大模型的人只考虑能不能输出规划,但是从来不去代入用户的真实场景,真的是shit。我个人去年也落地过十几个大模型项目,大模型能输出,并不代表真实用户需要这样的输出,做技术做产品不以用户为上帝不考虑用户的价值,做个屁!
期待嘉宾更多的演讲,行业老兵的对话真是太有价值了,点赞!
晓风暮笛:对补充个题外话,个人感觉目前大模型最适合落地的场景是情感领域。 工业化领域、自动化领域,不只是需要生成式AI,更需要的是决策式AI,很多场景要的不是泛化性而是准确率99.99%并且错误可溯源,比如逻辑回归方式。生成式AI能够提供建议但是难以进行决策。 而情感场景本身就是非标的、主观的,而LLM进行情感的模拟可行性真的很高。同时个人有个观点,情感这种人类社会诞生的东西,是只存在于人类的文本中的,是可以让LLM学习完全的,;而科技数学等,是宇宙的基本公式,人类目前尚且没有研究清楚,宇宙中不知道还蕴含多少不知道的,凭当前半瓶子水,真的能构建出世界模型么……
风中摇荡:这技术在内行眼里是马拉火车,但在用户看起来用起能解决问题就足够了。不可能都等着蒸汽火车出来再开工吧。 (至少llm里还没有开始塞竞价)
5条回复
07:04 哇这个对大模型原理的解释好通俗易懂,真是大师啊
Hope_icpg
Hope_icpg
2024.7.15
所以百度为了用户体验做了广告?
25:58 “人类的目标经常是在翻阅资料的过程中才被明确下来”金句!
嘉宾解释得特别好听感也很好,但每次想到是百度的员工在讲产品体验尤其吐槽谷歌过于工程师文化就有点🙉🙉 也因此对商业化部分的观点有所怀疑
嘉宾技术背景如此扎实,却得出这样的观点。很可能因为过于拔高人类智慧了。人类认为的智慧也不比几层神经网络高明多少。普通人已经很难应对这种水平的AI。如果再来那种终极AGI,我们还要怎样应对。
真诚的傲慢 跟你创始的两个品牌还真有异曲同工之妙
marx发财财:什么品牌
评论区认为百度员工不够格去评价其他产品的那些人,你们何尝不是在评论呀(´∀`)
睿杰:这么个看法,大家都不是职业球员,但是看转播多了,中假中抄跟意甲英超水平差异看的清清楚楚。
☁️煲:当然够格啦,我觉得发射火箭就该烧煤,还得是蜂窝煤🌚
20:23 架构师对技术的解释确实通俗易懂,不过还是忽略了产品和技术的差异,技术是点,越底层越简洁,产品是面,越往上越复杂,多数人对技术确实是没有认知的,因此我相信多数人都是在从产品层面理解AI,这也确实会肤浅,但架构师一直在说的是其实单个技术本身的局限性,而用户能感受的是产品,兴奋点也来源于此。搜索技术也好大模型也罢,在多数外行眼里就是产品,是多种技术的融合,架构师技术很强,我作为技术人很认同这位架构师的观点,但我同时也是产品人,又觉得架构师的观点存在较大局限性。小的不才,只是探讨。
人类是怎么知道首都是北京的?也不是一直以来的训练吗?小时候家长的纠正,考试时错误的答案,一步步的把人类的认知确定了。怎么就觉得AI是一种解方程呢?人类做出判断的时候是不是也在解方程呢?
AAA_stmw:其实自然界是没有方程存在的。人类发明了方程式,是为了研究理解事物的本质关系。 人脑的思维模式也可以抽象概括为一种复杂的方程式。Y=kX+b。其中x是输入,y是输出。面对同一件事(输入x),不同的人会有不同的反应表现(输出y)。 这其中的k和b的不同,源自每个人的经历不同,导致思维模式不同,对同一件事物作出的反应也不同。
磊子W
磊子W
2024.7.16
20:47 人回答中国的首都是“北京”也不是确定的,本质上也是翻书
磊子W:人类的学习真没有什么特别,本质上就是尝试、反馈、改变的循环,和人工智能没有本质区别,只不过生物进化了几十亿年,人类知识累积了几千年而已。但人工智能明显可以进化的更快,会发生什么未尝可知。
HD114778d:作为一个小镇背题家 我觉得gpt的学习模式和我背书的模式其实是一样的 可能我们这类人确实会更容易被ai淘汰吧
4条回复
睿杰
睿杰
2024.7.16
做技术是一方面,如何用技术做生意是另一方面。不要总找出高大上的辞藻来当剥削底层民众的借口和幌子,最好。
睿杰:更别说,其实最关键的东西还是被别人控制着。
磊子W
磊子W
2024.7.16
08:20 但概率很可能就是“生命”的底层逻辑,最复杂的形态来源于最简单的原理,一定比例的变异加上自然淘汰发展出了现在的生物界,包括人类
风中摇荡:确实。吐槽概率时候还是多想想为什么这东西叫神经网络。因为脑类结构最基本工作原理是这样的(当然更高级的结构也有,实现还在研究中)。用代码模拟电和化学信号行为。最低级的智慧就是个概率,何况这还是个直接拷贝人脑概率的东西。那能用起来不像人吗。
苏舟kk
苏舟kk
2024.7.16
58:08“to B软件的最终归宿是与excel完成链接”——太真实,太期待了
Steve0914
Steve0914
2024.7.17
嘉宾的观点非常老派,和一线真实的情况大概差了十八个月。 很像听了一年的播客,上来讲一些自己听到的信息。 这人做过机器学习项目吗,真的做过产品吗? 讲 RAG 的那段,每个分句和上个分句都没关系。
Koji
:
请问您是不认可嘉宾具体对 RAG 的哪个观点呢?欢迎展开回复与探讨
Steve0914:嘉宾太水。 有用的信息“现在最便宜好用的预训练模型是 deepseek v2” 话题:为啥这么便宜?deepseek,在 SFT,RLHF,以及 Data 上分别做多了什么。自己的评测集怎么构建的,那些维度看起来暂时领先。 这是表征他理解对了自己所说的生成式 AI = LLM 这个不咋严谨的观点背后,他真的搞机器学习。 如果觉得 AI Agent 不行,能讲讲百度现在自己做的智能体平台的 learning 吗? 高活的 agent 和大众认知的那个几个有异同吗? 这是他真的做了一些和机器学习有关的产品的佐证。 如果要挂技术专家这个标签,阐述内容不应该和 B 站科普视频或者公众号水平的新闻差不多。如果他是一级市场新人还勉强可以理解。
蔡炳贞
蔡炳贞
2024.7.15
42:01 没有scaling law信仰的嘉宾😂
雪糕_uf82
雪糕_uf82
2024.7.15
非常感谢这期的播客,它使我重塑了对 AI 的认知,成功对 AI 去祛魅,也更加清晰了使用的方向[合十][合十][合十]