96. 和郎咸朋聊,自动驾驶10年演进史、关键技术细节和特斯拉张小珺Jùn|商业访谈录

96. 和郎咸朋聊,自动驾驶10年演进史、关键技术细节和特斯拉

120分钟 ·
播放数26078
·
评论数115

今天发布的是和理想汽车自动驾驶研发副总裁郎咸朋的聊天。本次访谈发生在2024年12月,和我们之前发布的《对李想的3小时访谈》在同一时期进行。

郎咸朋13-18年在百度做自动驾驶,18年加入理想,过去10年都在中国的自动驾驶领域。他以亲历者的视角聊了自动驾驶10年演进史,详解了其中的关键节点和技术细节。这次谈话更像是对自动驾驶的一次技术科普。我觉得我们聊的还不错,所以决定分享给大家。

(因为访谈发生在去年,如果大家听到今年,指的是24年;如果听到去年,指的是23年。)

期待2025,我们和AI共同进步!

我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)

01:32 10年前的自动驾驶当成有轨电车研发,现在看起来很可笑

04:30 2018年,从高精地图+激光雷达到BEV+Transformer,Tesla是标杆

12:07 当年激光雷达50-60万/台,早期百度/Cruise一辆车7-8个激光雷达,传感器成本远高于这辆车(当时我们在百度,一辆车500万人民币)

13:09 为什么特斯拉要用视觉解决问题?为什么自己造芯片?

15:16 特斯拉一辆车的传感器+芯片成本?一辆车有几个芯片?

20:06 特斯拉总在用“升维”方式解决问题

25:06 激光雷达和camera解决方案区别

28:46 端到端、“我们以前做自动驾驶都做错了”

41:14 我的工作经历:13-18年在百度,18年开始在理想

50:50 “L3不是L2的延长,而是L4的先导”

01:15:15 端到端是最典型的强化学习,端到端+VLM+世界模型是RL架构

01:26:40 2024年3月李想对智驾团队发火

01:32:23 “卫城”项目:“他就觉得你一定要跪下来求他”“老子就算死也要站着死”

01:35:51 想过职业生涯栽在这儿吗?李想脾气不太好?

【从蒸汽机到无人驾驶】系列

对李想的3小时访谈(播客版):宅男、AI、家庭、游戏和天梯

和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊

和楼天城聊聊Robotaxi和ACRush:“L2做得越厉害,离L4越远”

从蒸汽机到无人驾驶3|和孟醒聊特斯拉FSD进化史

从蒸汽机到无人驾驶4|Waymo和它的对手们:我暗中考察了四个月

【更多信息】

联络我们:微博@张小珺-Benita,小红书@张小珺

更多信息欢迎关注公众号:张小珺

展开Show Notes
HD10270029
HD10270029
2025.3.16
郎咸朋和郎咸平的关系是?
Ssss艾斯:咸字辈,我们郎这个姓氏的辈分。他爸肯定叫郎丰*
不爱吃面爱吃卤煮:哈哈哈哈
9条回复
三天_cHpz
三天_cHpz
2025.3.18
这人不像技术人员,像办公室主任
zzz_x2LO:人家现在早都不是技术人员了,是技术团队管理人员,还是高级管理人员,当然,我觉得他很幸运选择了理想并能待到现在,股票期权估计都已经财富自由了
章富贵:智能驾驶副总裁……还办公室主任
GOOD棒
GOOD棒
2025.3.17
🚞一点记录(部分)📒:
✨在自动驾驶领域,为什么许多公司仍然坚持使用激光雷达,并且认为激光雷达比纯视觉好?
激光雷达虽然在点上可以瞬间获取信息,但即便如此,它并不是完美的。在同样的场景下,激光雷达可能只扫描到部分区域,存在空洞,而图像则几乎能全面覆盖并提供更丰富的多维度信息。尽管视觉信息量大,但激光雷达因其精准和实时获取环境信息的能力,在自动驾驶中扮演着重要角色。目前,端到端做得较好的公司并不多,特斯拉(Tesla)在BEV(全自动驾驶)方面也意识到单纯依赖激光雷达或视觉无法达到人类驾驶水平,需要综合多种传感器信息。

✨是否有人尝试通过定义不同场景的方式来解决自动驾驶的问题,存在哪些挑战?
一些创业公司曾尝试通过详细定义多种场景(如天气、车流量、光照等)来开发自动驾驶系统,但这种做法面临两大挑战:
一是场景划分过于复杂,穷举无法涵盖所有可能情况;
二是场景间存在相互影响,修改某一场景的定义可能会影响到其他场景的正确运作。
此外,还存在无法预知的突发情况(如半路窜出的马车、路面塌陷等),这些都给自动驾驶系统的适应性和鲁棒性带来了巨大挑战。

✨自动驾驶领域的发展史中,三个关键点是什么?
自动驾驶领域的发展史中有三个关键点:
第一,特斯拉等公司利用人工智能架构,如transformer模型和大模型技术,实现端到端的自动驾驶;
第二,对技术前沿的敏锐把握;
第三,对产品本质的深刻理解,即理解能量与质量转换的过程,并尝试运用先进智能技术进行革新。
第四,
✨如何借鉴特斯拉的方式进行自动驾驶的研发?
借鉴特斯拉的方式,首先深入理解自动驾驶产品的问题本质和机会点,然后结合人工智能技术的迭代,尝试用更像人的方式解决问题。
采用统一的系统二模型与系统一行为智能相互配合,让系统能够快速做出接近人类行为的决策,并通过系统二处理没见过或需要思考的场景,再结合系统一执行决策和规划,从而提升自动驾驶的整体表现。

✨大模型如何改变我们对知识表达和学习的认知?
大模型通过编码机制将不同来源、不同类型的知识转化为统一的空间中特征,使得原本难以被计算机学习理解的各种信息能够被量化和对齐,进而通过训练方式进行学习。这就像找到了一种新的方式,如同爱因斯坦提出的质量-能量方程,让不同形式的知识和信息得以转换和利用。

✨大模型对于自动驾驶技术进步的意义是什么?
大模型的出现解决了之前感知与决策规划分离、不同传感器数据难以融合的问题,它提供了一种新的方式将所有知识整合在一起进行训练,使得信息可以在模型中无损传输,提高了学习效率和智能化程度。同时,大模型也推动了端到端解决方案的发展,让系统能够直接从原始传感器数据中学习并做出决策,而无需经过复杂的中间处理步骤。

✨如何评估自动驾驶系统的当前能力以及能力提升?
传统的功能测试方法可能无法准确衡量自动驾驶系统的当前能力和真实表现。因此,采用了参考人类能力测试的方式,构建了一套包含多个维度(如安全、舒适、导航合规等)的考试系统来评估模型或功能的最新版本。通过不断考试迭代,确保每次测试成绩不低于前一次,实现对系统能力的动态跟踪和提升。

✨在人工智能领域,如果一个企业不针对特定需求优化模型,而是试图满足所有人的需求,这样的企业能在该领域占据头部位置吗?基座模型在企业中的核心作用是什么?
如果一个企业只是追求通用性,不针对特定用户需求优化模型,那么它很难在人工智能领域获得头部地位,因为真正的竞争优势会掌握在那些拥有强大基座模型能力的企业手中。基座模型代表了企业的核心能力,它反映了企业对世界的理解和对知识的掌握程度。通过这个基座模型,企业可以构建自动驾驶、理想同学等各种智能应用,而不是单独训练专用模型。

🏎️字数受限,完整的在🔗中🌟
🈶️整理笔记、思维导图和逐字稿
需要可保存学习(复制到手机浏览器打开保存即可)
🔗:https://pan.quark.cn/s/270d7342ce18
GOOD棒:https://pan.quark.cn/s/270d7342ce18
康远:无论是激光雷达还是视觉,都不能过度依赖,亲戚在高速上被L家车追尾了,L家的车辆还采用了激光雷达,还是没有避免追尾
3条回复
正好周末很火的话题是youtuber mark rober用一块伪装成马路的幕布欺骗了Tesla自动驾驶
Yoyon:02:14 那你怕不是没看后续吧,视频造假实锤
西瓜晒太阳:所以李想说前面的那个激光雷达不能省。。
5条回复
Kattwy
Kattwy
2025.3.17
46:49 现在智能驾驶行业的创始人和参与者几乎当年都在百度工作过,太可惜了,好牌稀烂
吃橙子的企鹅:印证了百度是个伟大的公司🤣🤣
KikPrig:把伟去掉差不多
3条回复
赞同嘉宾。理想几年前从OKR文化改为全面奉行华为文化,并大量引进前华为人,鸠占鹊巢,早就一点点走向癫狂与覆灭了。资深老华为人都懂一句话,谁学华为,谁死,华为学谁,谁死。那是独有的特定历史阶段下的企业文化,有前提,有under table 的决定性原因的,不是别家可以学的。胡雪岩总有倒的一天,理想也没资本做胡雪岩,小珺刚采访小宏那期,小宏刚讲你的优点和缺点是绑在一起的,李想过去几次成功的优点,就是他现在致命的缺点。
晨萱-语迟者说:理想就像哪吒 2 里的申公豹它爸,认同并追寻一种价值观,然后被这种价值观干掉了,MEGA 事件应该是让他们知道了什么是正宗的狼性文化
Yang_0bpu:OKR是管理方法,跟企业文化不是一个概念
3条回复
evan-zhang
evan-zhang
2025.3.17
我好奇个点,之前自驾都是供应商做的,理论上自研没啥积累。端到端100个人搞了半年就搞出来了,我有点不太相信(没judge的意思,就是有点吃惊)
yegucheng:所以说理想的宣传不足,理想做智驾不比华为晚,现在智驾也不比华为差,不知道之前自驾都是供应商做的这种话是从哪儿看到的
HD651708i:供应商那段说的应该是mobileye时代的故事
15条回复
HD651708i
HD651708i
2025.3.18
从郎博的访谈里能体会到一点:不同于专攻某类自动驾驶技术研发的第三方智驾公司,在主机厂内部做探索性业务,既是技术研发又需要战略管理协同,因为制造业企业有太多要花钱的地方(整车制造、销售网络、充设施),需要技术leader兼顾很多,如何做好团队稳定性,落后不气馁,对内更多争取资源,交付结果而不是过程,敢打硬仗去赢得信任,这些都做到,就远不是一个技术天才能保证实现的了。而这里面提到的很多,恰恰是其他企业没有做好的环节。所以其在最后反复提到,感慨自己能力的提升是多维度的,逐步改变了单纯科研技术人员的视角,以企业管理者的思维去带领团队披荆斩棘,也就是所谓的企业战略思维。
哄哄_R6zY:有战略思维和经营意识的技术管理者。
HD999608j
HD999608j
2025.3.17
讲的好好 没了解过的人都能听懂
beta汤
beta汤
2025.3.17
1:34:24 猜测这个供应商是地平线?
HD651708i:mobileye吧
AngusLong:Mobileye
3条回复
HD651708i
HD651708i
2025.3.17
能有人给这么抽丝剥茧的讲解真好,主持人提问提的也很好,问的恰恰是听众之所想
乘风而歌:主持人确实很优秀,听了好多期,提问很精准
黎蔓蔓
黎蔓蔓
2025.3.20
对技术的讨论太浅了,说来说去都很一些很high level的比喻。听了一半开了倍速也听不下去了,都是在重复说一些已知的很浅显的概念。

想听更技术的还是推荐去听下楼教主的采访。先不说人家是不是天才,他的采访至少在做技术的人的眼里还是更有深度的。
如风Joe
如风Joe
2025.3.18
感觉朗博很实在
完美符合了我对百度和理想两个ads吊车尾公司的认知
HD911273q:理想吊车尾,那你是纯喵呜了。
0x2077
0x2077
2025.3.17
35:15 场景无法定义 场景只能穷举所有可能
0x2077:36:16 从做软件去实现功能的思路 转换为: 智能体自我迭代 不是做软件 而是做模型 关注模型能力 适配不同场景 达到自我进化
0x2077:40:35 模型算法全开源 壁垒是垂直领域的隐私数据 商业公司将角逐基于模型微调和外挂模型(记忆力和角色回忆)形成的数字agent市场
3条回复
予你ya
予你ya
2025.3.17
💛人工智能的浪潮之下,自动驾驶的发展只会越来越快
👀课代表就位
✨逐字稿和思维导图已经帮大家整理好了,方便大家随时查看(麻烦大家顶我上去让更多人看到)
❤️有需要的听友自行取用(复制到手机浏览器打开保存即可)
🔗:https://pan.quark.cn/s/0997e33f9f9a
予你ya:https://pan.quark.cn/s/0997e33f9f9a
孤山春秋
孤山春秋
2025.3.18
模型和方式比工作量重要,尤其是可以不断迭代的模型。条件概率。
孤山春秋:降维
GOOD棒
GOOD棒
2025.3.17
🚗都是最近热门话题 喜欢❗️
🈶️和我一样喜欢用 📝逐字稿 边听边看或者拿来做一下📒记录的小伙伴们可以自取👍
🔗: https://pan.baidu.com/s/1lXtzd8E_OpyhMl1oLIaSgg?pwd=8fkz
Kattwy
Kattwy
2025.3.17
45:49 这段出现的人名太神奇啦,有种人类群星闪耀时的感觉
Kattwy
Kattwy
2025.3.17
20:05 尊重对手,学习对手厉害和强大的能力用来补充自己,不贬低其他人,学习和进步的速度极快,每次听理想高管出来分享,都能感觉到一种空杯和自信,神奇