E156|自动驾驶领域的GPT时刻来了?聊聊特斯拉V12、FSD入华与RoboTaxi

E156|自动驾驶领域的GPT时刻来了?聊聊特斯拉V12、FSD入华与RoboTaxi

91分钟 ·
播放数33137
·
评论数140

本期是关于自动驾驶的观点对决!之前我们在采访侯晓迪时,他提出的观点是:特斯拉始终在做辅助驾驶而非无人驾驶,马斯克是行业的搅局者。随后,在评论区我们也收获了不同的观点:特斯拉最近推出了V12版本的FSD,在驾驶体验上有很大提升,甚至被称作自动驾驶的“GPT时刻”。所以我们也在思考这个神秘的v12版本会不会就此改变自动驾驶行业?这一期我们来听听另一边的声音。

当然,我们也会深入探讨FSD入华的技术难题,以及8月8日推出的Robotaxi的靠谱性分析。如果你是自动驾驶或者AI的从业者,那这期节目可不要错过。如果你也有不同观点,欢迎留言探讨!

主播
泓君Jane,硅谷101创始人,播客主理人
嘉宾
于振华,前特斯拉AI工程师(Twitter:@TSLA99T)
王辰晟,前特斯拉采购总监
大卫,《大小马聊科技》主播
刘冰雁,Kargo软件负责人

你将听到
【关于v12的技术讨论】
05:66 FSD的v12自动驾驶全面碾压v11前的版本
09:10 v12的用户体验:真挺不错!高速表现好
17:18 端到端不是新的概念,但是特斯拉验证了
21:26 自然界有很多生物的大脑端到端模型:蜻蜓、章鱼
22:54 如果激光雷达足够便宜,是否必要做纯视觉?
25:18 对特斯拉纯视觉方案的质疑:模型的不可解释性、对传感器更敏感、视觉不可达盲区
29:21 90%公司可能不适合做端到端
36:02 特斯拉的门槛优势:算法领先、架构保密、自制芯片硬件
40:30 端到端发生在特斯拉是必然?自下而上的尝试、马斯克的决策权、数据的积累

【关于特斯拉和马斯克】
43:56 Autopilot团队前领导Andrej Karpathy:不断探索ai边界
46:44 马斯克的思考逻辑:深度参与技术管理、相信在做的事
54:49 回应侯晓迪对特斯拉自动驾驶的质疑
59:47 特斯拉v12的行业定位:依然是L3,L4不如Waymo
60:37 和中国本土L4竞争:技术路径和商业模式都不一样

【关于FSD入华】
01:08:34 中国的路况复杂度是美国的十倍?不一定是坏事
01:12:51 FSD在中国能一炮走红吗?地图是关键
01:16:08 特斯拉入华:车友期待、数据难采集、抓住政策窗口
01:20:00 Autopilot和FSD的区别

【关于8月8日的robotaxi】
01:21:48 Robotaxi车型的猜想:有没有方向盘?后视镜?
01:28:03 对特斯拉robotaxi的质疑:在城市中的无人驾驶能力、robotaxi是重运营的活儿
01:29:40 robotaxi的商业化:马斯克畅想的airbnb运营模式和成本问题、打造无人出租车网络

硅谷101线下见面会
硅谷101即将于6月28日在硅谷举办一场关于GPU Cloud与AI的线下活动,进行从GPU到GPU云的最新趋势分享,也聊聊如何低成本加速AI训练以及AI创业公司现在面临的机遇与挑战。

我们邀请到了Leonis Capital合伙人、前OpenAI研究员Jenny Xiao;Fusion Fund创始合伙人张璐;FP Solutions VC联合创始人、前SpaceX核心成员Lewis Hong,来分享他们看到的AI创业领域的最新趋势,也邀请到了North Beta Labs的创始人Jonathan Zhu探讨创业公司如何打破算力瓶颈,快速向前。

此活动是超小规模邀请制,只对AI从业者和创业者开放,参与者还将有机会获取GPU Cloud Credits以及免费算力支持。我们期待和你在硅谷线下见。报名页面:lu.ma

相关单集
E150|与侯晓迪聊聊自动驾驶和搅局的马斯克
S2E44|无人车特辑|特斯拉自动驾驶到底怎么样?

名词解释
智猪博弈:博弈论中的一个经典模型,描述了一只大猪和一只小猪在共享食物槽时的行为。槽的一端有按钮,按下按钮后食物会流到槽的另一端。大猪按按钮的成本较小,小猪按按钮的成本较大。小猪的最佳策略是等待大猪按按钮,从而节省成本。常用于解释企业在市场中的模仿和学习行为。

Cruise Origin:Cruise和通用汽车合作开发的全电动自动驾驶汽车,专为共享出行服务设计。

后期
AMei
BGM
Uncovered-Joseph William Morgan
Sunshine Rain - Brendon Moeller
Home To You-The Neighborly

在这里找到我们
公众号:硅谷101
收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客
海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music
联系我们:podcast@sv101.net

本期节目仅代表嘉宾个人观点

Special Guests: 于振华, 刘冰雁, 大卫, and 王辰晟.

展开Show Notes
Diiiiiiiii
Diiiiiiiii
2024.6.24
一些 takeaways:

1. 关于端到端的价值:端到端最重要的价值是通过去掉人工定义的接口,让自动驾驶更加 scalable 。华为自动驾驶有六千个工程师,主要用来写各种规则,因为 rule-based 环境太复杂,总有新的 task 出现。真正的端到端的系统中,不需要人为定义这些 task。这也是为什么现在 FSD v12 可以做到每周更新。 (一个比较有意思的问题是,如果真的是端到端,那么车机上显式的视觉效果图是哪里来的?它的显示和真正模型的感知、决策是否 align?)

这种可泛化的 Scaling Law 大幅度降低了 Tesla 的成本。对比之下,Waymo 以及国内的竞品的成本要高得多,每开一个新城都要用自己的车队去铺,100 辆车*100 万人民币,再加上 operation cost,就是一个城市一个亿人民币,从商业模式来看不划算。

2. 关于算法的先进性:Tesla 的端到端在算法层面还是有独家秘籍的。相对于 OpenAI 的基本上透明化的架构,Tesla FSD 的算法和架构可能 70%-80% 都没有公开(之前每年的 AI Day 说得太多,现在索性停办了),算法上有较大的领先性。端到端和之前 rule - base 差异很大,上了端到端之后,团队变动也很大,Tesla 之前负责 planning control 的负责人就离职了。之前 Tesla 一直不愿意向中国团队开放代码阅读权限,上了端到端之后,已经不需要国内工程师了,国内只需要标注即可。

3. 关于软硬结合。Tesla 的另一个牛逼之处在于软硬结合,用 100TPS 低算力的自研芯片和硬件配套就可以完成其他公司用 1000TPS 的芯片也完成不了的任务。Tesla FSD v12 现在能够在 2018 年的HW3.0 硬件上丝滑地跑起来。硬件的低成本也给Tesla 带来了很大的渗透率和数据优势,相对于其他车企的智能配件都是选装的,Tesla 的智能配件是全部预装好的,也就是说每一辆车都可以用来收集数据。

4. 马斯克的价值。在 Tesla ,端到端的思想并不是 Musk 提出来的,而是自下而上提出来的。但马斯克的价值在于,他直接管理智能驾驶团队,深入了解一线技术,因此敢拍板做决策,并且亲自承担责任。到目前为止,他没有在技术 vision 层面上犯过大的错误,但在具体时间线的估计上常常比较激进,一方面是性格上过于乐观,另一方面也是团队管理的需要,同时给内部人才画饼和压力。

5. 纯视觉是唯一的路径吗?Tesla 如果当年保留了激光雷达,那么可能会造成工程师过于依赖激光雷达。只有极端地砍掉激光雷达,才能逼着团队在纯视觉的路线上做技术攻关。如果当年不这么做,那么 Tesla 的地位一定不如现在。之后会不会加激光雷达?没有给出明确答案。

6. 如何从 L2 到 L4?最重要的是大模型本身的演进,这也是 Tesla 专注的方向。一方面是积累更多数据来解决 corner case。过去几个月是FSD 第一次的大范围部署,包括北美全境, 也包括夏威夷和阿拉斯加,180 多万辆的车具备这样的功能,100 万辆下载了,尝试了。除此之外,一些其他路径也会有帮助,比如更加细致的导航地图,比如针对具体区域路径的微调,比如运营。后面这几个 Tesla 还没有开始做。

7. 关于 FSD 入华:中国的路况复杂度是美国的 10 倍,但好处是统一市场准入,并且在中国这种hard级别的路况搞定之后,全球其他地方都能搞定。之前没做中国,最重要的是因为搞不定数据合规问题,现在通过数据脱敏搞定了。今年政策上有很大利好,国内从总理级别开始明确支持 FSD 入华,接下来只需要把欠账补一下,把 intra 数据采集、标注、finetune 这一套从零到一走一遍,以 Tom Zhu 的执行力应该没啥问题。

8. 关于 RoboTaxi 揭幕,大概率是硬件的 unveil,把车子展示一下,从亮相到量产可能还需要十几到几十个月。由于法规限制和供应链复用等考虑,车型的设计不会太极端。

总之,从各位嘉宾的反馈来看,端到端路线能走多远、能否商业化落地,都还没有形成共识。我个人的感觉是,方向是清晰的,但道路是曲折的。
XiuDu:Hello!我是《硅谷101》的播客监制杜秀,我们想把你这条评论分享到硅谷101的公众号&小红书上可以吗😊
泓君Jane
:
超强课代表👏
4条回复
大卫Lol
大卫Lol
2024.6.21
很高兴做客硅谷101。这一集和几位嘉宾聊得酣畅淋漓。🥳🥳🥳
Mike-Wu:召唤大卫成功🥳🥳🥳
泓君Jane
:
欢迎多来🥳
11条回复
HD745921d
HD745921d
2024.6.21
补充一个信息:老于说端到端架构实现V12在Tesla内部是自下而上的。主持人问到说具体是谁?根据《马斯克传》,这个人应该是达瓦尔 史洛夫,90后印度工程师。老马本来要把他带去推特救火,他拒绝离开,并跟老马介绍了手头正在开展的一项神经网络规划项目,也就是后来的端到端神经网络架构。老马大受震撼并全力支持他。
泓君Jane
:
听友们太强大了👍
lsc2019
lsc2019
2024.6.21
感觉和大小马的节目比,大卫有点拘谨hhh
HD10270029:去别人家跟在自己家能一样吗
阿四AFour:也有可能嘉宾太牛
5条回复
so1so
so1so
2024.6.21
这期节目非常棒,嘉宾专业有学识有见地有洞察,希望就 FSD robotaxi 自动驾驶再多聊几期,节目太短意犹未尽。国内大部分关于特斯拉,自动驾驶的舆论都是营销属性的资讯,观点武断粗糙主观充满目的性,难有专业理性科普的探讨。
CodleY:国内大众能接触到的社交媒体也就只有播客能看得了 别的平台都是情绪主导的交流
泓君Jane
:
感谢认可,我聊完也学到很多
3条回复
momo_Q5xg
momo_Q5xg
2024.6.21
24:28 这里这位老师明显没听明白上一位老师在讲什么啊。激光雷达应该考虑的是和算力比价格,没有激光雷达要加多少算力才能补足。怎么可能和摄像头比价格呢
viovio:赞同,固态激光雷达在国内的价格已经能千元级别,并且纯视觉训练所需的数据量比带激光雷达的多好多倍,是巨型的隐形成本
sanbai_:我没搞懂他这个逻辑,怎么加了激光雷达还限制神经网络效果上限了。
11条回复
咫尺流年
咫尺流年
2024.6.21
大小马&硅谷梦幻联动!
SmartGalilei
SmartGalilei
2024.6.27
对于纯视觉的坚持纯粹就是为了省钱。没有任何摄像头的能力超过人眼,所以纯视觉方案的上限就无法超过人。但事实上,即使在现实生活中,也有靠人眼避免不了的事故,我就曾经在白茫茫的北海道,睁着眼撞到雪墙,我不知道纯靠摄像头如何避免这个问题。机器的作用本来就是扩展人的能力边界,我们明明有扩展视力边界的工具,却自废武功。注定不会是最终解决方案。
18:19 提问向不懂技术的人解释端到端是什么?是否答非所问,小白没听懂
拾三:确实,没有直接解释。端到端就是只处理一次数据,就出结果,直达;非端到端就是要处理多次才出结果,中转。
读书学习社:谢谢
HD504183z
HD504183z
2024.7.10
希望下次找做自动驾驶的内行嘉宾,感觉嘉宾略懂但并不真懂。
HD214770z:可以认识一下吗,谢谢啦
HD190146x
HD190146x
2024.6.23
34:07 不对哦。现在的监管并不是基于模型可解释性的,更和伦理没关系。现在所有的汽车安全法规都是基于功能安全和预期功能安全,核心还是你的功能,可能的失效场景,发生概率和严重程度。在其它比如软件层面也有类似aspice这类流程合规的规定要求。嘉宾们虽然都是技术专家,但在汽车监管和合规都是外行。
Yan如是说:34:33 嘉宾说的没错。美国是一个州立法国家,不同州、不同市的交规都不一样,曾经有个Iowa law专门提高自行车的路权,那去到别的地方、国家就不是这个规则了;哪怕是国内,大城市与小城市的行车博弈规则也区别很大。 基于不同交规,如果是同一套驾驶习惯,是会出大问题的。
这里能听到大卫来串台了 惊喜
Pion
Pion
2024.6.22
硅谷101与大小马是我平时听的最多的节目,非常高质量的播客。感谢节目组每次高质量的输出,👍!
白七七
白七七
2024.6.21
作为一个文科生,很喜欢听每期嘉宾聊技术背后的思考、理念、哲学,包括社会思潮,反过来也对理解技术本身很有帮助!特别期待之后对特斯拉自动驾驶演进史的分享❤️
HedgeSage
HedgeSage
2024.6.21
建议先在印度或者孟加拉进行FSD的深度测试,
一旦测试通过,全球其他国家就不用测了。
撒hu椒面
撒hu椒面
2024.6.21
硅谷101太棒了!请到了老余来做这一期分享。(虽然我听老余吹特斯拉已经听腻了,哈哈)
辛钦
辛钦
2024.6.25
17:38 大哥你也没解释啥叫端到端啊…怎么还没回答问题就讲到别的了
sanbai_
sanbai_
2024.6.21
1:19:18 端到端真的是 AI 应用领域最大的黑话,每次听到都会嘀咕,你这个端到端和我想的是一个端吗?另一个就是 agentic,真的听吐了。
忠心耿耿汉弗莱:当年爱因斯坦听到量子物理也听吐了😂
-_H5Il
-_H5Il
2024.7.01
1:17:01 做planning control的人表示感到前路迷茫
熊yy:哈哈哈哈别迷茫 去年做高精地图的人也慌 实际上任何一种说法说xxx马上就把某一个人群取代 这都是具有诱导性且不对的
赵小康
赵小康
2024.6.25
22:3022:24 泓君,是你小子把大卫引到这里来的?(朱时茂脸)
赵小康:听Ray的money XYZ的时候就开始喜欢振华啦,好棒!