孟醒在节目中回顾了无人驾驶技术的漫长历史,纠正了行业中常见的认知偏差——许多人以为无人驾驶只有十几年历史,实际上它已经跨越了近一百年。
第一辆"无人驾驶车"出现,实质上更接近遥控车——汽车诞生仅20多年后,就有人尝试让车自动行驶。
通用汽车展示了基于地下线圈磁感应的自动行驶方案——车辆通过收集地面信号来沿轨迹前进。
真正的AI概念诞生,车辆开始具备感知系统,能够自主处理信息。
斯坦福大学开发Stanford Cart,装上传感器实现轨迹跟踪。
斯坦福研发Shakey——整个机器人行业第一个能自己行走的机器人,虽然不是严格意义上的自动驾驶车辆。
孟醒坦言自己也曾低估这段历史。他曾在群里称Sebastian Thrun为"无人车之父",结果被行业前辈批评——Thrun"只是最后接了一棒",无人驾驶已有50多年历史。孟醒将无人驾驶与医学类比:治愈某些白血病从发现机理到成药花了至少50年,无人驾驶虽然看似漫长,放在科技史中实际上"是一个超级快的东西"。
无人驾驶行业进入"近现代时期"的标志是2004年的DARPA Grand Challenge。DARPA是美国国防部下属的创新机构,2003年立项,目标是2015年前让美国地面部队三分之一实现自动化。
| 届次 | 年份 | 场地 | 结果 | 关键变化 |
|---|---|---|---|---|
| 第一届 | 2004 | 加州与内华达州之间沙漠,约240公里 | 无队伍完赛,CMU第一名仅跑11公里 | 证明了行业的起步水平 |
| 第二届 | 2005 | 类似路线,约210公里 | 5支队伍全部完赛,斯坦福第一 | 奖金增至200万,20多支队伍参赛 |
| 第三届 | 2007 | 城市环境,需自主交互 | CMU的Chris Urmson团队获胜 | 从沙漠转入城市,交互难度大幅提升 |
在斯坦福和CMU的精英光环之外,孟醒特别讲述了一个"往往被埋没"的传奇故事——2005年DARPA挑战赛的第四名,来自路易斯安那州一家保险公司的队伍。
孟醒认为这是一个"非常典型的理想主义的人去参加一件事"的故事。这个案例说明:在技术革命的早期,热情和勇气有时比学历和资源更重要。但他也承认,"大家看到的都是斯坦福和CMU"——行业叙事中,草台班子的传奇往往被精英叙事覆盖。
DARPA挑战赛之后,Google成为第一个将无人驾驶从学术竞赛带入商业世界的公司。孟醒认为这与Google联合创始人Sergei Brin对机器人领域的持续关注密切相关——"汽车是最快实现机器人领域的一个方向"。
Sebastian Thrun从斯坦福加入Google,在Google X实验室启动Chauffeur项目(司机项目)。同时拉来了Chris Urmson。
完成"President Challenge"——从湾区两个城市之间,经过260多个红绿灯,一次不接管跑完全程。当时由朱家俊(后来牛肉的创始人)参与负责。
推出自主设计的定制车Firefly(萤火虫)——很小、没有方向盘,去掉所有不必要的传动器件。后来该计划被放弃,退回使用普通车型。
正式改名Waymo,从Google X内部项目独立为Alphabet子公司。
2011年跑260个红绿灯的挑战中,团队做了不少"人为作弊"——比如车被某个路牌卡住,识别成了别的东西,有人直接从车上跳下来用布把路牌盖住,车看不到就继续往前走。孟醒认为这恰恰体现了美国创业文化的有趣之处:大家有一个非常明确的目标,然后用各种各样的想法去把它实现。
Waymo经历了多任负责人,每次换人背后都折射出自动驾驶落地之难——技术方向的变化、技术与商业化的权重之争、以及超长周期带来的组织动荡。
| 负责人 | 时间 | 背景 | 离开原因 |
|---|---|---|---|
| Sebastian Thrun | 2009-2013 | 斯坦福教授,DARPA冠军,高瞻远瞩的开拓者 | 转向其他项目 |
| Chris Urmson | 2013-2016 | CMU教授,DARPA冠军,技术执着型leader | Google决定引入商业背景CEO,技术路线分歧,后创立Aurora |
| John Krafcik | 2015-2021 | 现代汽车美国CEO,商业背景 | 任职期间Waymo被解读为进入商业化阶段 |
| Dmitri / Co-CEO | 2021至今 | CTO出身,与一位黑人女性高管共同担任Co-CEO | 避免再次发生技术vs商业的路线冲突 |
孟醒总结了三个维度的矛盾:(1)技术方向本身在变化;(2)技术与运营/量产之间的权重之争——谁来主导,技术派还是商业派;(3)周期极长——Waymo从2009年到现在已17年,母公司必须存活这么长时间,子公司才有可能孵化出来。这三重矛盾使得"换人-变思路-变技术-变重心"成为行业常态。
孟醒梳理了自动驾驶技术架构演进的核心脉络——本质上就是把机器学习逐步、分阶段引入到自动驾驶不同模块的过程。
使用传统机器人规则体系,没有今天意义上的"强数据驱动"的AI模式。
深度学习在视觉识别领域取得突破——基于深度学习的端到端感知网络诞生,抛弃传统专家规则。
Waymo在感知层面引入数据驱动方法,这是计算机视觉领域变革向自动驾驶传导的第一步。
从规则("车速X,车道线Y,大概率右转")转向数据驱动——收集足够多数据后发现"人不是按照这个比率来开的"。
最后一块、也是最难的一块——从hard code的规则(见到红灯怎么走、跟车距离不能少于多少)变成收集人类驾驶数据,用模仿学习来学习人机驾驶决策的行为差。
孟醒将这个演进总结为两条平行路径:
"引入到全体,那就变成了端到端——一个完整的体系。"
孟醒曾带队在凤凰城长期调研Waymo,还暗中探访了Waymo的运营基地。他将自己完全抛开行业内的人的身份,"纯粹当一个Uber用户"来体验。
孟醒总结了Waymo当时的运营状态:运行区域是凤凰城南侧Chandler区,大约七英里乘十英里(约70平方英里)。安全、效率、体验三个维度"平行一起解决了":
作为行业从业者,孟醒团队对Waymo进行了一系列"不那么合规"但"一定要干"的极限测试,并暗中追踪Waymo的车到达了它的运营中心。
孟醒在旧金山同时体验了Waymo和特斯拉FSD,给出了一个清晰但有争议的判断:从安全度角度对比,不是一个量级。
孟醒用了一个精彩的框架来解释两者的关系:完全做到跟人一样开,可能需要做一万件事。每年大家只有精力做一百件事。十年做成一个产品,只能做一千件事。Waymo和特斯拉各选择了不同的一千件事,中间可能有三百件交叉,但也有各自独立的部分。两者都放弃了八九千件事——因为不符合经济效益或太难了。
Cruise是L4赛道上最戏剧性的一个案例。孟醒提供了大量一手细节。
创始人Kyle Vogt和Dan Camp,都是Justin TV(美国最早直播电视公司)的创始人。Kyle是MIT出身,学机器人方向。
成立仅约40个月、40人团队,"刚刚搭起一个demo车"就以十亿美金出售。这直接引爆了L4自动驾驶创业潮——"后来16年出来这么多做自动驾驶的创业公司,有一大半是受了Cruise的启发"。
进入GM后又拿了软银愿景基金和本田的投资,数十亿美金注入,成为行业融资额最多的公司之一。
约400辆无人车在旧金山运营,行业内工资最高的自动驾驶公司,大量从Facebook等公司挖人。
2023年下半年,Cruise刚刚拿到24x7收费运营牌照后,发生了一起改变行业格局的事故:
孟醒指出了一个深层问题:过去自动驾驶行业把所有精力放在避免事故,而几乎没有考虑过"如果事故已经发生了怎么办"。Cruise的靠边停车预案本身不算"不合理",但它的前提假设是"我还没有事故"——当事故已经发生时,这个逻辑就造成了二次伤害。事故发生后,Kyle和全部高管离职,大量人才流失到OpenAI等公司。
Cruise只在旧金山运营,早期只在晚上10点到凌晨5点接单。孟醒团队半夜跑到旧金山市中心体验——疫情期间旧金山的零元购最核心区域,"体验还是挺吓人的"。同事把自己车停路边去打Cruise的车,回来后车被砸了。后来停车时"都自动把门不锁,后备箱打开——表示车里什么都没有"。
孟醒详述了Uber自动驾驶部门(ATG)出局的三重原因:
孟醒认为L4的两种商业模式(自动驾驶卡车和Robotaxi)在美国都应该能跑通,但验证还需要时间。
| 维度 | 验证状态 |
|---|---|
| 单车技术 | 能过关 |
| 量产 | 正在测试中 |
| 单位经济模型 / 规模化运营 | 还没验证 |
孟醒对特斯拉做Robotaxi持极其审慎的态度。
孟醒指出特斯拉的Robotaxi宣言对整个L4行业是一把双刃剑:如果做出来了,大家觉得"特斯拉真的牛逼,你们自动驾驶都不太行";做不出来,大家也觉得"这事就不行"——对L4公司来说"也是一个很难受的状态"。很多L4从业者跳出来反对马斯克,包括侯晓迪和楼天城。楼天城说"L2做得越好,L4就越远"。
这是本期节目的终极议题——辅助驾驶(L2)和自动驾驶(L4)到底是不是一回事?它们会融合吗?
孟醒认为,今天而言,L2和L4是两个产品,有两个不同的优化目标。人只有有限的精力优化其中一些目标,所以两者会分道扬镳。但他也留了余地:在非常遥远的未来,也许用低成本硬件加特别厉害的软件实现接近L5的体验时,"可能这两个会是一个东西——但那个东西非常远,现在没有任何论据说一定能做成"。
| 指标 | 具体数据 |
|---|---|
| 无人驾驶历史 | 第一辆无人驾驶车出现于1925年,距今约100年 |
| DARPA挑战赛 | 3届(2004/2005/2007),首届奖金100万美金 |
| 2004年第一名成绩 | 240公里赛程仅跑了11公里 |
| Google无人车起步 | 2009年,由Sebastian Thrun带队 |
| 2011年President Challenge | 260多个红绿灯,一次不接管跑完全程 |
| Waymo累计投入 | 估计80-100亿美金 |
| Waymo团队规模 | 2000-2500人 |
| Cruise收购价 | 10亿美金(2016年),创立仅40个月 |
| Cruise年度投入 | 约25亿美金(2023年) |
| Cruise巅峰车队 | 旧金山400+辆无人车 |
| GM年利润 | 100亿美金以上 |
| Zoox收购价 | 十几亿美金(亚马逊收购) |
| Aurora团队 | 1000-2000人 |
| Zoox团队 | 接近2000-3000人 |
| 国内L4团队 | 约1000人 |
| 国内辅助驾驶团队 | 600-700人(主机厂内部),华为号称3000-4000人 |
| Waymo硬件成本 | 约为特斯拉的10倍 |
| Waymo运营区域(凤凰城) | 约7英里x10英里(约70平方英里) |
| Waymo远程解决率 | 90%的问题不需要派人到现场 |
| Lyft市值 | 50-70亿美金,占美国网约车约25%份额 |
孟醒反复强调,Waymo今天领先的核心原因不是做了某个了不起的差异化创新,而是(1)起步最早;(2)没有犯致命错误;(3)技术虽然换了负责人但"基本上都接住了";(4)母公司Google有能力支撑17年的超长周期。对比Cruise的致命事故、Uber ATG的致死测试、Argo的过早合规化,Waymo的优势本质上是稳定性和生存能力。这对所有需要长周期投入的前沿技术公司都是深刻启示。
孟醒在45度高温的凤凰城,追踪Waymo的车到老巢、往传感器上泼水抹泥、半夜把车门打开——这些"不那么合规"的极限测试产生的认知,是任何二手报告和分析师研究都无法提供的。他的核心方法论是:"知道什么时候不好了,我就大概知道你好到什么程度了。"边界在哪,才是最有价值的信息。
L4赛道的经验表明:创业公司能把技术做出来,但"整个业务走到大结局"还需要大公司支持。这不是因为大公司更聪明,而是因为L4的链条太长——从自动驾驶技术到运营、资产管理、用户获取、网约车平台——"光技术不能一针插到底"。Waymo(内部孵化)和Cruise(收购)的对比说明:两种模式都可以work,但内部孵化的长期主义压力更小。
整个自动驾驶行业花了十几年优化"如何避免事故",但几乎没有人认真思考过"事故已经发生后怎么办"。Cruise的靠边停车预案在正常场景下合理,但在已发生碰撞时造成了二次伤害。更致命的是沟通中的不诚实——技术事故可以修复,但信任一旦破裂就很难恢复。这个案例对所有前沿技术公司都是警示:你的异常处理逻辑和危机沟通策略,可能比正常路径更决定命运。
孟醒的"一万件事"框架优雅地解释了为什么L2和L4不是同一件事的简单版和完整版——它们是在一万件事中各选了不同的一千件事来优化。这意味着L2做得越好,不一定离L4越近,反而可能在不同方向上越走越远。楼天城的"L2做得越好,L4就越远"正是这个逻辑的极端表述。
路易斯安那保险公司队伍的故事说明:在技术革命早期窗口,进入门槛比人们想象的低。65万美金预算、没有PhD、从网上学AI编程的团队,做到了离斯坦福仅差半小时的成绩。但孟醒也暗示了时间窗口的关闭——到2016-17年,行业内"做到Google 2011年做到的事"的公司几乎还没有。草台班子可以在窗口期进入,但长期存活需要完全不同的能力。
孟醒透露了一个惊人的认知偏差:在2020-2021年,包括Sebastian Thrun在内的行业最权威人士都认为Waymo"做的太慢了""落后了"。结果这个判断"最近才反转——而且反转得非常彻底"。这说明即使是行业顶尖专家,在任何一个时间切片上的判断都可能是错的。对技术投资和战略决策而言,耐心本身就是一种被低估的竞争优势。