节目以武汉萝卜快跑引发的巨大公众关注为切入点。楼天城(小马智行Pony.ai联合创始人兼CTO)从自身经验出发,分析了这一事件为何引起如此大的反响。
楼天城提出了一个极其明确的优先级判断:萝卜快跑之所以破圈,99%的原因是"无人化"。车队规模更大、适用范围更广等因素只占那"1%"。Pony.ai在2022年底就已做到无人化,但当时没有机会大规模对外开放。萝卜快跑的冲击力在于:一个人坐进一辆完全没有司机的车,哪怕车上还有一个安全员,"冲击力是很不一样的"。
楼天城透露Pony.ai是"身体上无人的"——技术上已经实现无人化。但他强调从安全角度出发,希望做到十倍于人类司机的安全率才大规模铺开。这种"能做但克制"的态度,与行业内急于展示demo的氛围形成鲜明对比。
楼天城自称是"一个合适回答这个问题的人",从2009年Google自动驾驶项目讲起,用"万小时"阶梯模型重构了整个自动驾驶发展史。
楼天城将自动驾驶的技术进步按"多少小时不需要人接管"来衡量,分为五个数量级阶梯:
把车辆"bring up"——基础的识别能力、基础功能都要有。"该有的都得有"。涉及车辆改装、传感器、整体集成(integration)。今天做到这一步的公司"其实也并不多"。
各种深度学习模型开始发挥作用。不一定是大语言模型,而是各类感知和预测模型。这是"一到十的主要突破点"。
真正涉及大规模数据收集、更先进的模型架构(如端到端)。需要原生数据,对数据质量要求极高——厘米级精度的距离、精确的速度估计。需要一定规模的车队。
核心突破不是模型也不是数据,而是指标体系——如何客观评价系统做得好不好。"这是超越资源的能力"。很多公司在这里原地打转。
已经超越人类水平(约千小时级别),需要构建让AI自主演进的系统。"已经不能教他了"——只能告诉他什么是好,给他创造环境。
楼天城将技术路线的演进与万小时阶梯做了精确对应。他强调:技术路线影响的是速度,而非天花板。
| 时期 | 关键技术 | 对应阶梯 |
|---|---|---|
| 2018年前 | 前融合与后融合 | 一到十 |
| ~2021年 | BV + Transformer(特斯拉推动) | 十到百 |
| ~2022年后 | 端到端(End-to-End) | 帮助更快到百 |
| 百之后 | 评价体系 + 超越资源的能力 | 百到千到万 |
楼天城对端到端的评价非常精准且克制:端到端的根本变化是让整个模型表现更强,因为它可以避免模块之间的信息传递损失——"三个人做的事变成一个人做,整体能力变强了"。但他明确指出:端到端只能帮到"百"这一步。百到千到万的突破,靠的是完全不同的能力。
楼天城在访谈中花了大量篇幅阐述"百到千"这一阶段的核心——评价体系(metric system)。他认为这是整个自动驾驶行业最被忽视、却最关键的能力。
楼天城透露他"主要精力都放在这边"。评价系统要解决的问题是:上个月做到200分,这个月新版本是220还是180?你不能靠猜、不能靠开一个小时来判断(路太短了)、也不能测一万小时(太久了)。更关键的是各种噪声——上个月下雨多、这个月周五晚上多了一个——"你要把所有噪声全部认掉,真正判断你做得好不好"。
楼天城指出:在"一到十"或"十到百"阶段,大家谈的都是资源——数据多少、算力多大、模型多强。但到了"百到千",没有一把好尺子,"你有再多资源,你会原地打转"。这是一个超越资源的能力——也解释了为什么有些公司数据量巨大却进步缓慢。
当自动驾驶系统超越人类水平(约千小时级别)后,楼天城描述了一个根本性的范式转换。
楼天城坦言:"他从数据上比我安全十倍,这个我不丢人。"
楼天城分享了一个反直觉的发现:开得慢不等于安全。开得慢会"把人confuse",让别人不知道你在干什么,这时候你就很危险。降低其他车的风险成为千到万阶段最核心的关注点——很多时候别人发生事故,是因为你的开车行为给他造成了困难。"我能不能给他降低点难度,让别人开车都觉得比较容易?"
这是本期节目最核心、最具争议性的论点。楼天城用精确的逻辑拆解了这一看似反直觉的判断。
楼天城明确否定了"从L2渐进到L4"的叙事。他用了一个精妙的反问:"渐进为什么是先做二再做四呢?为什么不是先做四再做二呢?这个是白占了便宜。"他甚至连"渐进"这个词都不愿意用——"我都不想占这个便宜"。L2和L4是两个不同的目标,就像precision和recall的trade-off,优化一个必然偏离另一个。
楼天城用一个精彩的"作弊学生"类比来解释Pony.ai为什么坚持使用激光雷达(LiDAR)。
激光雷达是"作弊的学生"——它通过物理直接测距,不用分析、不用推算,"直接看答案"。纯视觉是"好学生"——再努力、再优秀,也"很难比过一个作弊的学生"。何小鹏的说法(来自Pony.ai的郎咸朋)本质上是一样的——做到全无人,需要一个作弊的学生。
Pony.ai在选择传感器时就考虑了成本下降路径——选择那些"里面的元件能够上规模、自然会降成本"的传感器。
当被问到何小鹏认为"特斯拉FSD明年一定会追上Waymo"时,楼天城给出了一个深刻的回应。
楼天城明确表示:特斯拉FSD或国内的L2车企"有可能成为最优秀的L4公司"——"我尊重他。但他不会因为那些技能成为"。L2的技能做到极致,不是通往L4的路径。
这是楼天城在访谈中分享的另一个反直觉洞察——也是他认为最重要的几个观点之一。
在"千小时"级别以前,数据确实越多越好——帮你达到人类水平。但当你开始超越人类水平时,数据越多越不好。因为所有数据本质上都是人类水平的数据,你要超越这个平均水平,数据越多反而越难超越——"越数越多,你越会跟这些数据一样,同流合污"。
楼天城的观点与特斯拉FSD的核心叙事("我们有更多数据所以更强")形成直接对立。他认为:如果FSD也做到了千小时级别,"他也会理解,他也会看见"数据悖论的存在。这意味着特斯拉的数据优势在L4场景中不仅不是优势,反而可能是负担。
何小鹏认为"Robotaxi在最近一年大规模做得很好的可能性是零",原因包括需要云端管理系统、硬件要发生很大变化等。楼天城对时间判断表示认可("也说要三到五年"),但补充了更多原因——"因为我可能遇到更多的困难"。
核心逻辑:人天天在车里花的时间很多。如果这些时间不需要开车了,就完全可以创造新的模式和价值——比如内容消费。"所有对人服务的,首要指标就是一个人在上面花的时间"。
楼天城与彭军(Pony.ai CEO)在理念认知和"做无人驾驶的决心上"高度认可。当时大家都有好的工作,"有一个decent life"。出来创业是想"花几年时间,好好做一件真正有深度的、影响人类的事情"。
上一波大家相信无人驾驶能做成的热情消退后,"大家其实有点怀疑——能不能做到"。走了六年却"还没有看到真正无人驾驶这件事"。
自然会有人问"还要多久"——"我希望可能就是一个月就够了,其实我就是六年一个月拿到的"。
这是一个重要的信心拐点。同期政策"尤其在中国,是顶着基础前走的"——楼天城用"very serious"来感谢政策推动。
楼天城引用了姚期智先生(图灵奖得主、楼天城的导师)的教诲,分享了一个关于"不忘初心"的深层思考。
楼天城提到当年一起出来创业的很多公司"现在已经很多也不知道这公司名字了"。他们没有坚持下来,"基本没有因为困苦或者没有钱,而都是因为他没有经受过诱惑"。
"我们当时出来不是为了一份最好的(工作),我们都有,不需要这个东西。我们就是要把这个做成。"正因为创业动机纯粹——不是为了财务回报——所以"不太会受很多诱惑"。楼天城认为这是Pony.ai能坚持八年的根本原因。
楼天城(ACRush)是中国编程竞赛的传奇人物。访谈中张小珺首次深入探讨了他的竞赛经历。
"Rush"是四驱兄弟时代"最快的奥部动作"——对应他在竞赛中追求速度的风格。
当被问到如何看待杨植麟(月之暗面创始人)时,楼天城的回答非常克制而深刻:"只有拿过冠军的人才知道冠军的价值差别。第一名和第二名——这一名之差,能不能获得冠军,差别非常大。世界第二高峰可能都不知道是什么,世界第一高峰全天下都知道。"
楼天城的回答极有分寸:"如果这个东西没有活着的话,可能也达不到这个高度。"他认为"技术天才"的标签如果没有持续的成果支撑,就只是过去的荣光。真正重要的是把眼界放得更高。
楼天城分享了编程竞赛中一个鲜少被公开讨论的策略——Hold Card(藏牌)。这一策略与他的商业思维有着惊人的呼应。
在编程竞赛中,中间排名是公开的。如果你实际做到了90分但只展示80分(跟其他人差不多),对手就会觉得"我确实不错,只要一些细节就可以"——他就会在"温水"里被直接煮掉。最后时刻再亮出90分,对手没有时间反应。
楼天城的回答意味深长:"方向也不一样。公司发展需要一定的publicity。"这暗示Pony.ai在公开展示的能力和实际能力之间,可能存在有意的差距。
访谈最后,楼天城分享了一些极少公开表达的世界观,令人震撼。
楼天城认为我们可能生活在一个模拟器中,而光速等物理常数可能是"模拟器的参数"。他指出:"其实现在做很多AI工作的人,开始一定都在探寻模拟器的参数。"
| 判断 | 具体内容 |
|---|---|
| 萝卜快跑出圈原因 | 99%是无人化,规模和范围只占1% |
| Pony.ai无人化时间 | 2022年底实现 |
| 安全目标 | 十倍于人类司机安全率才铺开 |
| 当前技术水平 | "千到万"阶段,已到万(约20万公里不出问题) |
| L4及格线 | 一万道题答对九千九百(万小时不需接管) |
| L2及格线 | 大约八千六百 |
| 端到端的贡献 | 帮助更快到"百",但百到千到万靠别的能力 |
| 激光雷达成本变化 | 从八万美金(~50万人民币)降到小几千人民币 |
| Robotaxi大规模运营 | 还需3-5年 |
| 全球存活的无人驾驶公司 | 一只手(5家左右) |
| 整车成本目标 | 降到紫外(数万元人民币)级别 |
| 创业年限 | 8年(2016年至今),至商业化约需10年以上 |
| 竞赛记录 | 连续11年TopCoder中国区冠军,坚持参赛20年 |
| 核心论点 | L2做得越好离L4越远,反之亦然——渐进式无人驾驶不存在 |
| 数据悖论 | 超越千小时人类水平后,数据越多反而越难超越 |
| 评价体系 | "比模型本身难多了",是百到千到万的关键突破口 |
| 北极星指标 | 安全性 > 舒适度 > 速度(前三排序) |
| Robotaxi最好/最差预期 | 最好3年大规模,最差5年 |
楼天城用precision/recall的trade-off、考试及格线的差异、足球/篮球的极致化矛盾三个维度拆解了这一论断。L2优化的是"覆盖面广+成本低"(recall),L4优化的是"绝对不出错"(precision)。两者的优化方向相反——一个L2做到极致的产品(接管间隔从10小时降到8小时来降成本),在L4的评价体系里反而退步了。这意味着"渐进式无人驾驶"从数学上就不成立。
楼天城把自己"主要精力"都放在评价体系上。这是一个"比模型本身更难的模型"——不是技术路线的问题,不是数据量的问题,不是算力的问题。它是一个超越资源的能力:没有好的评价体系,再多资源也只会原地打转。这解释了为什么很多公司看起来资源丰富却进步缓慢。
当AI超越人类水平后,人类数据从"燃料"变成"干扰项"。楼天城的逻辑清晰:你有一堆人类司机的数据,你想超越他们,数据越多你越容易"同流合污"——因为模型会被拉向数据的平均水平。这直接挑战了特斯拉"数据飞轮"的核心叙事,也解释了为什么Pony.ai不走大规模数据采集路线。
"作弊学生"的类比极其精准:激光雷达通过物理直接测距,不需要AI推算,就像考试直接看答案。当及格线是九千九百(L4)时,作弊一个月就够了;但好学生可能要学三十年。当及格线只有八千六百(L2)时,好学生完全够用且成本更低。这不是"路线之争",而是"目标不同导致最优解不同"。
楼天城将15年的自动驾驶历史浓缩为五个阶梯(1-10-100-1000-10000小时),每一步需要的核心能力完全不同:一到十靠模型、十到百靠数据和端到端、百到千靠评价体系、千到万靠超越人类的演进系统。这个框架的价值在于:它让外行能快速判断一家公司到底在哪个阶段,以及它宣称的"突破"是否在正确的维度上。
楼天城在编程竞赛中的"温水煮青蛙"策略——把90分控制在80分让对手放松警惕——暗示了Pony.ai在商业竞争中可能也在有意克制展示。他明确说"公司需要publicity"但也承认"方向不一样"。这种"能而不显"的策略与何小鹏"拒绝分享核心竞争力"异曲同工,提示我们:行业领先者公开展示的能力边界,很可能不是真实能力边界。
楼天城引述姚期智先生的洞察:放弃初心的人大多不是被困难击倒的(很多人都能坚持),而是被"可以一两年就商业化的东西"诱惑走的。这个判断对当前AI创业潮有深刻启示:当大量创业者涌入"快速变现"的应用层时,真正在底层做困难事情的团队反而是最稀缺的。楼天城八年创业、二十年竞赛的坚持,本身就是对这一原则的践行。