谢晨(Steve),光轮智能创始人兼CEO。北大物理本科(年级前五),哥伦比亚大学商学院量化金融博士。经历涵盖电商动态定价(J.com/沃尔玛)、产品经理、L4自动驾驶仿真(Cruise)、英伟达自动驾驶仿真、蔚来自动驾驶仿真。2023年与联创严海波共同创立光轮智能。
加入Cruise负责自动驾驶仿真。仿真从"投资人demo工具"变为真正支持算法训练的能力。"第一步做的事不是提升仿真,而是评价仿真。"三个月内交付成果。
加入英伟达负责自动驾驶仿真。发现Aurine最大客户不是Waymo和Cruise,而是"蔚小理"——意识到自动驾驶下一代在中国。六个月后携家回国。
从主机厂角度实践仿真,搭建数据闭环系统。越来越感到:自动驾驶的仿真是加速器,而机器人的仿真是先决条件。
出发点:用仿真加速机器人产业,成为整个机器人产业的数据基建与数据引擎。
谢晨反复强调一个区分:他要做的不是"加速器"式的锦上添花,而是"前提条件"式的不可或缺。这个判断框架贯穿了他从物理学到金融到自动驾驶到机器人仿真的整个职业选择逻辑。他在北大物理、博士期间均有创业经历(国际交流团、狗友社交应用),但都因"不够颠覆性"而放弃。
谢晨从第一性原理出发,将数据对于智能类比为教育对于人——数据不是静态的燃料,而是一个不断演进的教育系统。
数据从一个静态数据集,演变为一个工厂级生产流程,再进化为一个评测驱动的教育系统。每一个阶段对应不同的"教育范式":
| 阶段 | 数据形态 | 教育类比 | 代表 |
|---|---|---|---|
| 1.0 静态数据集 | 图片+标注,一次性交付 | 填鸭式教育,买教材给学生 | ImageNet(李飞飞) |
| 2.0 工业化生产 | 工厂级流程、质量管控、大规模人力 | 量贩式教育,标准化课堂 | Scale AI(自动驾驶标注) |
| 3.0 评测驱动 | 高阶专家出题、反馈、因材施教 | 师者:传道授业解惑 | Surge、Mccord(大模型后训练) |
| 4.0 系统驱动 | 仿真环境+评测+RL自我学习 | 自我修炼:环境+成功标准+试错 | 光轮智能(机器人仿真) |
谢晨提出了一个反直觉的发现:早期数据要求"完美正确",但新一代数据中,最有效的数据是"先失败再成功"的数据。
最早客户要求完美执行整个长程任务。后来迭代发现:机器人拿蘑菇时没抓牢、掉到桌上、再捡起来放回pizza——这种"纠正数据"(负样本)训练效果远优于完美数据。模型的泛化能力提升后,它更能从错误中学习,更接近人的学习过程。
谢晨对"数据即模型、模型即应用"的观点有保留:他认为短期内成立(零样本能力不足时必须补充对应数据),但长期不成立——模型架构本身需要提升泛化能力。本质上,不够聪明的模型才需要"见过什么才会什么"。他更认同"系统级能力持续提升"而非"知识即模型"。
谢晨将数据产业的演变与AI模型学习范式的发展对应起来:
一个反直觉的现象:数据标注行业的人数并没有减少。自动驾驶标注基地可能有数十万人在工作。但人员结构发生了根本变化——从低成本的画框标注员,到时薪100美金以上的领域专家。谢晨类比:越有能力的人,学习意愿越强,摄取数据量不减反增。
数据、算力、算法是驱动AI的三驾马车。大模型和机器人面对的数据问题本质不同,且差距悬殊。
谢晨指出:机器人是物理世界的Agent,大模型Agent是数字世界的Agent。两者遇到的问题惊人相似——都需要环境(仿真/虚拟网站)、经验传授和评价信号。大模型Agent的关键数据产品叫"RL-inf"——服务强化学习的虚拟环境(虚拟滴滴、虚拟京东、虚拟编程环境)。机器人需要的是物理世界的等价物。
谢晨揭示了大厂内部做机器人大脑的三个团队之间的关系——它们并非孤立运作,而是形成了共生、协作与分化的复杂格局。
| 团队 | 核心能力 | 对数据的需求 | 与仿真的关系 |
|---|---|---|---|
| 大语言模型(LLM) | 数字世界基座能力 | 后训练+评测数据 | 间接(提供基座给VLA) |
| 世界模型 | 物理世界理解与预测 | 物理场景、光照、物理约束 | 用仿真数据提升grounding |
| VLA | 物理世界行动执行 | 行动轨迹、跨本体数据 | 用仿真做评测+RL微调 |
不只是机器人公司和自动驾驶团队在做VLA——大模型团队也在做。DeepMind(谭捷)、英伟达、OpenAI等都在做VLA,他们通往的是通用智能而非某个垂直场景。他们用最简单的机械臂(而非人形)来验证零样本泛化能力,关注的是"在10种任务上训练后,能否做另外5个没见过的任务"。
李飞飞的Behaviour Challenge同时可用于评价VLA和世界模型(Enact)。如果评价系统越来越一致,两者可能长期趋同。谢晨判断:世界模型可能是云端大脑,VLA是端侧大脑,两者以"底座趋同、部署分化"的形式共生。
六个月前三个团队的数据需求相近,但最近发生了质的变化:大模型客户最关注零样本泛化能力(相信Scaling Out),而机器人客户更关注具体场景的执行。前者用"本体无关"的仿真+人类数据,后者需要针对具体本体(轮式、足式、灵巧手)的数据。
数据金字塔(Data Pyramid)由李飞飞的学生朱易克教授提出,是理解机器人数据的核心框架。谢晨在实践中对其进行了重要修正。
谢晨认为金字塔给人的印象是三层独立存在,但实际应该是以仿真为中心、以评测驱动为中心的数据闭环。真实数据和人类数据都流入仿真(Real-to-Sim),仿真输出又对标真实世界(Sim-to-Real)。评测必须基于仿真才能规模化,而仿真的评测又必须与真实评测对标才有意义。
谢晨对仿真的定义极其严格,排除了大部分"视频生成"类技术。
谢晨提出仿真必须满足三个条件:
视频模型不满足以上三条:难以复现、没有行动、改变初始条件后无法产生有效响应。但世界模型有机会成为仿真的一类——两者是共生关系而非替代关系。
世界模型的优势是生成能力强、泛化好;仿真的优势是物理准确、可复现。两者结合:世界模型可以帮助仿真数据做更好的泛化,仿真可以为世界模型提供物理grounding。光轮与世界模型客户越来越形成"共生关系"——他们用光轮的数据,光轮用他们的模型。
特斯拉发明了"数据引擎"(Data Engine)概念:百万辆车上路采集数据 -> 训练云端大脑 -> 部署更好的端侧能力 -> 形成数据飞轮。谢晨认为这套逻辑在机器人领域底层不成立。
自动驾驶:数据99%+来自本体(车开回来的数据),因此最大的本体商=最大的大脑商。特斯拉模式成立。
机器人:最多的数据一定不是本体上提供的(没有百万台机器人在端侧部署)。最大量的数据来自仿真和人类数据——它们都是本体无关的。因此,不会存在一个本体商同时做出最好的大脑。
如果机器人数据金字塔成立(本体无关数据占大部分),那么:(1) 最好的大脑不来自最大的本体商;(2) 数据闭环的核心不在端侧部署,而在仿真+人类数据的规模化;(3) 生态将是四方协作而非一家通吃。这是谢晨整个产业判断的底层逻辑。
谢晨描绘了一个四方生态系统,每方角色明确但相互依赖。
| 角色 | 核心能力 | 代表 | 数据需求 |
|---|---|---|---|
| 大脑商 | 基于本体无关数据训练通用大脑 | OpenAI、DeepMind、阿里、英伟达 | 仿真+人类数据(预训练+评测) |
| 本体商 | 硬件量产+端侧微调部署 | 宇树、Figure | 真机遥操作数据(微调) |
| 数据商 | 评测驱动的数据引擎 | 光轮、Scale AI | 为客户提供数据+评测 |
| 场景商 | 提供真实落地场景 | OEM、医疗集团、农业公司 | 场景专有数据 |
谢晨特别强调了场景商的自主权:他们可以选择A或B的硬件,甚至自研硬件(OEM擅长量产和成本控制),也可以直接基于大脑能力落地。场景商可能是工业、医疗、农业等领域的巨头。
谢晨明确表示:不会是单一霸权,而是生态系统。原因正是本体无关的数据逻辑——大脑商必须与数据商共生进化,不可能一家通吃。他对"机器人领域有没有特斯拉"的回答是:Figure想成为那个角色,但"还很远"。
中国机器人圈的一个核心分歧:为什么国内仿真派似乎不多?谢晨给出了直接而犀利的分析。
谢晨观察到三个层面的剧变:
数据不是越来越便宜,而是越来越贵——这与大多数人的直觉相反。
| 数据类型 | 价格区间 | 特点 |
|---|---|---|
| 预训练数据 | 最便宜(标品,多家平摊) | 提升通用基础能力,5家大模型公司共享成本 |
| 后训练+评测数据 | 最贵(定制,反馈驱动) | 针对性强,评测驱动,信号价值极高 |
电影数据和游戏数据"都有用",但ROI不高:电影是2D信息而非3D,处理成本高,智能提升点数低;游戏太跨域(物理不真实、另一个世界观)。世界模型团队会用大量游戏数据(买版权、用Agent打游戏),但效用性有限。ROI最高的是:基于仿真的人在环+算法驱动数据和人类第一视角数据。
谢晨给出了一个明确的竞争格局判断——过去三到六个月,多家大厂"更激进了"。
| 玩家 | 类型 | 关键优势 |
|---|---|---|
| OpenAI | 大模型+Robotics | Robotics团队很强,不可小觑 |
| DeepMind | 大模型+Robotics | "极其极其优秀的团队",极其稳 |
| 英伟达 | 平台+Robotics | 对物理AI极其重视,Jim和明宇团队资源给够 |
| 阿里(千问) | 大模型+VLA | 千问是最好的开源大模型 |
| 字节 | 大模型+VLA | 资源丰富、人才密度高 |
| PI | 创业公司/Frontier Lab | 真正在大规模训练模型 |
谢晨明确看好宇树——"坚定地把本体做好",不和大脑公司竞争,知道自己的边界。预判大脑公司会高调与宇树合作。宇树已被证明是"足够稳定、可量产"的硬件。
"从Day1就想得很清楚",上下游完全打通,量产做得很好。具身智能现阶段应是供给驱动的市场。
XAI的重心还在大语言模型("那场仗没有打赢"),特斯拉的重心在本体硬件优势。两边暂未完全汇聚。
谢晨明确拒绝"Data Factory"的定位,将光轮定义为Data Engine——一个反馈驱动的学习引擎,而非流水线工厂。
从第一性原理出发:人就是这么工作的。胸前、头顶的视角都与眼睛有偏差。理想的采集硬件是消费级智能眼镜——人本来就想戴(如Meta RayBan),而非"为了数据而戴"。谢晨认为人类数据公司不应该做自己的硬件,应基于已有的消费级爆款。
谢晨认为Data Factory会消失(量贩式标准化知识不再需要),但仿真环境永远需要——AI越强大,对物理环境和评价指标的需求越高。终极产品不是"数据",而是"环境"——类似爱因斯坦在大脑中构建思想实验,AI在仿真中构建无限的物理实验。
"数据是新时代的石油"这个比喻正在过时。谢晨提出的"数据即教育"框架更有解释力:石油是被动消耗的,教育是主动演化的。数据从静态数据集到工厂生产到评测驱动再到自我学习环境,每一步都在向"教育系统"靠拢。这意味着数据公司的终局不是"采掘公司",而是"教育机构"——甚至是"修炼场"。
这是谢晨最具颠覆性的论断。如果机器人数据金字塔的底部(仿真+人类数据)占据绝对多数,那么自动驾驶时代"卖车=收数据=训大脑"的闭环在机器人领域不成立。这直接导致四方生态系统取代一家通吃——大脑商、本体商、数据商、场景商各司其职。创业者和投资人需要重新审视"我在哪一方"。
不是数据不够,不是算法不行——是无法规模化地衡量进步。谢晨把评测列为机器人和大模型共同的头号问题。学术级benchmark已被打爆(除了Behaviour的26%),工业级规模化评测只能通过仿真实现。这解释了为什么"真实流派"的Frontier Lab最终都找上了光轮。
完美数据不再是最有价值的。纠错数据(做pizza时蘑菇掉了再捡起来)训练效果更好——这与人类学习的直觉完全一致。这个发现对数据采集方法论有重大影响:不再追求零瑕疵的遥操作,而是有意引入"失败-修正"的序列。数据定价也因此变化:不完美的数据反而更贵。
OpenAI、DeepMind、阿里、英伟达、字节——这些大模型团队在过去半年明显加速投入机器人VLA。他们的优势不在本体,而在基座模型能力、RL基建(大几万张卡)、和对数据Scaling Law的深刻理解。创业公司"很难去做大脑",但在本体(宇树)和场景(智元)上有清晰定位的公司将会受益。
自动驾驶有百万辆车做影子模式,机器人没有。但如果消费级智能眼镜(如Meta RayBan)大规模普及,每个戴眼镜的人都在为机器人采集第一视角数据——这就是机器人的"百万辆车"。核心在于眼镜本身要好到让人"心甘情愿地戴",而不是为了数据才戴。
谢晨最终的判断是:量贩式数据生产终将被AI自我学习取代,但"环境+成功标准+试错"的组合永远被需要。AI越强大,对学习环境的渴求越高——就像人越优秀越爱学习。仿真不是一个阶段性工具,而是智能进化的永恒基础设施。这是光轮的终极赌注。
| 指标 | 具体内容 |
|---|---|
| 大模型数据充足度 | ~60分(预训练到顶,后训练+评测还有大空间) |
| 机器人数据充足度 | <0.6分(百万台起点的60分,现不到1万台) |
| 中国数据标注从业者 | 估计10万~几十万人 |
| 大模型后训练专家时薪 | $100+美金 |
| 机器人数据单价 | 几十~几千人民币/小时,高质量数据几百~千+ |
| Behaviour Challenge最高成功率 | 26%(100道题) |
| 光轮智能团队规模 | ~100人全职(工程技术方向) |
| 大模型团队训练卡量 | 大几万张(vs 机器人公司几千张) |
| Generalist验证数据 | 27万小时污秘夹爪数据,观察到Scaling Law |
| 角逐机器人大脑的关键玩家 | OpenAI、DeepMind、阿里、英伟达、字节、PI |
| 预训练数据成本模式 | 标品,~5家大模型公司平摊 |
| 仿真 vs 真机效率倍数 | 以系统为中心可比以人为中心少~100倍人力 |