← 返回张小珺主页
深度研究 Deep Dive

高继扬:具身智能的实用主义者

#132 鲶鱼、曾国藩、Waymo与Momenta的两面、一只狼与许华哲的离开
2026.2.13 · 03:04:52 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 一个92年创业者的成长拆解
  2. 曾国藩的顿悟:从清流到做事
  3. 商汤的四个月与神经网络的魔力
  4. 博士三年半:归纳总结的方法论
  5. Waymo的两面:工程师天堂与缺失的Founder
  6. Robotics vs AI Native:自动驾驶十年技术路线之争
  7. Momenta的鲶鱼:量产文化与极致的卷
  8. Waymo与Momenta:两极文化的训练
  9. 创业的起点:放弃千万美金与整机信仰
  10. 星海图的战略演进:从配送到开发者市场
  11. 数据之争:真实数据的成本账
  12. VLA双系统与大脑架构
  13. 许华哲的离开:务实创新与算法传播周期
  14. 从3000万到100亿:融资与组织的膨胀
  15. 启示与延伸思考

一、一个92年创业者的成长拆解

高继扬,1992年生,河北石家庄人。小骏在开场中说他是"极致的浪漫主义的反面",代表了一种极致的效率、工程拆解与实用主义。三小时的访谈证实了这个判断——高继扬是一个把"归纳总结"贯穿人生每一个阶段的人。

早期成长:一段一段的勤奋

高继扬的成长轨迹呈现出一个有趣的模式:间歇性勤奋——他会在意识到某个阶段重要时突击发力,然后在不重要的阶段放松。

小学·玉东小学(石家庄)

成绩班级前五到前十,学过奥赛但不算出色,"过得比较轻松"。

六年级暑假·第一次用功

准备初一分班考试,"考试生涯第一次还不错",年级第三名。之后初一初二又恢复平常,年级几十名。

高中·石家庄二中理科实验班

学物理竞赛,靠勤奋而非天赋。"别人刷一遍的题我刷两遍,别人刷两遍的我刷四遍。"最终全国二等奖,保送清华电子工程系。

清华·电子系(2011-2015)

成绩百分之三四十,"谈不上TOP"。大二大三就确定要创业,但认为移动互联网不是自己这代人的机会——"太年轻了,啥也不懂啥也不会"。

高继扬
我是当我发现我需要勤奋的时候,我是非常勤奋的。但是当不需要的时候,我也不是很勤奋。

间歇性勤奋的底层逻辑

高继扬的勤奋不是持续的,而是目标驱动的——只有当他识别到"这个时间段对我很重要"时才全力投入。这种模式在大学毕业后发生了根本改变:"目标感更强了",从此一直保持高强度工作状态。这暗示他的勤奋本质是一种资源分配策略,而非性格特质。

二、曾国藩的顿悟:从清流到做事

大四申请博士时,高继扬遭遇了第一次真正的挫折。暑期在三藩实习后,导师没有给他写强推信,导致大部分想去的学校都没能申上。这次打击成为他思想转变的转折点。

高继扬
曾国藩从20多岁是一个儒家清流,怎么到40岁变成一个特别有事功的人......他的顿悟就是说,当你要做一件事的时候,你到底能拉动多少资源,有多少人愿意跟你一块去做这件事,并且最后把这件事做成。他发现这件事是最重要的。
认知转折

"儒家清流做不了了"

高继扬将自己申请学校失败类比为曾国藩发现清流路线走不通。关键推导:学术这条路不是最优路径 → 创业是终极目标 → 需要从底层思考方向 → 需要为创业做系统性准备。这个框架后来贯穿了他从商汤到Waymo到Momenta的每一次职业选择。

反思的方法论

通过阅读寻找"养料"

  • 高继扬有一个习惯:遇到不顺利就反思,反思需要思考的"养料",养料来自看书
  • 偏好看传记和历史——"通过看别人在困难中的经历,给自己来点灵感"
  • 不是学术上的阅读,而是从他人的困境中提取可迁移的行动逻辑
  • 推荐的书是吕思勉讲三国——"真实的历史总不是那么戏剧性,真实的历史有它的逻辑性"

三、商汤的四个月与神经网络的魔力

大四时,汤晓鸥在清华的一个小范围交流给了高继扬接触深度学习的机会。他此前从未接触过神经网络,但商汤给了他一个实习机会。

高继扬
有一天从实习那地方出来,骑着自行车,突然想到这个——神经网络可以代替人在数据当中发现规律。这事太牛了,我以后得做这个。

商汤实习的关键收获

方向选择的底层标准

高继扬此后系统性地看了各种方向,最终确定了一个核心筛选标准:AI必须是这个行业最底层的变量——没有AI这个行业不存在,有AI这个行业才成立。据此他排除了广告("没有AI这事也成立")、云("不是很本质")、商汤式的泛AI+("可能形成不了自己的产品"),最终选择了自动驾驶/物理世界AI。

四、博士三年半:归纳总结的方法论

高继扬在UC读CV方向博士,用三年半完成(正常五到六年),核心方法还是归纳总结

发论文的三种套路

高继扬的顶会论文分类法

  • 第一类·挖坑型:提出新问题,建立benchmark和数据集——"最厉害的人都是挖坑的"
  • 第二类·提升型:在已有问题上性能做得比前人好
  • 第三类·效率型:性能接近但用的数据/监督更少,成本更低

几乎所有论文都能往这三类上套。高继扬在三类中做选择,同时增加投稿量提高命中概率——"别人一次投一篇,我投两篇"。

三年半毕业的推导

高继扬的逻辑链条极为清晰:读博是为创业做训练 → 训练时间越短越好 → 目标四年 → 需要4-5篇顶会 → 第一年就要开始投稿 → 排好时间表 → idea比带宽多就分享给同学合作发 → 三年时发现"差不多了" → 导师同意提前毕业。

高继扬
我觉得我过去考试也好、做工程师也好,主要的方法论就是归纳总结。

"归纳总结"是贯穿全局的元能力

物理竞赛靠归纳题型映射考点,博士靠归纳论文三类套路,后来在Waymo读codebase归纳系统演变逻辑,在Momenta归纳工程师思维为"拆解+测量"。高继扬不是那种能"想到解法"的天才(他自己承认物理竞赛时"有些解法我就想不到"),而是通过系统性的模式识别来弥补天赋的不足。

五、Waymo的两面:工程师天堂与缺失的Founder

2019年1月加入Waymo,工作两年(至2020年下半年)。高继扬对Waymo的评价呈现出鲜明的两面性。

VectorNet:在Waymo的标志性工作

高继扬与赵航在Waymo的第一次合作——用图神经网络+Self-Attention处理向量化地图做预测,取代之前将地图渲染成图片再用卷积网络处理的方式。这个工作后来被很多公司采用。

高继扬 谈赵航
赵航更愿意从原理层面去想清楚这个事应该是怎么回事。我更从问题的角度,看解决这个问题最有效的方法应该是啥。一个是供给侧思考,一个是需求侧思考。

Waymo的两个问题

问题一:大公司病

  • 进去时约1000人,走时快2000人
  • 职级体系、工程体系、文化全部对齐Google
  • 当时硅谷还是"peace and love"状态
  • 有四五点下班接孩子的人
  • "还没做出价值,已经是大公司状态"

问题二:没有Founder

  • Waymo的founder本质上是Google的founder
  • 但Google founder没时间直接管
  • "自上而下的力量是缺失的"
  • 不像特斯拉——马斯克说干啥,哪怕是错了也能开始干
  • "怕的不是犯错,怕的是力量不集中不统一"

假设Waymo有一个更强势的Founder

高继扬认为应该在2018年那个时间点"另起一个team,从头开始做AI native的架构"——用一套infra、一套评测体系,但整个架构要AI native地重新设计。这个判断与他后来在星海图坚持"端到端、数据驱动"一脉相承。值得注意的是,他对Waymo的批评不是技术层面的("Waymo的工程化基因和特斯拉一样强"),而是方法论层面的——Robotics主导 vs AI native。

六、Robotics vs AI Native:自动驾驶十年技术路线之争

高继扬在加入Waymo后做了一件少有人做的事:读完了Waymo的整个codebase和历史代码,同时回溯了2008年以来的自动驾驶论文。他发现了一个关键事实。

核心发现

2018年的技术架构与2008年没有本质区别

2008年的DARPA Challenge论文已经定义了:感知 → 定位 → 离线建图 → 规划(决策→规划→控制)这一框架。十年间,AI只是替换了框架内的模块(如将激光雷达的聚类检测替换为神经网络推理),但整体架构的底层逻辑仍然是Robotics的——模块拆分、关注corner case。

Robotics方法论

  • 系统拆分为可解释的模块
  • 关注corner case
  • 感知中有几十个模型各司其职
  • Waymo代表:感知几十个模型 + 传统规划算法

AI Native方法论

  • 追求端到端
  • 数据驱动
  • 不擅长解决单个case,擅长整体benchmark提升
  • Tesla代表:一个模型解决所有感知问题
自动驾驶技术路线演变(2008-2026)
高继扬
在leader这个层面不一样。工程师层面Waymo当时的人才密度非常高,都是很好的工程师。但我觉得还是自上而下的一些东西缺失了。

对Waymo商业模式的判断

四种自动驾驶商业模式

  • 模式一·RoboTaxi(Waymo):自己运营车队,提供服务收费——"已经接近走通的边缘"
  • 模式二·车企(Tesla):卖车 + 软件订阅
  • 模式三·供应商(Momenta):NRE + License向车企提供解决方案
  • 模式四·介于车企和供应商之间华为):通过顶级智驾+座舱体验重新定义车,营收建立在整车层面

高继扬亲自去洛杉矶体验了Waymo,评价"体验特别好,已经比大部分Uber好得多"。但他强调Waymo的区别不在于工程能力不足,而在于"对待AI的态度以及面向AI驱动的整体系统设计的调整速度和力度"

七、Momenta的鲶鱼:量产文化与极致的卷

2020年底加入Momenta,工作两年。高继扬被当作一条鲶鱼引入——频繁转战多个模块和产品线。

为什么选择Momenta而非华为

鲶鱼的转战路径

高继扬在Momenta的岗位轮转极为频繁,每次转战都是因为要把rule-based的模块替换为deep learning

感知

入职后第一个岗位

定位 + 泊车系统

将定位从传统方法转为神经网络驱动

Infra

与定位同期进行

规控

将规控从rule-based转为deep learning

高速高架NOA量产

最后一个任务——做成产品,交付上汽

高继扬
我收获的最大能力不是解决规控问题或者产品问题,而是——我可以很快速进入一个不熟悉的领域,用一套固定的方法论去理解、拆解,然后人事匹配,过程中监控、测量、反馈好就扩大、不好就收缩调整。

Momenta第一次量产交付的挑战

两个"第一次"

  • 第一次把demo级东西变成产品级
  • 第一次向大客户(上汽)交付完成服务
  • 组织架构不是面向量产设计的,团队能力战也没有匹配到强度
  • 频繁的组织调整、主动和被动的淘汰、人员流动很大
  • "不通过打仗这样的形式你是没法洗礼锻炼团队的"

对曹旭东的评价

高继扬
旭东最强的点——战略能力特别好。那么早的时间点就判断出我们要做量产自动驾驶,然后通过飞轮走向RoboTaxi,一直坚定地去推动,过程中有波折也不动摇。

八、Waymo与Momenta:两极文化的训练

高继扬的两段工作经历恰好是两种极端文化的对照。他从两种文化中各取所需,为创业完成了能力训练。

Waymo·工程师天堂

  • 最好的infra,最好的同事
  • 领导对你的support非常温暖宽厚
  • 目标有但不push
  • 待遇不错,Google园区食堂
  • 学到:自动驾驶整套系统如何work(端侧+云侧+历史沿革),工程师思维(拆解+测量)

Momenta·战场

  • 绝对的结果导向
  • 核心算法团队到12点,一周6天打底
  • 总监以上直接面对客户,"骂就骂了"
  • 被客户骂是常态——"你做的不好我马上淘汰掉你"
  • 学到:以客户为中心,快速进入陌生领域的方法论,真实世界的商业残酷性

"以客户为中心"的深度理解

高继扬在Momenta学到的最底层变化是理解了什么叫"以客户为中心"。他的定义超越了简单的"客户说什么做什么":站在客户角度看需求,甚至帮助客户挖掘需求,提出更好的方案。而且这个原则不只是公司对外——公司内部,上游面向下游、支持团队面向业务团队,也是以客户为中心。他明确指出"以自我成长为中心"和"以技术领先性为中心"对于做企业来说都是错误的

高继扬
从自我感受来说,Momenta和整个中国智驾的环境都不是好的。但从成长性来说,在中国智驾环境里面对工程师的综合能力训练又是更好的。它可以让你看到这个世界真实的状态。

九、创业的起点:放弃千万美金与整机信仰

2022年底,高继扬30岁。三个变化交织在一起促成了创业决定。

~$1000万
放弃的Momenta期权
30岁
创业时的年龄
3人
初始创始团队

三个促成创业的变量

时机判断

  • 变量一GPT-3和InstructGPT出现,"整个社会再一次相信AI了"——"只有我们相信不重要,还得有更多的人来相信,才有资金进来"
  • 变量二:量产自动驾驶让端侧智能成为可能——传感器和端侧算力已经Ready,机器人用的和智驾的"大差不差"
  • 变量三:Tesla正式宣布做人形机器人——行业要素齐备

为什么必须做整机

这是高继扬被投资人反复质疑的问题——"你们不是AI团队吗,为什么天天搞整机?"他的推导:

战略推导

整机信仰的两层逻辑

长期逻辑:具身智能的长期壁垒建立在物理世界的数据闭环之上。要构建数据闭环,必须有数据载体——就是整机。中短期逻辑:商品不是一个算法或大脑,而是整机+智能形成的、在物理世界有执行能力的物理实体。两层逻辑都倒推回同一个结论:必须做整机。

高继扬
我从Momenta出来创业,放弃了所有的期权,全部放弃了。一千万美金可能是有的吧。我想去做的那件事和这些钱比起来——其他这些东西价值不大。

起点有多低

十、星海图的战略演进:从配送到开发者市场

星海图的战略经历了一次关键的早期转向,以及一套清晰的市场渐进路径。

战略转向时间线

2023年8月·天使轮

IDG领投,百度风投、金沙江参投。共3000万人民币,估值约2亿人民币。方向是末端配送。

2024年1月·加轮 CFUN

投后估值约3-4亿。杨泽义加入,开始做整机和供应链。

2024年3月·战略转向

发现配送"太早了"——整机不成熟、供应链没有、智能不Ready、客户不成熟、市场不在。切换到轮式双臂构型,聚焦操作,切入开发者市场

2025年·数据与智能年

8月全国第一个做500小时高质量遥操作数据开源和基础模型开源。获得150多个全球开发者客户。

2026年·场景与应用年

重心转向从开发者市场走向生产力市场。1月发布全球首个开箱即用的G-LINK Plus。估值达到100亿人民币。

开发者市场的金字塔

市场分层逻辑

  • 塔尖·学术型开发者李飞飞、美国顶尖大学的研究员和PhD
  • 企业内研究型开发者:大厂做前沿研究的团队(如蚂蚁LingBoat VLA合作)
  • 生产力型开发者:面向企业应用、面向落地的二次开发者
  • 集成商:未来产品更成熟时的新开发者层
  • 终端使用者:最终的消费方

高继扬将这比喻为"跨越鸿沟"中的路径:Innovator → Early Adopter → Early Majority。类比案例:苹果Macintosh(极客→设计师→办公)、拓竹3D打印机(极客玩具→企业必备→家庭购买)。

为什么选择轮式而非人形

高继扬
双足的运动控制和双臂的智能操作同时解决,这叫Loco-Manipulation——到今天这个问题也没有解决。我们得先解耦,先把上肢操作好。

核心原则是"智能定义本体"——从智能的需求出发看本体应该怎么做。聚焦操作 → 双臂是重点 → 双足反而给智能演进带来困难 → 轮式就够了。

十一、数据之争:真实数据的成本账

高继扬对数据问题的思考极为具体——他不只谈方向,还算账。这是整个访谈中信息密度最高的段落之一。

为什么坚持真实数据为主

从自动驾驶带来的Lesson

  • 底层原理:要解决的问题在某个Domain里,训练数据最好也在这个Domain里。Domain Transfer方向曾经很火,"后来大家渐渐做的少了,因为发现还是得用那个Domain里面的数据"
  • 自动驾驶验证:99.9%的问题都是靠真实数据/录测数据解决的
  • 仿真的Sim-to-Real Gap:基于图形学渲染的仿真"gap还是很大的"

真实数据的成本算术

200-250元
每小时真实数据获取成本
250万
1万小时数据总成本
2500万
10万小时数据总成本
1:5~1:10
数据获取与训练成本之比

成本构成:获取1小时真实数据需要3-4小时人工(机器人需要复位、setup等)+ 机器人折旧(约10万元/台,寿命约1000小时,折旧100元/小时)。10万小时数据约等于一个人从出生到18岁与物理世界交互的总时长。

具身智能价值链条:各环节传播周期

智能总成本的隐藏逻辑

高继扬指出一个被忽视的成本关系:数据获取和训练的成本比是1:5到1:10。这意味着如果数据质量低,大量资金会浪费在训练环节。因此"贵"与"便宜"不能只看获取成本,要看智能的总成本(数据+训练+工程师)。仿真数据虽然获取便宜,但如果Sim-to-Real Gap导致训练效率低下,总成本可能更高。

数据金字塔:不是预设的,是试出来的

高继扬
数据金字塔是对的,但谁说数据金字塔非得长成那样、非得是那个比例?数据金字塔的定义应当来自于智能的需求。AI归根结底还是实验科学——得试出来。

星海图目前使用的数据类型包括:Robot-centric data(真机遥操作)、Human-centric data(如5米、Sunday手套采集、POV数据)、第三方视角互联网视频、仿真数据。但具体的Data Recipe"坦率来说此刻在训练的模型的recipe我也不是特别清楚"——这是赵航团队在负责的。

十二、VLA双系统与大脑架构

高继扬详细解释了星海图的"大脑"架构设计,以及为什么不做端到端。

核心架构

双系统:VLM + VLA

VLM(多模态语言模型):做上层的指令拆解和逻辑思考。将模糊指令拆解为若干个可执行的任务。VLA(视觉-语言-动作模型):动作基础模型,输入Vision和Language,产生Action,驱动本体执行任务。两个模型组合构成"双系统"。

为什么不做完全端到端

端侧算力的硬约束

  • 最终落地时端侧算力有限——不可能放一个几十B甚至上百B的推理模型
  • VLM的推理部分必须在服务器上
  • VLA(执行动作的模型)必须在端侧——如果放云上,延时问题"大概解决不好"
  • 很多工商业场景只有二三十个动作,直接调用VLA的语言接口就够了,不需要VLM
  • VLM真正重要的场景是更通用的环境(如家庭)

供给侧三个顶层指标

指标含义当前水平
速度基础模型驱动的操作速度基于模仿学习大概率不超过人,80%-90%人类速度
精度操作精度厘米级别(毫米级是下一步)
泛化性多少新增数据解决一个新问题抓取已做到零样本泛化;折叠部分衣物可以,其他还需重新学习

Demo的四个阶段

从视频到真实世界

  • Demo in the Video:视频里的演示——"这样的东西很多"
  • Demo in the Office:在公司办公室现场给你做demo
  • Demo in the World:在任何地方都能做部署。星海图的万物抓取已达到此阶段——"你随便从兜里掏一个东西放在桌子上,都能给你拣起来"
  • Application:真正的应用落地——这是2026年的重点

生产力场景的筛选标准

高继扬定义了五类基本动作:Carry(搬)、Pick(拿)、Pack(包)、Fold(叠)、Operate(操作设备)。几乎所有现实世界的劳动者都是这五类动作的组合,且每个岗位涉及的动作组合不超过20-40个。筛选好场景的标准:速度不要求太高、失效成本不要太高、有爆发力(做完一个很快到一万台)、全球化市场、不同国家场景统一。目前看好仓储物流的Bin Picking智能制造的场内物流

十三、许华哲的离开:务实创新与算法传播周期

访谈录制时,星海图联合创始人许华哲即将离职创业。高继扬对此事的回应坦率但克制,背后的逻辑链条值得深入分析。

高继扬
我们到底是要做一个务实创新、layout客户价值、一步一步来,还是说要更多去做一些超前的创新——之间要有一个balance。

事件时间线

调整过程

  • 2025年8月:内部基本完成调整——赵航统一管理基础模型团队
  • 赵航统一管理后"取得了很多进展",包括2026年1月的G-LINK Plus
  • 许华哲转向探索2C家庭应用方向
  • 星海图将投资许华哲的新一轮创业

算法传播周期的残酷现实

高继扬给出了一个极具杀伤力的分析框架——用"传播周期"来衡量各个要素的壁垒高低:

价值链要素传播周期壁垒评估
整机与供应链12-18个月高——新产品研发需要这么长时间
数据体系整机基础上再加6-12个月高——依赖整机构建闭环
客户与渠道轮回起步,大客户时间更长中高——线下关系无法快速复制
算法2-3个月——论文开源,第一梯队团队可快速追赶

算法投入大但壁垒小——创业公司的ROI困境

这是高继扬对许华哲离开的底层解释框架:算法创新投入非常大,但在开源和论文驱动的时代,传播周期只有2-3个月——"投入大但壁垒小"。因此星海图的价值观是"务实创新"——不是不做创新,而是"学会用更聪明的方法、更有ROI的方式去做创新"。理想主义不能变成空想,"理想主义能够实现的基础是我们每天都要去算ROI"。

高继扬
邵青离开Momenta和华哲离开星海图——对于星海图来说这是一个长期来看绝对利好的一件事。我特别在公司里面强调价值观,价值观底层是面对取舍时怎么选择、面对利益分配时分给谁不分给谁。

十四、从3000万到100亿:融资与组织的膨胀

30x
两年估值增长
~20x
组织规模增长(十几人→200人)
150+
全球开发者客户数
6家
老股东Pro-Rata跟投

融资历程

轮次时间金额估值投资人
天使轮20233000万人民币~2亿人民币IDG领投,百度风投,金沙江
加轮2024年初~2000万人民币~3-4亿人民币CFUN(清华电子系背景基金)
后续轮次2024-2025持续融资持续上升多轮,"比较顺"
最新一轮2026年初-~100亿人民币吉利、北汽、振兴金鼎等产业方 + 6家老股东Pro-Rata

合伙人机制

高继扬从Day 1就建立了持续引入合伙人的机制。原始股按百分点给予。目前的合伙人团队:

高继扬
我要求我自己做一个中等面积六边形,然后我希望我的合伙人团队做更大面积、组成一个更大面积六边形。这样我们这个团队就会变得很强,而且很均衡的强。

组织挑战

两个核心难题

  • 成长速度匹配:公司做的事的难度、复杂度和scope在急速扩张,已有团队(包括创始人)能不能跟上?能不能及时引进更牛的人?
  • 两个Domain的文化冲突:整机/供应链强调流程、体系、纪律性;智能强调人才密度、创新——"天然的会有一些组织上的难度"

行业排位与竞争

高继扬估计星海图在中国具身智能公司中按估值排名约第五(保守估计),前面有智元、银河、宇树等。他对同行的评价非常坦率:

十五、启示与延伸思考

1. "归纳总结"是一种被低估的元能力

高继扬从物理竞赛到博士论文到工程实践,一以贯之的核心方法就是归纳总结——不依赖天赋灵感,而是通过模式识别、分类和系统化来降低不确定性。他的论文"三种套路"分类法、对自动驾驶十年架构的"Robotics vs AI Native"二分法、对价值链的"传播周期"分析,全部是同一种思维方式的应用。这与他自评"不是天才,见过真正有天赋的人"形成闭环——归纳总结正是非天才型创业者的最优策略。

2. Waymo和Momenta是同一个问题的两个极端回答

Waymo的问题是力量不集中——没有Founder,自上而下缺失,调整缓慢。Momenta的优势恰好在此——曹旭东足够强势,战略坚定,极致push。但两者共享一个更深层的问题:都是在已有的Robotics框架上做AI替换,而非从底层AI Native地重新设计。高继扬在两家公司分别学到了"系统如何work"和"如何在真实世界拿到结果",然后在星海图试图将两者结合——用AI Native的方法论加上Momenta式的执行力。

3. "算法传播周期2-3个月"是具身智能竞争的关键判断

这个数字解释了为什么高继扬把整机和数据视为核心壁垒而非算法。如果算法的壁垒窗口只有2-3个月(论文+开源即可追赶),那么在算法上做大量超前投入的ROI极低。真正的护城河在传播周期12-18个月的整机和供应链,以及在此基础上再加6-12个月的数据体系。许华哲的离开本质上是这个框架下的必然结果。

4. 真实数据每小时200-250元是一个值得记住的基准数字

高继扬给出的数据成本算术极为具体:10万小时=2500万人民币=人类0-18岁的物理世界交互量。关键的隐藏逻辑是数据获取与训练的1:5到1:10成本比——这意味着低质量数据不只是浪费获取成本,更是在浪费5-10倍的训练成本。这个比例关系解释了为什么他坚持真实数据优先,也解释了为什么他说"不懂模型就没法定义好的数据体系"。

5. "机器人行业不允许浪漫主义的人存在"

小骏在访谈开头表达了一个疑惑:为什么中国具身智能产业里没有出现像梁文峰、杨植麟这样带着技术浪漫主义色彩的人。高继扬的回答直接而残酷:"如果有这样的人存在可能他会有很大的suffering"。原因是链条太长——供应链、整机、数据、模型、渠道、客户,"你就要把你的头伸到土里去"。这与纯数字AI创业形成鲜明对比——后者不用操心供应链和线下客户,可以安心做模型和社媒传播。具身智能的物理属性决定了它只能容纳"狼"——既要有理想主义,又要每天务实地算ROI。

6. 星海图的特斯拉路线与非特斯拉困境

高继扬明确承认星海图走的是特斯拉路线:自己做整机+数据采集+端到端模型。但有一个关键区别:特斯拉的汽车本身有需求,汽车本身能卖出去;而"机器人本身卖不出去"——这是整个商业模式的最大风险点。这解释了为什么高继扬如此强调"以客户为中心"和"务实创新"——在产品还不能直接创造消费者价值的阶段,必须通过开发者市场建立价值闭环,而不能像特斯拉那样直接走消费者路线。

7. 一个值得追踪的预测:生产力场景万台出货量

高继扬被问到"基于当下认知一个关键的重要的bet是什么"时,回答是:在生产力场景做出万台的出货量。这是一个可验证、可追踪的具体目标。结合他对具体场景的分析(仓储Bin Picking、智能制造场内物流),以及供给侧三个指标(速度80-90%人类、厘米级精度、抓取零样本泛化),这个目标的实现时间和路径将是衡量具身智能行业拐点的关键信号。

延伸阅读