高继扬,1992年生,河北石家庄人。小骏在开场中说他是"极致的浪漫主义的反面",代表了一种极致的效率、工程拆解与实用主义。三小时的访谈证实了这个判断——高继扬是一个把"归纳总结"贯穿人生每一个阶段的人。
高继扬的成长轨迹呈现出一个有趣的模式:间歇性勤奋——他会在意识到某个阶段重要时突击发力,然后在不重要的阶段放松。
成绩班级前五到前十,学过奥赛但不算出色,"过得比较轻松"。
准备初一分班考试,"考试生涯第一次还不错",年级第三名。之后初一初二又恢复平常,年级几十名。
学物理竞赛,靠勤奋而非天赋。"别人刷一遍的题我刷两遍,别人刷两遍的我刷四遍。"最终全国二等奖,保送清华电子工程系。
成绩百分之三四十,"谈不上TOP"。大二大三就确定要创业,但认为移动互联网不是自己这代人的机会——"太年轻了,啥也不懂啥也不会"。
高继扬的勤奋不是持续的,而是目标驱动的——只有当他识别到"这个时间段对我很重要"时才全力投入。这种模式在大学毕业后发生了根本改变:"目标感更强了",从此一直保持高强度工作状态。这暗示他的勤奋本质是一种资源分配策略,而非性格特质。
大四申请博士时,高继扬遭遇了第一次真正的挫折。暑期在三藩实习后,导师没有给他写强推信,导致大部分想去的学校都没能申上。这次打击成为他思想转变的转折点。
高继扬将自己申请学校失败类比为曾国藩发现清流路线走不通。关键推导:学术这条路不是最优路径 → 创业是终极目标 → 需要从底层思考方向 → 需要为创业做系统性准备。这个框架后来贯穿了他从商汤到Waymo到Momenta的每一次职业选择。
大四时,汤晓鸥在清华的一个小范围交流给了高继扬接触深度学习的机会。他此前从未接触过神经网络,但商汤给了他一个实习机会。
高继扬此后系统性地看了各种方向,最终确定了一个核心筛选标准:AI必须是这个行业最底层的变量——没有AI这个行业不存在,有AI这个行业才成立。据此他排除了广告("没有AI这事也成立")、云("不是很本质")、商汤式的泛AI+("可能形成不了自己的产品"),最终选择了自动驾驶/物理世界AI。
高继扬在UC读CV方向博士,用三年半完成(正常五到六年),核心方法还是归纳总结。
几乎所有论文都能往这三类上套。高继扬在三类中做选择,同时增加投稿量提高命中概率——"别人一次投一篇,我投两篇"。
高继扬的逻辑链条极为清晰:读博是为创业做训练 → 训练时间越短越好 → 目标四年 → 需要4-5篇顶会 → 第一年就要开始投稿 → 排好时间表 → idea比带宽多就分享给同学合作发 → 三年时发现"差不多了" → 导师同意提前毕业。
物理竞赛靠归纳题型映射考点,博士靠归纳论文三类套路,后来在Waymo读codebase归纳系统演变逻辑,在Momenta归纳工程师思维为"拆解+测量"。高继扬不是那种能"想到解法"的天才(他自己承认物理竞赛时"有些解法我就想不到"),而是通过系统性的模式识别来弥补天赋的不足。
2019年1月加入Waymo,工作两年(至2020年下半年)。高继扬对Waymo的评价呈现出鲜明的两面性。
高继扬与赵航在Waymo的第一次合作——用图神经网络+Self-Attention处理向量化地图做预测,取代之前将地图渲染成图片再用卷积网络处理的方式。这个工作后来被很多公司采用。
高继扬认为应该在2018年那个时间点"另起一个team,从头开始做AI native的架构"——用一套infra、一套评测体系,但整个架构要AI native地重新设计。这个判断与他后来在星海图坚持"端到端、数据驱动"一脉相承。值得注意的是,他对Waymo的批评不是技术层面的("Waymo的工程化基因和特斯拉一样强"),而是方法论层面的——Robotics主导 vs AI native。
高继扬在加入Waymo后做了一件少有人做的事:读完了Waymo的整个codebase和历史代码,同时回溯了2008年以来的自动驾驶论文。他发现了一个关键事实。
2008年的DARPA Challenge论文已经定义了:感知 → 定位 → 离线建图 → 规划(决策→规划→控制)这一框架。十年间,AI只是替换了框架内的模块(如将激光雷达的聚类检测替换为神经网络推理),但整体架构的底层逻辑仍然是Robotics的——模块拆分、关注corner case。
2020年底加入Momenta,工作两年。高继扬被当作一条鲶鱼引入——频繁转战多个模块和产品线。
高继扬在Momenta的岗位轮转极为频繁,每次转战都是因为要把rule-based的模块替换为deep learning:
入职后第一个岗位
将定位从传统方法转为神经网络驱动
与定位同期进行
将规控从rule-based转为deep learning
最后一个任务——做成产品,交付上汽
高继扬的两段工作经历恰好是两种极端文化的对照。他从两种文化中各取所需,为创业完成了能力训练。
高继扬在Momenta学到的最底层变化是理解了什么叫"以客户为中心"。他的定义超越了简单的"客户说什么做什么":站在客户角度看需求,甚至帮助客户挖掘需求,提出更好的方案。而且这个原则不只是公司对外——公司内部,上游面向下游、支持团队面向业务团队,也是以客户为中心。他明确指出"以自我成长为中心"和"以技术领先性为中心"对于做企业来说都是错误的。
2022年底,高继扬30岁。三个变化交织在一起促成了创业决定。
这是高继扬被投资人反复质疑的问题——"你们不是AI团队吗,为什么天天搞整机?"他的推导:
长期逻辑:具身智能的长期壁垒建立在物理世界的数据闭环之上。要构建数据闭环,必须有数据载体——就是整机。中短期逻辑:商品不是一个算法或大脑,而是整机+智能形成的、在物理世界有执行能力的物理实体。两层逻辑都倒推回同一个结论:必须做整机。
星海图的战略经历了一次关键的早期转向,以及一套清晰的市场渐进路径。
IDG领投,百度风投、金沙江参投。共3000万人民币,估值约2亿人民币。方向是末端配送。
投后估值约3-4亿。杨泽义加入,开始做整机和供应链。
发现配送"太早了"——整机不成熟、供应链没有、智能不Ready、客户不成熟、市场不在。切换到轮式双臂构型,聚焦操作,切入开发者市场。
8月全国第一个做500小时高质量遥操作数据开源和基础模型开源。获得150多个全球开发者客户。
重心转向从开发者市场走向生产力市场。1月发布全球首个开箱即用的G-LINK Plus。估值达到100亿人民币。
高继扬将这比喻为"跨越鸿沟"中的路径:Innovator → Early Adopter → Early Majority。类比案例:苹果Macintosh(极客→设计师→办公)、拓竹3D打印机(极客玩具→企业必备→家庭购买)。
核心原则是"智能定义本体"——从智能的需求出发看本体应该怎么做。聚焦操作 → 双臂是重点 → 双足反而给智能演进带来困难 → 轮式就够了。
高继扬对数据问题的思考极为具体——他不只谈方向,还算账。这是整个访谈中信息密度最高的段落之一。
成本构成:获取1小时真实数据需要3-4小时人工(机器人需要复位、setup等)+ 机器人折旧(约10万元/台,寿命约1000小时,折旧100元/小时)。10万小时数据约等于一个人从出生到18岁与物理世界交互的总时长。
高继扬指出一个被忽视的成本关系:数据获取和训练的成本比是1:5到1:10。这意味着如果数据质量低,大量资金会浪费在训练环节。因此"贵"与"便宜"不能只看获取成本,要看智能的总成本(数据+训练+工程师)。仿真数据虽然获取便宜,但如果Sim-to-Real Gap导致训练效率低下,总成本可能更高。
星海图目前使用的数据类型包括:Robot-centric data(真机遥操作)、Human-centric data(如5米、Sunday手套采集、POV数据)、第三方视角互联网视频、仿真数据。但具体的Data Recipe"坦率来说此刻在训练的模型的recipe我也不是特别清楚"——这是赵航团队在负责的。
高继扬详细解释了星海图的"大脑"架构设计,以及为什么不做端到端。
VLM(多模态语言模型):做上层的指令拆解和逻辑思考。将模糊指令拆解为若干个可执行的任务。VLA(视觉-语言-动作模型):动作基础模型,输入Vision和Language,产生Action,驱动本体执行任务。两个模型组合构成"双系统"。
| 指标 | 含义 | 当前水平 |
|---|---|---|
| 速度 | 基础模型驱动的操作速度 | 基于模仿学习大概率不超过人,80%-90%人类速度 |
| 精度 | 操作精度 | 厘米级别(毫米级是下一步) |
| 泛化性 | 多少新增数据解决一个新问题 | 抓取已做到零样本泛化;折叠部分衣物可以,其他还需重新学习 |
高继扬定义了五类基本动作:Carry(搬)、Pick(拿)、Pack(包)、Fold(叠)、Operate(操作设备)。几乎所有现实世界的劳动者都是这五类动作的组合,且每个岗位涉及的动作组合不超过20-40个。筛选好场景的标准:速度不要求太高、失效成本不要太高、有爆发力(做完一个很快到一万台)、全球化市场、不同国家场景统一。目前看好仓储物流的Bin Picking和智能制造的场内物流。
访谈录制时,星海图联合创始人许华哲即将离职创业。高继扬对此事的回应坦率但克制,背后的逻辑链条值得深入分析。
高继扬给出了一个极具杀伤力的分析框架——用"传播周期"来衡量各个要素的壁垒高低:
| 价值链要素 | 传播周期 | 壁垒评估 |
|---|---|---|
| 整机与供应链 | 12-18个月 | 高——新产品研发需要这么长时间 |
| 数据体系 | 整机基础上再加6-12个月 | 高——依赖整机构建闭环 |
| 客户与渠道 | 轮回起步,大客户时间更长 | 中高——线下关系无法快速复制 |
| 算法 | 2-3个月 | 低——论文开源,第一梯队团队可快速追赶 |
这是高继扬对许华哲离开的底层解释框架:算法创新投入非常大,但在开源和论文驱动的时代,传播周期只有2-3个月——"投入大但壁垒小"。因此星海图的价值观是"务实创新"——不是不做创新,而是"学会用更聪明的方法、更有ROI的方式去做创新"。理想主义不能变成空想,"理想主义能够实现的基础是我们每天都要去算ROI"。
| 轮次 | 时间 | 金额 | 估值 | 投资人 |
|---|---|---|---|---|
| 天使轮 | 2023 | 3000万人民币 | ~2亿人民币 | IDG领投,百度风投,金沙江 |
| 加轮 | 2024年初 | ~2000万人民币 | ~3-4亿人民币 | CFUN(清华电子系背景基金) |
| 后续轮次 | 2024-2025 | 持续融资 | 持续上升 | 多轮,"比较顺" |
| 最新一轮 | 2026年初 | - | ~100亿人民币 | 吉利、北汽、振兴金鼎等产业方 + 6家老股东Pro-Rata |
高继扬从Day 1就建立了持续引入合伙人的机制。原始股按百分点给予。目前的合伙人团队:
高继扬估计星海图在中国具身智能公司中按估值排名约第五(保守估计),前面有智元、银河、宇树等。他对同行的评价非常坦率:
高继扬从物理竞赛到博士论文到工程实践,一以贯之的核心方法就是归纳总结——不依赖天赋灵感,而是通过模式识别、分类和系统化来降低不确定性。他的论文"三种套路"分类法、对自动驾驶十年架构的"Robotics vs AI Native"二分法、对价值链的"传播周期"分析,全部是同一种思维方式的应用。这与他自评"不是天才,见过真正有天赋的人"形成闭环——归纳总结正是非天才型创业者的最优策略。
Waymo的问题是力量不集中——没有Founder,自上而下缺失,调整缓慢。Momenta的优势恰好在此——曹旭东足够强势,战略坚定,极致push。但两者共享一个更深层的问题:都是在已有的Robotics框架上做AI替换,而非从底层AI Native地重新设计。高继扬在两家公司分别学到了"系统如何work"和"如何在真实世界拿到结果",然后在星海图试图将两者结合——用AI Native的方法论加上Momenta式的执行力。
这个数字解释了为什么高继扬把整机和数据视为核心壁垒而非算法。如果算法的壁垒窗口只有2-3个月(论文+开源即可追赶),那么在算法上做大量超前投入的ROI极低。真正的护城河在传播周期12-18个月的整机和供应链,以及在此基础上再加6-12个月的数据体系。许华哲的离开本质上是这个框架下的必然结果。
高继扬给出的数据成本算术极为具体:10万小时=2500万人民币=人类0-18岁的物理世界交互量。关键的隐藏逻辑是数据获取与训练的1:5到1:10成本比——这意味着低质量数据不只是浪费获取成本,更是在浪费5-10倍的训练成本。这个比例关系解释了为什么他坚持真实数据优先,也解释了为什么他说"不懂模型就没法定义好的数据体系"。
小骏在访谈开头表达了一个疑惑:为什么中国具身智能产业里没有出现像梁文峰、杨植麟这样带着技术浪漫主义色彩的人。高继扬的回答直接而残酷:"如果有这样的人存在可能他会有很大的suffering"。原因是链条太长——供应链、整机、数据、模型、渠道、客户,"你就要把你的头伸到土里去"。这与纯数字AI创业形成鲜明对比——后者不用操心供应链和线下客户,可以安心做模型和社媒传播。具身智能的物理属性决定了它只能容纳"狼"——既要有理想主义,又要每天务实地算ROI。
高继扬明确承认星海图走的是特斯拉路线:自己做整机+数据采集+端到端模型。但有一个关键区别:特斯拉的汽车本身有需求,汽车本身能卖出去;而"机器人本身卖不出去"——这是整个商业模式的最大风险点。这解释了为什么高继扬如此强调"以客户为中心"和"务实创新"——在产品还不能直接创造消费者价值的阶段,必须通过开发者市场建立价值闭环,而不能像特斯拉那样直接走消费者路线。
高继扬被问到"基于当下认知一个关键的重要的bet是什么"时,回答是:在生产力场景做出万台的出货量。这是一个可验证、可追踪的具体目标。结合他对具体场景的分析(仓储Bin Picking、智能制造场内物流),以及供给侧三个指标(速度80-90%人类、厘米级精度、抓取零样本泛化),这个目标的实现时间和路径将是衡量具身智能行业拐点的关键信号。