← 返回张小珺主页
深度研究 Deep Dive

马斯克、机器人恐怖谷和《西部世界》

#2 和蓝池创投合伙人曹巍的深度对话
2022.9 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 特斯拉擎天柱:为何是现在
  2. 步态控制:50年技术积累的分水岭
  3. 精细化控制:从搬箱子到穿针引线
  4. 场景决定形态:人形不是万能解
  5. 什么场景必须人形
  6. 恐怖谷效应:人形机器人的创新陷阱
  7. 价格与消费者意愿的悖论
  8. 马斯克的终极蓝图:西部世界与智慧永存
  9. 机器人赛道全景:工业、服务与特种
  10. 送餐机器人的"过道经济学"
  11. 软体机器人:下一代形态革命
  12. 中国机器人产业:无与伦比的机遇
  13. 波士顿动力启示录:从极客到商业化
  14. 技术周期与投资节奏
  15. 负外部性:当人不再需要人
  16. 关键数据汇总

一、特斯拉擎天柱:为何是现在

2022年9月30日,马斯克即将发布名为"擎天柱"(Optimus)的人形机器人。蓝池创投合伙人曹巍从投资人的角度解读了这个时间点的关键意义:人形机器人并非全新概念,但经过半个世纪的技术积累,此刻的时间窗口终于打开。

曹巍
人形机器人本身它的技术线的基础其实过去就有的。我们说特斯拉推这个人形机器人,大概很关注的一点是——为什么是现在。

特斯拉的技术复用逻辑

曹巍指出,特斯拉做人形机器人并非从零开始,而是大量复用其自动驾驶技术栈:

技术窗口的判断逻辑

曹巍认为特斯拉选择此时入局的核心原因并非单一技术突破,而是步态控制的半世纪积累自动驾驶视觉感知技术栈两条线在此刻产生了交汇。如果10年前或20年前,没有波士顿动力打下的研究基础,这不会是一个好的timing。

二、步态控制:50年技术积累的分水岭

曹巍从日本早稻田大学上世纪60年代末开始的研究讲起,梳理了人形机器人步态控制的演进脉络。

1960s-1970s 早稻田大学

最早的人形机器人研究,步态缓慢平稳,节律和运动控制处于基础阶段。

波士顿动力时代

运动节拍和速度进入"看起来真的跟人很像"的状态,实现双足快速敏捷移动。

AI+视觉感知融合

基于CNN、深度学习的SLAM(实时定位与建图)能力让机器人从导轨时代进入自主移动时代。

2022年 特斯拉 Optimus

将自动驾驶技术栈与步态控制结合,推出首款人形机器人原型。

移动方式的难度阶梯

移动方式难度典型应用
轮式最易送餐小车、AGV
履带式较易特种作业、军事
四足较难波士顿动力Spot
双足最难人形机器人
技术概念

机器人能力的代际划分

第一代际:实现双足敏捷快速行走,在复杂环境中定位导航且不丢失位置。第二代际:在移动基础上叠加环境感知、决策、控制与交互能力,成为真正的智能体。每个代际的跨越都需要底层技术的重大突破。

曹巍
光是步态这个点,前后就有将近40年到50年的研究周期。

三、精细化控制:从搬箱子到穿针引线

曹巍将机器人的能力谱系比作一条从粗颗粒度到精细颗粒度的光谱。当前技术的核心瓶颈在于——精细化控制到底能精细到什么程度

粗颗粒度任务(当前可实现)

  • 搬箱子(波士顿动力主要演示)
  • 从一个桌面搬到另一个桌面
  • 大范围、不需精准对齐的操作
  • 跟随陪伴、拎包

精细颗粒度任务(远期目标)

  • 穿针引线、绣花
  • 剥鸡蛋、剥小龙虾
  • 安装弹性物品
  • 铺床单、收拾零碎物品
  • 切西瓜
人形机器人精细化控制能力预测

精细化控制的三重技术挑战

精细控制远不只是机械手指的问题。曹巍指出它需要三个维度的同步突破:(1) 力控传感器——模拟人的皮肤和触觉系统,六维传感器、电磁环、特殊材质各路团队在做但均处于早期;(2) 视觉分辨率——特斯拉自动驾驶摄像头分辨率对精细任务远远不够;(3) 多维感知融合——人通过视觉、声音、触觉、嗅觉等多维感知环境,当前任何公司在这方面都做得非常基础。

曹巍
你不可能9月份发个机器人,这机器人会绣花,往那里坐拿个针就直接绣个花出来。我估计第一版第二版也可能就是20%、30%。

特斯拉的不可沿袭之处

虽然自动驾驶的芯片、算法、感知技术可以复用,但精细力控和高分辨率视觉是自动驾驶中用不到的能力。这意味着特斯拉需要在这些方面从头构建,而非简单迁移。

四、场景决定形态:人形不是万能解

曹巍强烈批驳了"人形机器人颠覆一切"的市场论调,提出了一个核心论点:机器人的形态由场景的痛点和难点决定,而非由通用性决定

核心论点

场景-形态匹配理论

每个场景的超级工具,都是围绕该场景的痛点和难点迭代10年、20年甚至50年的产物。这些工具的智能化就是机器人化,但它们保持原有形态——因为这个形态本身就是最优解。只有当场景必须通过人形形态才能满足时,人形机器人才是最优方案。

反面案例:为什么人形机器人不适合工业场景

半导体晶圆工厂

蓝池投资的AGV机器人在晶圆厂搬运晶圆:同时装载多盒晶圆、搬运效率远高于人形;振动控制精度极高;基于集群调度实现群体效率最优。人形机器人每次只能抱一个箱子,效率和精度都无法匹配。

仓储物流

叉车机器人一次可装载三台电视机加多个箱子。"你不可能一个货仓里边500个机器人两条腿在那跑,每个人只抱一个箱子。"

曹巍
很多人误读,觉得人形机器人出来就颠覆一切。我觉得这就是瞎讲。最后机器人是在云端的,它的形态并不重要。

"场景即壁垒"的投资逻辑

曹巍的投资哲学与市场上追捧通用人形机器人的热潮形成鲜明对比。他认为,占住一个垂直场景并做到极致,其先发优势和数据积累构成的壁垒是通用人形机器人无法攻破的——"你只要占住一个场景,特斯拉人形机器人他也做不了这个事。"

五、什么场景必须人形

在否定"人形万能论"之后,曹巍转而探讨了人形机器人真正有价值的场景——核心判断标准是服务过程是否直接关系到用户体验

服务机器人的两类场景

服务过程与体验无关

  • 清洁机器人(高仙):你不关心它昨晚怎么打扫
  • 送餐小车:A到B的过道移动
  • 夜间消毒
  • 不需要人形,功能型形态更优

服务过程直接决定体验

  • 餐厅精细服务:帮顾客去虾皮、剪蟹壳
  • 家政服务:看孩子、叠衣服、收拾屋子
  • 销售导购:个性化推荐、情感交互
  • 人形机器人是最优解
曹巍
三亚所有海鲜馆的服务员拿个小钳子、小剪子帮你去虾皮、剪蟹壳。如果人形机器人能做到这种精细化控制,在这种过道窄、环境复杂的场景里,那是很完美的体验。

人形机器人的真正价值区间

曹巍的判断可以总结为一条公式:人形价值 = 服务过程与用户体验的耦合度 * 精细操作需求 * 环境复杂度。三者同时为高时,人形是最优解;缺任何一项,功能型机器人都更优。这意味着人形机器人的真正战场不在工厂车间,而在与人息息相关的生活服务场景

六、恐怖谷效应:人形机器人的创新陷阱

曹巍详细阐述了人形机器人进入家庭面临的心理障碍——恐怖谷效应(Uncanny Valley)。这是一个比技术问题更根本的商业化障碍。

恐怖谷效应曲线示意
心理学概念

恐怖谷效应

当机器人外形"又像人又不像人"时,人的好感度急剧下降至谷底。大型工业机器人因为明显不是人,反而获得较高好感;完全仿真到无法分辨的机器人(如《西部世界》中的接待员),好感度重新回升。中间的恐怖谷阶段——"有鼻子有眼但动作很怪、眼睛看着很瘆人"——才是最令人头皮发麻的。

曹巍
你在家里边看到一个黑影子,俩眼睛放光,晚上这个黑影子每天在你家里溜达——这个家里很吓人。

恐怖谷的持续时间

专家预测范围

  • 乐观估计:10年
  • 保守估计:20年甚至更长
  • 当前位置:已进入"像人又不像人"阶段(特斯拉机器人无面部表情,只有一个平板面罩)

恐怖谷是商业化的隐形杀手

技术可以进步,但恐怖谷是人类心理的深层反应,无法通过工程手段绕过。这意味着人形机器人存在一个巨大的商业化真空期:技术上可以做到"像人",但消费者心理上无法接受,直到技术跨越谷底达到"完全仿真"——而这个跨越可能需要10-20年。在此期间,功能型非人形机器人反而有更大的商业空间。

七、价格与消费者意愿的悖论

即便技术成熟、恐怖谷跨越,人形机器人进入家庭还面临价格与需求匹配的悖论。

20-30万
当前预估成本(美元)
Model 3
马斯克的目标价格参照
20-30%
初期精细化能力占人类比例
曹巍
主要就是你买一个Model 3回家吓自己,还是买回去一个你觉得会很舒服、feel no difference的?到底用户会不会买,这个东西是个问号。

短期能做什么 vs 用户期待什么

短期能力用户真实需求
跟随陪伴看孩子
拎包搬箱子收拾屋子
开放域聊天剃鱼、通下水道
基础指令完成修墙皮、复杂家务

NLP易、精细控制难的错位

曹巍指出一个反直觉的现实:让机器人听懂人的命令(NLP交互)"都不难了",但执行命令要求的精细化控制"比NLP的自然语言交互还要难很多"。用户感知到的价值在于任务的完成度,而非听懂指令的能力。这意味着人形机器人进入家庭后可能面临"能听懂但做不到"的尴尬局面。

八、马斯克的终极蓝图:西部世界与智慧永存

曹巍将马斯克的商业版图串联起来,描绘了一个宏大的科技愿景。

马斯克的超级赛道矩阵

智能电动车 + 自动驾驶
航天 + 火星殖民
Neuralink
脑机接口
Optimus
人形机器人
曹巍
马斯克也是西部世界的粉丝。他的目标可能也是——未来能够构建出来一个人和机器人分布出来的世界。或者通过脑机接口把他的intelligence移植到一个机器人身上,能够实现智慧的永存,然后殖民到火星。

各赛道难度对比

曹巍认为这些赛道都是科技领域垂直领域里最难的事情,是"终极想象"。相比之下,车的自动驾驶还"相对简单一些",但人的感知、控制和交互比车难10倍到100倍——因为不只涉及算法和算力,还涉及材料学等跨学科创新。

商业策略

第二曲线逻辑

曹巍点出了特斯拉推出人形机器人的商业博弈面:特斯拉已从新锐车企变成主流车企,估值和想象空间受到挑战。人形机器人是一条新的第二曲线——"这个第二曲线有可能又是一个需要100年"的超长赛道,为资本市场提供新的叙事空间。

科幻照进现实的时间尺度

曹巍对比了两部科幻作品:《I, Robot》中的机器人还处于恐怖谷阶段——一看就知道是机器人;《西部世界》中的接待员则是完全仿真、无法分辨。前者代表10-15年的技术视野,后者可能需要50-100年。马斯克选择的是后者的赛道——他赌的不是这个时代,而是下一个世纪。

九、机器人赛道全景:工业、服务与特种

曹巍从投资人视角出发,系统性地拆解了机器人赛道的完整图谱。

机器人赛道分类与代表场景

工业机器人

搬运型

  • 解决物品A到B的移动
  • 半导体晶圆搬运(蓝池已投)
  • 仓储叉车机器人(蓝池已投)
  • 强调振动控制、集群调度

工艺型

  • 焊接、切割、打磨、抛光、去毛刺
  • 建筑领域:铺地砖、抹灰、喷涂
  • 船舶焊接等重工场景
  • 高负载、高精度往复任务

服务机器人

按服务过程与体验的关系分类

  • 过程无关型:清洁(高仙,蓝池已投)、消毒杀菌
  • 过程相关型:餐厅精细服务、销售导购、家政
  • 纯移动型:送餐机器人(擎朗、普渡)

特种机器人

高危与极端环境

  • 玻璃幕墙清洁(有公司在做但标准化困难)
  • 防爆排爆
  • 下水道检测
  • 高压电线带电作业(蓝池已投)
  • 无人机电网巡检(蓝池已投)

蓝池的投资图谱

蓝池从2016-2017年开始系统性布局机器人赛道,投资逻辑清晰:不追人形,追场景。已投企业覆盖清洁(高仙)、半导体搬运(AGV)、仓储叉车、高压电线作业、软体机器人等多个细分领域,共同点是都找到了明确的场景痛点和商业闭环路径。

十、送餐机器人的"过道经济学"

曹巍以送餐机器人为例,展示了如何用"场景痛点分析法"做投资决策。

为什么蓝池没有投送餐机器人

曹巍
你去三里屯可能看不到一个送餐机器人,但那里的服务员是最忙、最贵、最累的。反而是一些比较大的店——像翘江南,过道特别长,送餐机器人的价值才大。
擎朗
头部送餐机器人企业
普渡
头部送餐机器人企业
Vegas赌场
海外高价值场景:超长过道

场景经济学的普适性

送餐机器人的案例揭示了一条通用规律:机器人的商业价值不取决于技术的先进程度,而取决于它在整个服务价值链中替代的环节占比。如果机器人只替代了价值链中最低价值的环节(过道移动),而高价值环节(出餐、上菜、服务)仍需人力,那它的商业天花板就是有限的。

十一、软体机器人:下一代形态革命

曹巍分享了一个令人眼前一亮的投资案例——软体机器人,他认为这代表了机器人形态的下一次根本性变革。

前沿技术

软体机器人 vs 传统机器人

传统工业机器人源自工业自动化,核心特征是"大铁疙瘩"——自重远大于负载(拿起2-3公斤的东西,自重要5公斤)。蓝池投资的软体机器人不仅手是软的,整个胳膊都是软的,像大象鼻子一样灵活。没有电机,成本极低。

传统机械臂

  • 金属材质,刚性结构
  • 售价2-4万元
  • 有电机驱动
  • 碰到人会造成伤害
  • 适合工业往复任务

软体机器人

  • 特殊材质,柔性结构
  • 成本5000-10000元,小型仅几百元
  • 无电机,全新驱动方式
  • 安全,家有小朋友不怕磕碰
  • 可擦桌子、拧油箱盖等生活任务
曹巍
你很难想象未来在人们生活中无处不在的服务型机器人全是铁疙瘩。家里如果有小朋友,摔个跟头摔到机器人上就把自己头磕破了。未来机器人应该是很柔软的、很安全的、生活中无处不在的存在。

形态革命背后的投资逻辑

软体机器人的意义不在于替代某个具体产品,而在于它指向了一个全新的技术体系——与传统四大家族(发那科、ABB、库卡、安川)的技术路线完全无关。这意味着中国企业有机会绕开既有巨头的技术壁垒,在全新赛道上建立自己的生态。成本降低一个数量级(从数万到数千甚至数百元)更意味着消费级市场的可能性。

十二、中国机器人产业:无与伦比的机遇

曹巍用大量数据论证了中国在全球机器人浪潮中的系统性结构优势。

四大结构性优势

40%
全球工业机器人购买占比
25%
全球服务机器人购买占比
10万+
5年内机器人相关注册公司
~1000亿
过去10年VC投入(人民币)

优势一:市场需求确定性

  • 2035年前后,中国60岁以上人口占比将超过三分之一
  • 年轻人不愿从事体力劳动,制造业"确确实实缺得厉害"
  • 中国是所有高速发展的发展中国家中受人口老龄化影响最严重的

优势二:创业社区活跃度

  • 过去5年机器人相关创业公司注册量超过10万家
  • 2021年单年VC投入约180亿人民币
  • 超过400所高校设置机器人工程专业,每年以10%速度增长

优势三:供应链与产业聚集

  • 长三角、珠三角、西安等产业聚集地,供应链和客户都在身边
  • 国内产品迭代速度约7-8个月,海外需1.5-2年——快一倍
  • 物流成本、沟通成本、信任成本大幅降低

优势四:政策支持体系

  • 政府智能制造五年规划目标清晰具体(AI、5G、大数据、云计算与机器人融合)
  • 中央+地方多层级政策
  • 保险、券商、银行等金融机构响应号召投资
曹巍
中国的这一波机器人的热潮和机会,可以讲是无与伦比的。

中国机器人产业的"四轮驱动"模型

曹巍描述的中国优势并非单一维度,而是市场需求、人才社区、供应链生态、政策支持四个轮子同时驱动。这种系统性优势在全球其他国家"很难很难看到"。特别值得注意的是:机器人不同于纯软件产业(硅谷擅长的虚拟经济),它天然需要供应链和客户在身边的物理生态——这恰恰是中国的强项。

十三、波士顿动力启示录:从极客到商业化

波士顿动力三次易主(Google-软银-现代汽车)的故事,在曹巍看来揭示了机器人行业的一条铁律。

Google收购

出于前沿技术布局,但商业化路径不清晰。

孙正义/软银收购

"出于创始人的兴趣和爱好",可以一年投五个亿。但发现无法商业化,"过了新鲜劲",对技术进展的期望下降。

现代汽车收购

开始大量商业化——机械狗批量销售,推出仓储搬运机器人(小车+机械臂)。回归场景痛点。

曹巍
你看波士顿动力做的最新的往外卖的产品——是一个小车加一个胳膊。这公司最后还是要回到场景的痛点和难点。你还是得解决问题。

极客情怀与商业现实的永恒张力

波士顿动力的遭遇印证了曹巍"场景决定形态"的核心论点:即使拥有全球最顶尖的步态控制和机器人结构设计能力,没有找到商业闭环就无法持续。从酷炫的人形翻跟头到务实的仓储小车,这条路是所有机器人公司的必经之路。

十四、技术周期与投资节奏

曹巍分享了蓝池看机器人赛道的底层投资方法论:技术侧的升级迭代决定了商业侧的闭环机会

技术演进的关键节点

技术阶段周期关键变化
导轨/二维码时代~20年机器人沿固定路径移动,按A到A、按B到B
AI+视觉感知时代当前摄像头+雷达实现自主建图、自主移动,不再需要导轨
下一波(待定)未知可能涉及全新的感知、材料、控制技术突破

蓝池的投资时间窗口

蓝池从2014-2015年开始研究机器人赛道,2016-2017年开始投资。选择这个时间点的关键原因是看到了基于AI的SLAM能力让移动机器人从导轨时代进入自主移动时代——"这些小车过去是要靠导轨或二维码,现在靠基于AI的能力就变成个智能体了,自己可以跑来跑去、不会迷路。"

投资方法论

技术拐点驱动的投资逻辑

蓝池的投资策略包含两类:(1) 已到商业化拐点的场景——如高仙清洁机器人,虽然投资时没有收入,但产品刚从实验室出来,场景需求明确;(2) 指向未来的形态革命——如软体机器人,产品刚出实验室就投,赌的是未来在生活服务领域的巨大应用市场。两类投资的共同点:底层技术有真正的突破,而非增量优化。

十五、负外部性:当人不再需要人

对话最后进入了最具哲学意味的讨论:当机器人完美到无法与人区分时,会发生什么?

曹巍
完全近似于人这种形态的机器人,为什么科幻小说和电影里边政府是抵制的?因为人是不完美的,机器人是完美的。

负外部性的演进路径

第一阶段:替代不想干的工作

替代危险、枯燥、重复的劳动。社会影响可控——"这些年轻人宁可送外卖也不去工厂"。

第二阶段:跨越恐怖谷

机器人长得与西部世界中的接待员一样,人机无法分辨。政府初期不干预。

第三阶段:人不再需要人

机器人比人更完美、更懂你、能持续学习你的偏好。人选择与机器人而非人类建立亲密关系。生育率进一步下降。

曹巍
机器人被大量放出来,混到人类社会,最后发现生育率又下降了。政府一研究——发现人不喜欢人了,觉得跟机器人在一起更有安全感。

"完美"才是最大的威胁

曹巍洞察到了一个深刻的悖论:机器人对人类社会最大的威胁不是技术失控或叛变(科幻电影常见主题),而是太过完美。它能学习你、持续让你开心、永远不变心——这正是人类伴侣无法做到的。就像宠物经济的兴起部分源于"动物比人更忠诚"的心理需求,当机器人比人更理想时,人类社会的基础关系纽带可能被根本性地改变。

当前赛道的风险评估

  • 最大风险不是技术,是节奏——需求确定性和政策支持都很稳,但很多公司控制不好节奏就"挂了"
  • 负外部性是超长周期问题——在人形机器人跨越恐怖谷之后才会显现
  • 不像互联网赢家通吃——场景型机器人的壁垒在垂直场景,不会被通用人形机器人一统天下

赛道的终极确定性

曹巍给出了一个令人印象深刻的判断标准:"只要能够活下来、坚持活30年,这事你一定有价值。"机器人赛道的需求确定性和政策确定性都"非常稳",不像P2P、教育、游戏等赛道存在政策性颠覆风险。这是一个底层技术、场景应用、创新维度都"非常多样性"的赛道——它的风险在于个体公司的生存能力,而非赛道本身的方向性。

十六、关键数据汇总

技术维度

指标数据来源/语境
步态控制研究周期40-50年从早稻田大学到波士顿动力
人形机器人初期精细化能力人类的20-30%曹巍预估前两版产品
人形感知/控制难度 vs 自动驾驶10-100倍曹巍判断
恐怖谷跨越时间10-20年专家预测范围
人形机器人完全进入家庭至少10-15年曹巍判断(比无人驾驶更远)

市场维度

指标数据来源/语境
中国工业机器人全球购买占比40%全球排名第一
中国服务机器人全球购买占比~25%全球排名第一
过去10年VC投入~1000亿人民币机器人领域
2021年单年VC投入~180亿人民币机器人领域
机器人相关创业公司(5年)10万+家中国注册量
开设机器人工程专业的高校400+所每年增长~10%

成本维度

指标数据
特斯拉人形机器人预估成本20-30万美元
传统机械臂售价2-4万元人民币
软体机器人成本5000-10000元(小型仅数百元)
国内产品迭代周期7-8个月
海外产品迭代周期1.5-2年

人口与社会

1/3
2035年中国60岁以上人口占比
30年
"活30年一定有价值"的行业判断
100年
人形机器人的终极赛道长度
← 返回主页