深度研究 — #38 和软银愿景原GP聊聊，大模型全球降温后，人工智能何去何从

← 返回张小珺主页

🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

嘉宾画像与职业路径
语言大模型的"反刍"本质
AI三个世代的范式跃迁
可变成本到固定成本：3.0的核心变革
Society of Minds：大小模型的未来
大模型生态的信任困局
基础大模型的竞争格局
大模型降温：技术周期的必然
从训练到推理的三年过渡
算力困局与三步解法
未来十年的技术路线图
投资哲学：商业模式的美学
早期与中后期投资的认知差异
创业的时机选择与顺势而为
给AI创业者的实战建议

一、嘉宾画像与职业路径

陈寻（Eric Chen），北大与斯坦福物理/电子工程/芯片背景，职业生涯围绕科技投资与科技创业两条主线交替展开。

斯坦福毕业 → 第一次创业（2002年）

在硅谷创立大型算法优化与计算公司。Dotcom泡沫破灭后最冷的一年起步，2007年被ASML收购，陈寻出任全球副总裁。

银湖（Silver Lake）

当时全球最大科技行业PE，陈寻帮其建立整个亚洲投资团队（香港、东京、上海）。

软银愿景基金

全球最大AI投资基金，陈寻任管理合伙人，负责整个中国业务，投资全世界最优秀的AI相关企业。

一方建树（第二次创业，2015/2016年至今）

联合创始人兼董事长。定位：AI三要素（算力、数据、算法）的安全流通、高效匹配与价值创造。

次创业经历

次投资机构（银湖+软银）

2002

第一次创业年份

陈寻

这几年的投资生涯给我带来的最大的不同，是我觉得我自己发展出来一种，我管它叫商业模式的美学。

二、语言大模型的"反刍"本质

陈寻提出了一个理解大模型本质的核心比喻：语言大模型的学习过程是一种"反刍"。人类先观察世界，总结出规律，用语言这种符号载体记录下来。OpenAI等公司再从这些已经"消化过一遍"的语言中去学习。

核心比喻

"反刍"模型

语言是人类对宇宙观察的符号化。爱因斯坦说E=MC²，这是知识沉淀的载体。语言大模型选择从语料中学习，是在对人类已经消化过一遍的表达进行"二次消化"。这已经非常惊艳，但本质上仍只是反刍。

陈寻

我们现在看到这么惊艳的人工智能能力，其实还只是一个反刍的一步，就已经可以做到了。所以你如果放开了去想，机器能够直接去观察这个社会，能够把对社会的直接观察从中间提炼出来智能的能力，这里头的想象空间真的是无可估量。

反刍之后的下一步

陈寻明确指出：没有人说机器智能不能从直接观察世界来得出自己的结论，甚至发明出自己的符号（很可能是零和一）。机器能看到红外紫外，一秒钟能处理1000帧画面，它对世界的认知没有理由与人类相同。已经让大家觉得是"比移动互联网还要大十倍的机会"，但其实还只是起步。

机器感知的超越性

人类感知的局限

人眼只对可见光敏感，红外紫外看不见；机器可以
人眼视频感知约30帧/秒已到极限；最先进机器可达1000帧/秒
人类通过感知提炼的知识绝不是世界知识的总和
当机器用其他角度观察世界时，"你的宇宙一定比我们人的宇宙要大"

三、AI三个世代的范式跃迁

陈寻将人工智能发展划分为三个清晰的世代，每个世代有根本不同的技术范式和商业逻辑。

世代	代表技术	关键特征	核心挑战
AI 1.0	专家系统	规则驱动，人工编码知识	无法扩展，覆盖面极窄
AI 2.0	深度学习（2016年AlphaGo打败李世石）	数据驱动，能做前所不能之事	可变成本极高，每个应用从头来过
AI 3.0	大模型（Transformer/GPT）	将可变成本变为固定成本，门槛大幅降低	生态协作中的安全与产权问题

AI三个世代的成本结构演变

AI 2.0时代的痛点亲历

陈寻在软银愿景基金投资全球顶尖AI企业时深刻感受到：2.0时代每个AI应用都需要从收集数据、整理、标注、开发模型、调优到嵌入业务全链条走一遍。"这件事情很重"——无论金钱、人力、高端人才、企业文化变革，都是巨大摩擦力。成功的企业有一个共同特点：找到了一个单一的、可放大的市场（如人脸识别），使前期成本得以摊销。

四、可变成本到固定成本：3.0的核心变革

陈寻认为大模型时代最根本的变化，是把AI落地过程中的可变成本变成了固定成本。

AI 2.0（深度学习时代）

每个应用场景从头来过
收集→整理→标注→建模→调优→嵌入业务
需要大量人力、高端人才
企业必须改变运作模式
可变成本极高，门槛极高

AI 3.0（大模型时代）

基础大模型一次性完成基础能力建设
在基础模型之上做微调、行业化、专业化
成本和门槛大幅降低
速度显著加快
对人才要求降低，全民AI成为可能

陈寻

3.0时代让我们看到了全民AI的迹象。今天如果你走访企业，用我的语言表达，就是任何一个有一点点技术自尊的企业，没有不在做大模型的。

陆奇（陈寻引用）

任何一个巨大的拐点，都是它的边际成本变成了固定成本。今天就是大模型的边际成本变成了固定成本。

"技术自尊"的判断标准

陈寻用"有技术自尊的企业"这个独特表述来描述AI普及的广度：不仅是科技公司，任何有技术追求的企业都在尝试大模型。这与2.0时代只有头部企业才有能力探索AI形成鲜明对比。门槛的降低不仅是技术意义上的，更是组织和人才意义上的。

五、Society of Minds：大小模型的未来

面对"模型是否越大越好"的问题，陈寻从人脑的工作机制出发，给出了一个深层判断。

认知模型

人脑的模组化运作

人脑是模组化的，不同模组处理不同事务。一个模组在算个人财务（"你可能买不起"），另一个在释放购物欲望（"买吧买吧"）。两个模组打架时，人脑有一个arbitration（仲裁）机制，决定采纳哪个模组的意见。很多时候不是理性胜出，而是情绪胜出。

AGI的最终形态：Society of Minds

面对特定事情有特定模型，简单任务用小模型，复杂任务用大模型
模型之间形成竞争、互补、协作的关系
需要一个仲裁机制，决定在当下采纳哪个模型的结果
这个概念在AI领域早已被提出，称为Society of Minds

陈寻

我跟张云涛博士说，我说这个就是我对AGI的定义。我认为AGI最后是这个样子的。他说是啊，人工智能的大楼早就提出来过，这个概念叫做Society of Minds。

企业不应从"大还是小"的维度提问

陈寻明确指出，对企业来说正确的问题不是"我需要大模型还是小模型"，而是"我要面对什么客户，满足什么需求，能否比竞争对手做得更好"。答案自然会导向需要怎样的模型组合。这避免了技术驱动的陷阱，回归到商业本质。

六、大模型生态的信任困局

陈寻指出，AI 3.0时代提出了一个2.0时代不存在的根本性问题：开放与封闭之间的矛盾。

使用方的困境

必须使用基础大模型（自建成本数亿美金）
微调需要喂入企业专有数据
一旦数据给了云上大模型，无法确知何时以何种形式被谁调用
大企业普遍明文规定：员工不得用云上GPT处理公司事务
必须解决：信息安全 + 商业机密保护 + 场景优化

提供方的困境

希望用户使用并优化模型
但用户优化后的衍生模型不再属于提供方
如何保证后续使用中的商业利益？
必须解决：知识产权保护 + 商业分配机制

为什么2.0时代不存在这个问题？

小模型时代每件事从头做到尾，在可控范围内完成，没有"开放与封闭的矛盾"。大模型从本质上要求整个生态协作：有人做基础模型，有人做行业优化，有人做服务。一旦涉及协作，就必须解决信息安全和商业利益保障问题。

陈寻

如果不解决这个根本问题，那么大模型从基础大模型发展成千行百业的行业大模型，发展成每一个企业自己的专有模型，甚至有人说每个城市要有自己的模型，每个人要有自己的模型，是不可能的。

一方建树的战略定位

陈寻透露一方建树将于8月30日发布一款产品，正是为解决这个根本问题：让基础大模型提供方放心地把模型提供出来，使用方安全地优化微调，同时保护双方的知识产权和商业机密，并形成大家认可的商业分配机制。这本质上是为大模型生态建设"信任基础设施"。

七、基础大模型的竞争格局

关于基础大模型最终会出现几家，陈寻的判断与主流预期不同：不会是寡头垄断，而会有几十个。

为什么不是一家独大？

陈寻的三层论证

技术追赶：OpenAI证明了可行性后，大量追随者涌入。No.2之间很难拉开距离，因为起步和技术架构一样
行业适配：再好的基础大模型面对具体行业（如医疗）仍有欠缺。OpenAI不可能同时服务好前50大行业
生态形态：大模型生态不是中心化服务（如搜索引擎），而是需要各方协作的分布式体系

竞争分析

OpenAI能否成为下一个Google？

关键在于能否将技术领先迅速转化为其他商业壁垒。Google并非靠技术不可复制取胜，而是形成了商业生态。OpenAI如果做到了这个转换就可能成为下一个Google；如果做不到，大家都可以去瓜分蛋糕。陈寻的判断：目前的不确定性还很大。

大模型的多树状网络生态

陈寻用"多树状网络"来描述未来的模型生态：

每个基础大模型是一个大树干
行业大模型是分叉
企业/个人大模型是树叶
基础大模型不止一个，多棵树形成网络

陈寻

医疗创意不得。我拿了一个有创意的大模型来，我要解决医疗的问题，我要把它的创意给它至少要大幅度的缩小。让它的所有的服务和提供出来的洞察是精确的。我要的是准确性和精确性，我不要你的创意。

八、大模型降温：技术周期的必然

面对2023年下半年大模型在全球的降温，陈寻从技术周期的视角给出了冷静判断。

131.6%

ChatGPT 1月访问量增速

-9.7%

ChatGPT 6月访问量增速

90%

.com泡沫纳斯达克跌幅

陈寻

狂热之后的冷静，是最重要的时刻。因为之后真正能够把这个东西用起来、产生真正价值的工作，都是在这个时候做出来。只有在这个时候坚持的人，才能够走到最后。

与历史周期的对比

.com泡沫 vs 当前大模型降温

.com泡沫2000年到顶，2002年到底，约两年
当时已出现"非常非理性的成分"，泡沫破灭是正常清洗
当前大模型降温波幅远小于.com泡沫，不可相提并论
更准确的定位：人工智能几十年大周期当中的起步阶段

技术周期的三大规律

陈寻提出的技术周期观点贯穿全场：(1) 技术周期与经济周期、意识形态周期不同，是单向上升的，浮动的只是进步速度；(2) 越大的技术突破，短期内波动越大，但长期价值不减；(3) 人类通常对短期过于乐观，对长期过于悲观。当前的降温恰恰说明市场在从狂热走向理性。

技术周期：短期波动 vs 长期趋势

九、从训练到推理的三年过渡

陈寻对大模型产业最重要的前瞻判断之一：未来三年，行业将从"建大模型"转向"用大模型"。

当前状态：训练为主

大家都在做模型、开发模型、调优模型
真正把模型用起来的场景并不多
推理量（实际使用量）并不大
一方建树的"揽瑞星洲"平台清楚看到这个趋势

未来三年：推理起量

推理 = 服务 = 实际应用
推理生态将远比训练丰富
消费者、企业、政府等不同场景
不同安全要求、覆盖人群、界面形态
渗透到微信、钉钉等各类应用中

陈寻

推理不会和训练一样，是一个相对单一的、大家都这么干的事情。它会出来各种各样的解决方案，界面也不一样，承载它的算力的要求也不一样，它会以各种各样的形态出现。

"推理量"是检验大模型落地的真实指标

陈寻给出了一个判断产业成熟度的清晰指标：去问任何一家大模型公司或开源机构，他们的推理量有多大。答案是"并不大"。这说明整个行业尚未完成从开发阶段到使用阶段的过渡。推理量的爆发将标志着大模型真正进入价值创造阶段。

十、算力困局与三步解法

陈寻对当前算力供不应求的局面给出了分阶段的解决路径。

第一步：用好已有禀赋

一方建树的"揽瑞星洲"平台做的正是这件事：感知分布在内蒙古、贵州、上海、北京等地的算力，匹配供需变化，实现跨区域的负载平衡和调度，最大限度利用现有算力。

第二步：大规模新建

"有技术自尊还有一定财力的企业"多半都在积累算力。国家、地方政府、国企央企都在大力建设智算中心。新算力将在接下来数月逐步上线，有望缓解供不应求的局面。

第三步：国产算力撑起一片天（3-5年）

国产算力芯片和系统已有不错产品，但生态问题（软件、应用、协作）需要时间解决。三到五年是陈寻对国产算力生态成熟的预判。

算力的虚拟化本质

陈寻指出一个被忽视的事实：虽然算力依赖物理芯片和服务器，但对使用者来说已经被完全虚拟化。"你今天来我们平台说要做个语言大模型，我可以从中国的任何一个角落给你调。你也不关心这个算力在哪。"与数据和模型一样，算力也是虚拟化的资产，要流通就必须解决安全、虚拟化、匹配的问题。

十一、未来十年的技术路线图

陈寻对AI发展给出了三个时间框架的预判，并特别讨论了世界模型与语言大模型的关系。

时间窗口	关键事件	核心逻辑
3年内	从训练到推理的过渡，推理生态爆发	行业从"建大模型"转向"用大模型"
3-5年	国产算力生态成熟	需求驱动 + 国家推动 + 技术公关成果开始落地
~10年	下一个大的技术跃迁	从2016年深度学习到大模型用了8年，下一次横空出世预计在类似周期内

AI发展路线图：三个关键时间窗口

世界模型 vs 语言大模型

陈寻对杨立坤世界模型观点的回应

世界模型 = 机器直接观察世界来建立理解，不通过反刍人类语言
陈寻认为这件事会发生，但不与语言大模型直接冲突
两者是互补关系：反刍人类语言能做出有价值的事，何乐而不为
机器若能自己观察世界，看到人类看不到的（红外/紫外/高帧率），其认知将超越人类

"还在起步"的判断需要被严肃对待

陈寻反复强调当前仍是"起步阶段"——不是修辞，而是有具体依据：推理量不大、行业应用刚开始、国产算力尚未成熟、世界模型还未出现。这意味着当前围绕大模型的所有讨论（估值、竞争格局、商业模式）可能都在一个远未成熟的快照上进行。

十二、投资哲学：商业模式的美学

多年中后期投资经验让陈寻发展出了一种独特的"商业模式美学"——对商业模式好坏的直觉品味。

投资方法论

商业模式的美学

什么样的商业模式是"美好的"？答案看似简单：有持续盈利能力。但陈寻指出，中后期投资人看的不是PE（市盈率），而是EV/EBITDA。原因是EBITDA是现金流的替代品，反映的是对商业模式中现金流的重视程度，比会计意义上的盈利更重要。

EV/EBITDA

中后期投资人核心估值指标

公开市场常用但专业投资人少用

陈寻

投资是一个 ultimate bottom-up business。就是它一定是自下而上的一个业务。当你面对一个被投企业的时候，除了你理解这是一个人工智能企业，你必须要理解这个企业和其他人工智能企业有什么不同。

"如果说我投人工智能，是人工智能我就投，不是我就不投，这种投资策略最后一定是失败"

这句话对当前AI投资热潮有极强的现实意义。陈寻明确反对赛道式的粗放投资思维（至少在中后期投资中），强调必须深入理解每个企业的差异性。这与他后面讨论早期投资的"赛道策略"形成有趣对比。

十三、早期与中后期投资的认知差异

陈寻同时拥有银湖（成熟期PE）和软银愿景（成长期）两段投资经历，对不同阶段投资的差异有切身体会。

早期投资

更关注方向和人
风险承受能力高，打概率
投100个有30个成长已非常好
可以做"赛道投资"
故事和愿景更重要

中后期投资

必须深挖企业商业模式
怎么赚钱、花钱、何时赚花
现金流是最核心的考量
数据分析优先于故事
"特别能有感染力的CEO不见得最说明问题"

银湖 vs 软银愿景的风格差异

维度	银湖	软银愿景
投资阶段	成熟企业	中后期成长企业
现金流	比较稳定	通常未成熟
商业模式	已经成立	能预判但尚未证明
行业地位	比较确定	还在高速发展
风险程度	较低	仍有一定风险

陈寻

你把理性等同于冷血，那可能就是这个意思。中后期投资确实可以更理性，可以从数据当中去看事情。故事要听，但是数据更要看。

十四、创业的时机选择与顺势而为

陈寻对创业时机的判断经历了从"个人能力驱动"到"趋势驱动"的认知升级。

陈寻

一个企业能够成功，它的因素真的蛮多的，而且很多是偶然因素。趋势起到了大的作用。趋势和潮流起到的作用，一个是大，第二个是你控制不了。你要么是顺着它做，就顺势而为。你要么逆势而为，逆势而为就会很痛苦。

一个朋友的故事：关于创业方向选择

认知升级的对话

一位朋友说选择创业方向是因为"能最大化利用我积累的经验和能力"。陈寻回应：

"你把你自己个人的能力放到最大，也就那么大"
最应该搞清楚的是这个世界在往哪走
即使你有些能力在大趋势中没用，有什么关系？
个人能力不是你的优化目标函数
至少花一半时间回答一个问题：未来五年十年到底要发生什么

2002年 vs 当下：环境冷但时机好

陈寻的第一次创业恰在2002年——Dotcom破灭后最冷的一年。当时资本市场比现在冷得多。但回头看，2002年恰是互联网大潮的起始点，此后一路上行。他认为当前处于类似位置：面对一个几十年的技术大潮的开端，"你有的可扑腾"。关键区别是：当年他对技术大潮没有明晰认知，现在看得更清楚了。

为什么选择在中国创业？

陈寻

每次去国外大公司的董事开会，聊业务的事没问题，咱比谁也不差。好，开始叉些了，开始聊天了，你就傻了。人家聊的是哪个棒球队，人家聊的是小时候听的哪个歌星。你就发现你完全是局外人。

陈寻的判断：在国际舞台上可以做出有价值的事甚至做得很好，但作为一个人的存在，文化的隔阂感无法解决。中国差不多年代的人有共同的记忆和体验，这就是文化的力量。

十五、给AI创业者的实战建议

陈寻从投资人和两次创业者的双重视角，给出了清晰的创业建议框架。

创业的五步追问

第一步：到底服务谁？

锁定目标用户群，了解、发掘他们的需求。"不要轻而易举的就认为自己是Steve Jobs。"

第二步：你能做吗？

用户说他要这个东西，你能不能做到？

第三步：你能比别人做得更好吗？

差异化竞争优势在哪里？

第四步：需要什么资源？

远不仅仅是钱和人才。有些事需要国家的信任，有些需要生产能力，每个创业想法背后都牵扯一大堆事情。

第五步：未来五年十年要发生什么？

在大趋势中你能做什么，能比别人做得更好？这才是最应该回答的问题。

关于融资和省钱

黄仁勋的三件事

陈寻引用NVIDIA CEO黄仁勋早年的创业心得——CEO只有三件事：省钱、赚钱、融钱。其中最花功夫的是融钱。"我要么就是在融钱，要么就是在为下一步的融资在做准备。"

陈寻

今天这样的时代，我觉得没有人能够判断出来资本市场的寒冷还会持续多久。你不能因为自己的看法就去按照那个方向去做事情。你必须要做更坏的准备。你只有活下来，才有其他所有的事情。

投资人对创业者薪酬的态度

当被问到中后期投资人是否关注创业者给自己发多少工资时，陈寻的回答出乎意料的宽容："我觉得每个人都要过日子。拿一份工资做一份事情，没有什么。只要不过分，完全可以理解。"这与早期投资人通常对创始人薪酬敏感的态度形成对比。

启示与延伸思考

1. "反刍"比喻揭示了当前AI能力的天花板与下一步空间

语言大模型本质上是在二次消化人类已有的认知。这意味着两件事：第一，当前能力已经足够惊艳但有上限（无法超越人类已有认知的总和）；第二，真正的突破将来自机器直接观察世界并建立独立认知。世界模型不是与语言模型的对立，而是从"反刍"走向"直接消化"的进化。

2. 大模型生态面临的"信任悖论"可能是最大的非技术瓶颈

使用方必须喂入私有数据才能获得价值，但一旦喂入就无法控制泄露风险。提供方希望被广泛使用，但无法在衍生模型中保留商业利益。如果这个信任问题不解决，"万物皆可模型"的愿景将停留在口号层面。一方建树的定位——AI三要素的安全流通——正是瞄准这个关键卡点。

3. "推理量"是一个值得追踪的产业成熟度指标

陈寻指出当前行业大部分精力仍在训练（开发）而非推理（使用），推理量并不大。这个判断如果正确，意味着大模型产业的真正商业价值释放尚未开始。投资者和创业者可以将推理量的变化作为判断行业从开发期进入应用期的关键信号。

4. 技术周期的单向性是最被低估的认知

经济周期和意识形态周期是中百星制的起伏（有涨有跌），但技术周期是单向上升的，浮动的只是进步速度。这意味着大模型降温不是"下跌"而是"减速"——技术能力从未后退。对投资者和创业者来说，在减速期入场恰恰是最佳时机，因为注意力和竞争压力都在降低，而技术基础仍在积累。

5. "商业模式美学"是创业者最需要补课的认知

陈寻从中后期投资中发展出对商业模式好坏的直觉——核心是持续产生现金流。同样一亿订单可以有完全不同的"品味"。这对技术背景创业者尤其重要：技术能力再强，如果商业模式不"美"（无法持续产生现金流），最终难以成功。

6. "个人能力不是优化目标函数"是一个深刻的创业认知升级

多数人选择创业方向的逻辑是"最大化利用我的能力和经验"。陈寻反驳：个人能力放到最大"也就那么大"，正确的优化目标是"在未来五年十年的大趋势中，我能做什么比别人做得更好"。即使某些能力在趋势中用不上，"胳膊永远拧不过大腿"。

7. OpenAI的终局取决于能否将技术领先转化为商业壁垒

陈寻的分析框架很清晰：Google的一家独大不是因为技术不可复制，而是因为形成了商业生态。OpenAI要成为下一个Google，关键在于"在别人技术赶上你之前，你就不靠技术竞争"。目前不确定性很大，但陈寻倾向于认为最终会有"几十个"基础大模型而非寡头垄断。

大模型全球降温后，人工智能何去何从

目录