← 返回张小珺主页
深度研究 Deep Dive

AGI大基建时代:电+芯片=产出智能

#64 和广密聊AGI大基建时代
2024.4 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 2024Q1全球大模型大事件复盘
  2. 大模型公司梯队与XAI黑马
  3. 英伟达GTC与黄仁勋的"算力税"
  4. AGI的定义与"渐进式解锁"
  5. 改变软件生产方式与挑战Google
  6. AGI的登山路线图:南坡与北坡
  7. 模型公司即价值沉淀之地
  8. AGI大基建:物理瓶颈与能源账本
  9. 训练GPT级模型的算力与成本
  10. Scaling Law:加速、减速还是暂停
  11. 开源vs闭源:格局变化
  12. 中美AGI大基建差异
  13. Sora、多模态与AGI主线之争
  14. 自动驾驶与机器人:从数字到物理
  15. OpenAI解析与巨头结盟
  16. AGI时代的投资与Killer App
  17. 关键数据汇总

一、2024Q1全球大模型大事件复盘

2024年一季度,全球AI领域密集发生了一系列重大事件。李广密(实相科技CEO)从信息密度和战略影响两个维度做了系统复盘。

Q1核心事件清单

事件广密的判断
OpenAI发布Sora比预期来得早,多模态理解和生成的进步幅度会很大,会解锁很多新东西
Anthropic发布Claude 3Sota易主,但OpenAI并没有如预期快速反击
GPT-4.5/5未发布比预期来得慢,说明AGI战线被拉长拉宽
马斯克XAI加入开源全球范围内争夺第一梯队的唯一黑马,开源水位线大幅提升
Google加入开源大战发的是小模型,不会把最强模型开源,开源主力仍是XAI和Llama
英伟达GTC被冠以"新科技界春晚",英伟达股价一年涨三倍
微软收购Inflection模型公司收敛的信号,Inflection成为"第一个失败的VC重铸的大模型公司"
李广密
去年初觉得AGI是一个百米冲刺,大家都没做好准备。今年就觉得AGI应该是马拉松,大家都有充足的时间做准备。

从百米冲刺到马拉松的认知转变

这是广密在一个季度内最大的认知变化。去年觉得可以"无限加GPU加数据就能到AGI",但突然发现GPU数据中心和物理硬件是巨大的瓶颈。物理硬件成为阻碍AGI时间表的最大因素——这一判断贯穿全篇。

二、大模型公司梯队与XAI黑马

广密对全球大模型公司做了明确的梯队划分,并指出了每个梯队的生死线。

3家
确定的第一梯队
1家
唯一黑马(XAI)
4家
美国最终存活

全球梯队划分

梯队公司判断
第一梯队OpenAIAnthropic、Google明确的第一梯队,人才密度最高
第二梯队(含黑马)XAI、Mistral、Meta LlamaXAI是唯一有机会冲击第一梯队的黑马
出局/危险Inflection、Character、Cohere"今年年内就得找买家了"

Inflection提供的案例教训

  • 没想到模型收敛如此之快,计算竞争是很残酷的
  • Inflection没有绑定一个更深的巨头——"大模型VC是投不动的,还是一个巨头的游戏"
  • 关键还是人才密度:前三家加上XAI明显高一阶,其他公司有明显差异
李广密
XAI有两个层面:第一它是全球范围内争夺第一梯队的唯一的黑马;第二如果它持续开源,对整个模型的格局生态和商业价值影响比较大。

生死线判断

三、英伟达GTC与黄仁勋的"算力税"

广密亲赴GTC现场,对黄仁勋和英伟达在AGI浪潮中的地位给出了极高评价。

李广密
硅谷最亮的仔,就从马斯克切换到老黄了。很多马斯克的粉丝变成老黄的粉丝,投资者的资金也从Tesla转到了英伟达。

黄仁勋的核心贡献

主权AI:把GPU卖给政府

黄仁勋的市场扩展

  • 以前GPU卖给美国科技公司,现在提出"主权AI"——把GPU卖给政府吃国防预算
  • 美国军费每年8800亿美金,2-3%买GPU就是一个巨大的量
  • GPU是"极其重要的战略储备物资"
  • 销售能力超强——市场规模又大了一步

老黄的管理风格

T5T制度

  • 内部每双周,每个大组发出最重要的五件事
  • 这是一个非常好的管理习惯

工作文化

  • 鼓励在办公室吃早饭和午饭
  • 但鼓励大家晚饭回家陪家人
  • 不鼓励996
核心判断

"算力税"与"智能税"

广密提出了一个结构性判断:人类社会将新增两道税——

  • 算力税:所有商业社会都要给英伟达交算力税,就像过去十年给苹果交入口税
  • 智能税:模型公司将收取"智能税"——模型能力最强的公司顺理成章解锁最伟大的应用

人类又多了两个"收税的基石公司"。

四、AGI的定义与"渐进式解锁"

广密认为对AGI的理解尚无共识,"就很像共产主义或者财务自由,因人而异"。

AGI的三种理解角度

角度一:三个90%

最激进的定义:AGI能在90%的行业,超过90%的专家,完成都有经济价值的工作。"我觉得这三个90%还是很激进的。"

角度二:智能能力本身

最重要的还是智能能力本身,不是形态和载体。"但肯定会从数字世界走向物理世界"——物理的机器人和设备怎么把智能产品化,是创业者很大的机会。

角度三:渐进式解锁(核心观点)

AGI不是一蹴而就的。广密提出关键词——"渐进式解锁":画一条登山路线图,模型能力每涨一些,就会解锁一些场景,诞生一些应用,创造相应的经济价值。

李广密
AGI能在未来10到15年让全球GDP翻倍,从今天的100T涨到200T。但今天100T的GDP和这波AGI直接相关的可能还不到0.1%。离解锁90%还很远。
AGI渐进式解锁:从0.1%到90%的GDP渗透路径
"5秒任务"理论

Sam曾提出不应从替代人的角度思考,而是看所有工作任务中有多少需要5秒内就能完成的——这些是模型第一波能做掉的。广密认为这个框架结合"渐进式解锁"来理解最为合适:从5秒任务扩展到5分钟任务,再到5小时任务,每一次扩展都解锁新的经济价值。

五、改变软件生产方式与挑战Google

广密认为AGI登山路线图的近处,最值得期待的两个方向是:改变软件生产方式信息检索的变革

软件生产方式的颠覆

过去的软件(自动贩卖机)

  • 有限的SKU供给
  • 大量非标需求未被满足
  • 固定需求抽象 + 开发团队开发
  • 开发者几千万人

未来的软件(98调酒)

  • 任何口味都可以调出来
  • 精准/简单的自然语言描述
  • 模型用工具调用或coding生成复杂代码
  • 人人都是产品经理
李广密
三年内是有机会看到coding领域的AGI的——也就是做各种任务都不错的一个程序员。因为大部分任务,其实没有像软件开发这么明确和有逻辑。

挑战Google的历史性窗口

为什么这次不同

  • 过去20年无数对手挑战Google都失败了——核心原因是没有fundamental的技术变革
  • 这一次大模型给了大家机会——搜索从"搜出链接和网页"变成"搜出答案"
  • 问答可能是"皇冠上的明珠"——能解决好就能获得用户信任和长期留存
  • ChatGPT从5000万DAU突破到几个亿必须做搜索——"这是挑战Google过去20年可能唯一的一个技术窗口"

SaaS公司的危机

微软和OpenAI激进推进,有可能把很多工具型、feature型的SaaS都干掉。只有积累了很深的workflow和数据的软件公司(如Salesforce、ServiceNow)可能还能发展。广密对SaaS公司的建议:"只能积极拥抱,组织上多用好年轻人。"

六、AGI的登山路线图:南坡与北坡

广密用登山的比喻构建了AGI的完整路线图——南坡是模型北坡是产品

南坡:模型能力

底层:Scaling(更多数据+GPU+能源)

看产出智能的效率是否能持续提高。

核心:推理能力(Reasoning)

模型最重要的能力,需要复杂推理才能完成有经济价值的工作任务。

关键信号:Coding代码能力

"可能是AGI最早落地的一个信号——它既是一个走向AGI的能力,也是一个产品。"

多模态能力

对自动驾驶和机器人有提速作用,更多数据交互效率。

Agent

关键词但今天还不太work——"最主要是模型的Reasoning能力不够强也不够准确,多步推理下来很多任务都失败了。"

北坡:产品

李广密
如果让模型看1万次苹果掉下来,它能不能发现万有引力定律?如果更充足的更广范围的数据灌进去,它们能不能发现人类没有发现的问题、没有发现的规律?我觉得这有可能是一个新的文艺复兴。

南坡和北坡必须是一家公司吗?

广密的判断

  • 不一定在一家公司——对组织能力、文化、人才和资源挑战很大
  • 但模型公司做产品更容易——产品解决不了的任务可以向下改模型;产品公司改不了模型
  • SpaceX类比:火箭发射是基础能力(每年几十亿收入),Starlink是Killer App(几百万终端),Starship可能颠覆波音空客
  • "如果大模型是电,那灯泡不一定是电厂做出来的"

七、模型公司即价值沉淀之地

广密提出了一个重要的价值链判断:模型公司可能是价值最终沉淀的地方

核心论点

两层价值结构

AGI时代的价值链与移动互联网完全不同:

  • 移动互联网的价值沉淀在设备厂和广告平台
  • AGI的价值将沉淀在芯片公司(算力税)和模型公司(智能税)
  • 模型公司的附加值后面肯定比较高——"模型能力最强,就可以顺理成章解锁最伟大的应用"

模型公司做Agent的逻辑

广密认为Agent可能是模型公司的核心附加值体现:

巨头投入的受益链条

第一波:芯片

英伟达和台积电最先受益。

第二波:广告平台

Meta广告变现效率提高,Google广告变现效率可能在提。

第三波:云厂商

芯片和模型都跑在云上,企业上云需求很强,年化15%复合增长可能保持很长时间。

最终:两个终端

Apple(手机入口)和Tesla(物理AI终端)。

八、AGI大基建:物理瓶颈与能源账本

广密提出了本集最核心的概念——AGI大基建。他将当前AGI的状态类比为上世纪90年代克林顿推出美国信息高速公路建设:没有基建,就不可能有应用的大爆发。

核心框架

AGI的本质公式

电 + 芯片 = 产出智能

未来就看这个智能的产出效率和能力到底有多高。但最主要问题是——今天没办法给智能定价。所有AI产品定价都是20美元/月(SaaS based),未来能不能有Value based的定价?

历史上的大基建类比

时代基建内容催生的成果
曼哈顿计划造原子弹现代电子技术和整个计算机体系
美国登月太空竞赛电子产品微型化,个人电脑
1993年克林顿信息高速公路建设(GDP的5-6%)互联网泡沫+互联网黄金20年
中国近20年公路、5G、城市化短视频、直播、外卖、电商
当下AGIGPU产能、数据中心、能源基建待解锁——"基建来了应用才能大爆发"

能源账本:具体数字

训练不同级别模型的电力消耗对比

关键能源数据

  • 三峡单日最大发电量 / 上海日均用电量:约5亿度
  • 美国德州日用电量:约10亿度
  • GPT-3.5训练(500张H100,15天):约25万度电 = 三峡/上海的0.05%
  • GPT-4训练(8000张H100,100天):约2600万度电 = 三峡/上海一天的5%
  • GPT-5训练(3.2万张H100,100天):约1.1亿度电 = 三峡/上海一天的20%
  • 10万张H100年用电量:约12.4亿度 = 上海年用电量的0.8%,德州的0.3%

美国能源基建的结构性困难

美国过去20年总用电量稳定在4万亿度,数据中心用约2000亿度(5%)。但预计到2028年,数据中心用电将增至6700亿度——5年涨三倍,从5%增长到16%。广密指出:"这对制造和基建能力明显退化的美国来讲,挑战是很大的。"美国能源基建是四五十年前规划的,能源结构突然新增大量用电需求,"确实跟不上"。

九、训练GPT级模型的算力与成本

广密给出了训练不同级别模型的详细成本拆解,这些数字揭示了AGI大基建的真实门槛。

训练成本拆解

模型级别GPU需求训练时长买卡成本租卡成本
GPT-3.5~500张H10015天-较低
GPT-48000张H100(有效近万卡)100天3亿美金(含周边设备)1-2亿美元/年
GPT-5(估算)3.2万张H100100天12-13亿美金-
明年标配(预测)10万张-40-50亿美金-
李广密
3亿美金是GPT-4的入场券。现在有些公司是可以付得起的。中国公司也是可以负担得起的。但今天的万卡集群中国还是比较少的,瓶颈不在钱上——万卡集群是有钱不够的,它很难的。

训练量的科普公式

基本计算

训练量 = 参数量 x 训练Token数 x 6

以GPT-4为例:1.8万亿参数 x 13万亿Token x 6 = 25,000张A100(19.5 TFLOPS)x 60秒 x 60分钟 x 24小时 x 100天 x 利用率(一般50%,最强到60-70%)。

OpenAI的投入规模

数据中心建设的物理难题

万卡集群的挑战

  • 互联通信难度大——不是一层网络而是三层网络,拓扑结构很复杂
  • 稳定性要求极高
  • 能耗和降温要求高——很多人在提液冷
  • 需要找到适合GPU数据中心的土地和稳定便宜的电
  • "比特驱动的数字世界迭代很快,但原子驱动的物理世界迭代跟不上"

十、Scaling Law:加速、减速还是暂停

对于Scaling Law是否还有效,广密给出了细致的分析。

GPT-4的已知参数

1.8T
参数量(MOE架构)
~3T
训练数据量
2.5万
A100训练100天

Scale Up的算力瓶颈

如果下一代模型要Scale Up

  • 3倍参数 x 3倍数据 = 9倍Compute —— 老黄公布的3.2万张H100集群加上优化效率提升刚好够
  • 10倍参数 x 10倍数据 = 100倍Compute —— 现在GPU算力集群明显不够用
  • 又回到大基建问题:物理机器的瓶颈导致今天无法Scale Up

数据瓶颈

李广密
Scaling Law是没有减速的。如果说变慢了,就是算力和数据没凑够。GPT-3.5走到GPT-4大概用了二三十倍的算力提升,GPT-4走向下一代今天还没凑够二三十倍有效算力。

Scaling Law的终极结论

广密认为Scaling Law目前仍是通往AGI最大概率的路线——"没有找到除了这条路线以外的其他路径"。在没有证伪之前,应对投入更多资源验证。关键变量是两个:数据GPU。电力不是Research问题,通过投入能解决。但他也提出了一个深层疑问:Next Token架构到底能不能解决长期规划的问题?如果不能解决任务,Scaling下去意义不大。

十一、开源vs闭源:格局变化

广密在开源与闭源的判断上发生了微妙但重要的变化。

认知变化

上季度的观点

  • 闭源比开源好,而且好很多
  • 对开源价值持保留态度

本季度的调整

  • 闭源最强的仍然比开源强很多(复杂推理)
  • 简单任务开源模型可以完成
  • 开源会打掉闭源模型的部分商业价值
  • 开源模型会覆盖很多企业内需求场景

开源打掉闭源商业价值的逻辑

  • GPT-3.5水平的模型一旦开源,大家就不需要调用OpenAI的3.5 API
  • 如果马斯克的XAI持续开源,开源模型水位会很高
  • 但开源模型没有忠诚度——之前觉得Llama最好,现在觉得Mistral最好,未来Grok开源可能更好——"哪个好用就用谁"

影响模型差异的最大因素

李广密
如果只说一个,我觉得就是数据。大部分模型的架构比较统一,Training包括各种Recipe也比较统一。数据决定了这个模型作为产品的特点——也就是说数据决定了这个模型的性格。

广密特别指出,OpenAI同时具备数据的经验、基建和投入意愿。而对很多Researcher来讲,数据是脏活累活,很多人不愿意干——"有很多公司人才密度很高,但数据并没有做好"。Google就是例子:版权包袱重、Legal关注度高、方向没有拦到一起。

十二、中美AGI大基建差异

美国的优势

  • 大航海发现精神——面对不确定性的乐观冒险精神
  • 资本充足、退出畅通,支持0到1的试错和发现
  • 历史上芯片、计算机、互联网都是美国搞出来的
  • 重投入的传统,相信科学
  • 真的在做AGI

中国的特点

  • 解决问题的能力很强,但提出新问题很少
  • 0到1很少,但1到100很强
  • VC更"争气"——投了国内几家大模型公司从0到1起来
  • 芯片受限——"只能期待国产芯片,期待华为的卡"
  • 还在追GPT-4和审视低明——辨识度不够

一个反直觉的现象:美国VC反而miss了大模型

硅谷VC几乎全线miss掉了大模型投资——全都是巨头在支持的。中国VC好像更争气一些,还投了国内几家大模型从0到1起来。原因可能是:硅谷VC喜欢"小钱办大事"、以前在重资产上吃过亏(也miss了Tesla和SpaceX)。但这次不一样了——价值链发生了大变化,价值会沉淀在模型,大家都要交学费。

大基建的时间与规模

10-20年
大基建周期估计
3-4千亿$
3-4年后AI GPU产业年规模
30%+
GPU产能年复合增长率

广密预测:2024年GPU产能约400万片,2025年可能600多万片,未来每年复合增长不低于30%。"大基建看不到结束的那天"——计算的迭代可能停不下来,从单颗芯片的摩尔定律到整个数据中心的摩尔定律,再到跨数据中心效率提升。

十三、Sora、多模态与AGI主线之争

多模态的三层作用

  1. 补充数据:文本数据不够用了,多模态可以补充
  2. 用户体验:理解能力变强,交互效率大幅提升
  3. 生成能力:视频生成效果今年会大幅提升

但关键问题是:多模态数据对模型推理能力有没有大幅提升?今天还没有验证。这是不是AGI的主线,广密认为"见仁见智"。

Sora的技术门槛与成本

复刻Sora的难度

  • 训练环节是LLM的好几倍:估计4000-10000+张H100做一个多月的最后训练
  • 推理算力消耗很大:如果生成TikTok一天上传量(1500多万分钟),推理成本与训练差不多
  • 需要采集收集几千万到上亿小时视频数据,并用GPT-4V打标签——"一般团队弄不了"
  • 数据来源可能包括YouTube、游戏数据等
  • CTO Mira提到有机会把推理成本降到与图片生成差不多——那时才会公开release
李广密
Sora更多说明多模态能力进展会很快。OpenAI战线铺得更广了,好像不是那么高度聚焦在AGI这个事了。

创业公司应该跟进Sora吗?

广密直言"很凶险":需要融几亿美金,数据获取难度在LLM和机器人之间,卡和数据成本都很高。而且"视频等不等于智能"还有争议,"是不是一定要做到效果最好才有人买单更看不清"。建议创业公司不如想想如何定义Sora的产品形态和未来AI内容的消费形态

不同模态的上限差异

模态上限建议
大语言模型 + Coding最高智能能力强,核心竞争
视频很高进展会很快
声音、图片较低必须做好产品保证优势

十四、自动驾驶与机器人:从数字到物理

Tesla的矛盾处境

广密对Tesla的估值拆分

  • 汽车销售业务:约150亿美元利润,20倍PE = 3000亿美金
  • AI业务(FSD + 机器人):值另外两三千亿美金
  • 但华尔街今天还不太认FSD——FSD未对新车销售带来fundamental影响
  • 基本盘业务比较悲观:欧美疲软,中国竞争压力大,销量甚至负增长
  • "如果股价跌到100出头,我还是愿意买一点它的股票"

大模型对自动驾驶的帮助

机器人:比自动驾驶更难

机器人 vs 自动驾驶:关键维度对比

机器人的核心挑战

  • 最核心的还是数据问题——语言模型有过去几十年互联网积累的文本数据,机器人没有
  • 很多人想做机器人的Foundation Model(大脑),但没有大量训练数据
  • 现在很多机器人公司不超过100台机器,像Aloha那样采数据——数据量级太小
  • 不像Tesla几百万辆车全球每天采数据回传训练
  • 今天还不是商业和工业落地问题,还是research问题

机器人的希望

  • 多模态带来fundamental突破解决数据问题
  • 语言模型和机器人模型可能是一个模型
  • 通用机器人长期看好——可能是大模型之后最大的事
  • 成本降低:只有Tesla或中国供应链能解决

机器人的担忧

  • 现在没有像手机/汽车那样的刚需场景
  • 一台人形机器人10多万美金,离大规模商用很远
  • 现在加入"不知道要加入哪个"公司
  • 担心像2016年做自动驾驶——太早了
李广密
如果有机会深入下场创业,应该加入机器人团队。先去大模型再去机器人——机器人还需要更久一些。

十五、OpenAI解析与巨头结盟

对OpenAI的新认知

OpenAI的战略预测

广密的判断

  • OpenAI很难跟微软抢2B、跟英伟达抢芯片、跟Apple抢终端
  • Google是个软柿子——去抢信息检索市场比较make sense
  • 垂直领域不一定做(法律、金融、教育),但垂直领域数据会持续加上去
  • 比较关注OpenAI会不会做机器人——以前做过觉得太慢,但最近投了三家机器人公司

全球巨头结盟格局

联盟状态
微软 + OpenAI目前很稳定,但关系复杂(微软又投Mistral又收购Inflection还自己Train)
AWS + Anthropic互相被迫深入绑定,AWS销售已全线卖Claude 3
Google自成一体(TPU + 全栈)
XAI长期不排除并入Twitter/Tesla
Mistral必须抱大腿——未来一年得融1-3个Billion做万卡集群
阿里分散投资所有中国模型公司——辨识度不够高,但投资可绑定算力消耗

对Sam Altman的评价

李广密
Sam在OpenAI成名之前已经坚持做这个公司六七年了。很多人以前还不相信AGI这些东西。相比之下马斯克中途是下车了的。Sam非常值得尊敬——有很大的勇气去探索完全没有探索过的东西。

但广密也指出Sam的争议面:"感觉他不够真实,一直在努力维持一个比较有爱的形象"。以及一个硅谷都好奇的问题:"他怎么能有那么多钱?投一个公司都几千万上亿美金"。

十六、AGI时代的投资与Killer App

硅谷VC的三大投资主题

Coding
但核心能力来自模型公司
Agent
但模型公司会很激进做Agent
机器人
比较容易讲故事但太早

广密对这三大件都有怀疑:Coding一定在大模型公司和微软核心射程以内,模型公司可能会很激进做Agent,机器人很多Researcher创业因为容易讲故事但还有很多research问题没解决。

Killer App的形态

可能不是App形态

  • App还是互联网产物,AGI时代可能是更随时随地的Agent或Multimodal Agent
  • 信息检索是潜在Killer App方向——搜出答案而非链接
  • 自然语言编程确定性比较高——人人都是产品经理
  • 灵感激发/Brainstorm——广密个人用Claude 3最多的场景
  • 比较期待Agent今年能有一两个好的Use Case

朱啸虎观点的回应

朱啸虎说"AGI至少5到10年看不见"、能量量级需升级。广密表示大部分观点认可,但有几点不同:

十七、关键数据汇总

判断具体内容
AGI时间线从"百米冲刺"调整为"马拉松",至少3-5年甚至5-10年
AGI大基建周期10-20年,看不到结束的那天
AGI与GDP关系未来10-15年全球GDP从100T到200T,当前直接相关不到0.1%
第一梯队OpenAI、Anthropic、Google(3家确定)+ XAI(唯一黑马)
美国最终存活4家:OpenAI、Anthropic、Google、XAI
GPT-4训练成本买卡3亿美金起步,8000张H100训练100天
GPT-5训练成本3.2万张H100训练100天,约12-13亿美金
明年标配集群10万张H100,40-50亿美金
H100售价约3万美金/张,租金3-4美元/小时
英伟达H100年出货量2024年约400万片,2025年约600万片
AI GPU产业规模3-4年后将达3-4千亿美元
OpenAI年硬件投入约100亿美元
美国数据中心用电当前约2000亿度(5%),2028年预计6700亿度(16%)
训练GPT-5用电约1.1亿度 = 上海/三峡日用电量的20%
Scaling Law没有减速,瓶颈在算力和数据凑不够
Coding领域AGI三年内有机会看到
ChatGPT DAU约5000万,需突破到3亿才能fundamental影响Google
ChatGPT付费用户不到1000万,目标3000万(年60亿美金订阅)
OpenAI估值约1000亿美金(可看作微软AI部门)
云厂商增长年化15%复合增长可保持很长时间
数据中心大客户收敛到4-5家:微软、Meta、AWS、Google、XAI
人形机器人成本10多万美金,离大规模商用较远
模型差异最大因素数据——"数据决定了模型的性格"

启示与延伸思考

1. "电+芯片=产出智能"是AGI时代最简洁的本质公式

广密将AGI还原到最底层的物理逻辑:能源和计算硬件是产出智能的基础设施。这意味着AGI的竞争不仅是算法竞争(Research Lab之间的较量),更是基建竞争——谁能建更大的集群、拿到更多的电力、维持更长的投入周期。这解释了为什么巨头而非创业公司主导这个赛道,也解释了为什么Sam提出7T美金融资——因为这本质上是一个基建工程。

2. 物理世界的迭代速度是AGI真正的"减速带"

广密最核心的认知转变是:AGI从百米冲刺变成马拉松,不是因为算法遇到了瓶颈,而是因为物理硬件跟不上。数据中心建设要几个月、万卡互联通信极其困难、美国能源基建是四五十年前规划的。"比特驱动的数字世界迭代很快,原子驱动的物理世界迭代跟不上"——这一判断在两年后看依然深刻,也被后来英伟达持续供不应求所验证。

3. "两道税"结构改变了整个科技产业的价值分配

广密提出的"算力税+智能税"框架是理解AGI时代价值链最清晰的模型。过去十年的"苹果入口税"让Apple成为3万亿公司,而算力税+智能税同时作用,意味着价值将更集中地流向英伟达和头部模型公司。这与传统VC"小钱办大事"的逻辑完全冲突——难怪硅谷VC全线miss掉了大模型投资。

4. "渐进式解锁"才是AGI的正确打开方式

广密反复强调AGI不是一个"某天突然到来"的临界点,而是一个从0.1%到20%到90%的GDP渗透过程。每次模型能力提升都会解锁新场景、诞生新应用。这意味着:(1) 不需要等到"真正的AGI"才能创造价值;(2) 每一次Scale Up的ROI都需要被具体场景验证;(3) Agent能否落地完成复杂任务是关键观测点。两年后回看,coding确实成了AGI最早落地的信号。

5. 数据中心大客户收敛到4-5家是结构性判断

广密预测建大集群的客户会收敛到微软、Meta、AWS、Google和XAI这4-5家。这意味着AGI的底层基础设施实际上是寡头垄断的。对创业公司而言,不在这个名单上就意味着永远在租算力——成本结构和迭代速度都会受制于人。Inflection的出局是第一个案例,后续还会有更多。

6. 开源的价值在于"拉高水位线"而非"替代闭源"

广密对开源的认知发生了微妙变化:不再认为闭源对开源有压倒性优势。开源模型在简单任务上已经可用,会打掉闭源模型的部分商业价值。但闭源在复杂推理上仍然领先很多——这是完成有经济价值任务的关键。开源的战略意义在于马斯克XAI:如果持续开源,整个开源水位线会被大幅拉高,二三线闭源公司的商业空间会被严重压缩。

7. 机器人是"大模型之后最大的事"但时机未到

广密对机器人的判断充满矛盾性的诚实:一方面认为"如果有机会深入下场创业应该加入机器人团队",另一方面承认"今天不知道要加入哪个"——因为现有的机器人公司"都不像能scalable一直走很远的"。核心瓶颈仍是数据:语言模型有几十年互联网积累的文本数据,而机器人数据采集量级太小。广密期待多模态突破能从根本上解决这个问题。这与后来的VLA(视觉-语言-动作模型)方向高度吻合。

8. Scaling Law没有减速,但Next Token架构能否解决长期规划?

广密在坚定支持Scaling Law的同时提出了一个深层质疑:Next Token架构到底能不能解决长期规划问题?如果Agent不能完成复杂任务,Scaling下去意义不大。这个问题在两年后仍然是AGI研究最核心的争议之一——OpenAI后来通过o1/o3的推理链、Anthropic通过Claude的工具使用能力,都在试图回答这个问题。

9. "挑软柿子"——OpenAI最理性的战略方向是打Google

广密用排除法推导出OpenAI的最优战略:难打微软的2B、难抢英伟达的芯片、难夺Apple的终端,Google的信息检索市场是"最肥的软柿子"。ChatGPT做到3亿DAU + 3000万付费用户就能年入60亿美金,健康支撑AGI投入。这个预测与OpenAI后续推出SearchGPT、与Perplexity在搜索领域的竞争完全吻合。

延伸阅读