深度研究 — #64 和广密聊AGI大基建时代：电+芯片=产出智能

2024Q1全球大模型大事件复盘
大模型公司梯队与XAI黑马
英伟达GTC与黄仁勋的"算力税"
AGI的定义与"渐进式解锁"
改变软件生产方式与挑战Google
AGI的登山路线图：南坡与北坡
模型公司即价值沉淀之地
AGI大基建：物理瓶颈与能源账本
训练GPT级模型的算力与成本
Scaling Law：加速、减速还是暂停
开源vs闭源：格局变化
中美AGI大基建差异
Sora、多模态与AGI主线之争
自动驾驶与机器人：从数字到物理
OpenAI解析与巨头结盟
AGI时代的投资与Killer App
关键数据汇总

一、2024Q1全球大模型大事件复盘

2024年一季度，全球AI领域密集发生了一系列重大事件。李广密（实相科技CEO）从信息密度和战略影响两个维度做了系统复盘。

Q1核心事件清单

事件	广密的判断
OpenAI发布Sora	比预期来得早，多模态理解和生成的进步幅度会很大，会解锁很多新东西
Anthropic发布Claude 3	Sota易主，但OpenAI并没有如预期快速反击
GPT-4.5/5未发布	比预期来得慢，说明AGI战线被拉长拉宽
马斯克XAI加入开源	全球范围内争夺第一梯队的唯一黑马，开源水位线大幅提升
Google加入开源大战	发的是小模型，不会把最强模型开源，开源主力仍是XAI和Llama
英伟达GTC	被冠以"新科技界春晚"，英伟达股价一年涨三倍
微软收购Inflection	模型公司收敛的信号，Inflection成为"第一个失败的VC重铸的大模型公司"

李广密

去年初觉得AGI是一个百米冲刺，大家都没做好准备。今年就觉得AGI应该是马拉松，大家都有充足的时间做准备。

从百米冲刺到马拉松的认知转变

这是广密在一个季度内最大的认知变化。去年觉得可以"无限加GPU加数据就能到AGI"，但突然发现GPU数据中心和物理硬件是巨大的瓶颈。物理硬件成为阻碍AGI时间表的最大因素——这一判断贯穿全篇。

二、大模型公司梯队与XAI黑马

广密对全球大模型公司做了明确的梯队划分，并指出了每个梯队的生死线。

3家

确定的第一梯队

1家

唯一黑马（XAI）

4家

美国最终存活

全球梯队划分

梯队	公司	判断
第一梯队	OpenAI、Anthropic、Google	明确的第一梯队，人才密度最高
第二梯队（含黑马）	XAI、Mistral、Meta Llama	XAI是唯一有机会冲击第一梯队的黑马
出局/危险	Inflection、Character、Cohere	"今年年内就得找买家了"

Inflection提供的案例教训

没想到模型收敛如此之快，计算竞争是很残酷的
Inflection没有绑定一个更深的巨头——"大模型VC是投不动的，还是一个巨头的游戏"
关键还是人才密度：前三家加上XAI明显高一阶，其他公司有明显差异

李广密

XAI有两个层面：第一它是全球范围内争夺第一梯队的唯一的黑马；第二如果它持续开源，对整个模型的格局生态和商业价值影响比较大。

生死线判断

技术上：今年内必须超过GPT-4水平，二三线公司至少超过最好的开源模型
基础设施上：今年必须用上万卡集群——"能做好万卡集群的公司还是比较少"
未来12个月：能不能有10万张H100的集群，大概3-10亿美元投入——这才是"明年第一梯队模型的标配"

三、英伟达GTC与黄仁勋的"算力税"

广密亲赴GTC现场，对黄仁勋和英伟达在AGI浪潮中的地位给出了极高评价。

李广密

硅谷最亮的仔，就从马斯克切换到老黄了。很多马斯克的粉丝变成老黄的粉丝，投资者的资金也从Tesla转到了英伟达。

黄仁勋的核心贡献

直接驱动了这波AGI浪潮，贡献不输OpenAI
"算法等了算力30年"——半导体是人类最伟大的发明，计算还会驱动未来几十年
AGI短期来看，老黄可能比Sam更重要——"AGI没有Sam可以，没有老黄不行"

主权AI：把GPU卖给政府

黄仁勋的市场扩展

以前GPU卖给美国科技公司，现在提出"主权AI"——把GPU卖给政府吃国防预算
美国军费每年8800亿美金，2-3%买GPU就是一个巨大的量
GPU是"极其重要的战略储备物资"
销售能力超强——市场规模又大了一步

老黄的管理风格

T5T制度

内部每双周，每个大组发出最重要的五件事
这是一个非常好的管理习惯

工作文化

鼓励在办公室吃早饭和午饭
但鼓励大家晚饭回家陪家人
不鼓励996

核心判断

"算力税"与"智能税"

广密提出了一个结构性判断：人类社会将新增两道税——

算力税：所有商业社会都要给英伟达交算力税，就像过去十年给苹果交入口税
智能税：模型公司将收取"智能税"——模型能力最强的公司顺理成章解锁最伟大的应用

人类又多了两个"收税的基石公司"。

四、AGI的定义与"渐进式解锁"

广密认为对AGI的理解尚无共识，"就很像共产主义或者财务自由，因人而异"。

AGI的三种理解角度

角度一：三个90%

最激进的定义：AGI能在90%的行业，超过90%的专家，完成都有经济价值的工作。"我觉得这三个90%还是很激进的。"

角度二：智能能力本身

最重要的还是智能能力本身，不是形态和载体。"但肯定会从数字世界走向物理世界"——物理的机器人和设备怎么把智能产品化，是创业者很大的机会。

角度三：渐进式解锁（核心观点）

AGI不是一蹴而就的。广密提出关键词——"渐进式解锁"：画一条登山路线图，模型能力每涨一些，就会解锁一些场景，诞生一些应用，创造相应的经济价值。

李广密

AGI能在未来10到15年让全球GDP翻倍，从今天的100T涨到200T。但今天100T的GDP和这波AGI直接相关的可能还不到0.1%。离解锁90%还很远。

AGI渐进式解锁：从0.1%到90%的GDP渗透路径

"5秒任务"理论

Sam曾提出不应从替代人的角度思考，而是看所有工作任务中有多少需要5秒内就能完成的——这些是模型第一波能做掉的。广密认为这个框架结合"渐进式解锁"来理解最为合适：从5秒任务扩展到5分钟任务，再到5小时任务，每一次扩展都解锁新的经济价值。

五、改变软件生产方式与挑战Google

广密认为AGI登山路线图的近处，最值得期待的两个方向是：改变软件生产方式和信息检索的变革。

软件生产方式的颠覆

过去的软件（自动贩卖机）

有限的SKU供给
大量非标需求未被满足
固定需求抽象 + 开发团队开发
开发者几千万人

未来的软件（98调酒）

任何口味都可以调出来
精准/简单的自然语言描述
模型用工具调用或coding生成复杂代码
人人都是产品经理

李广密

三年内是有机会看到coding领域的AGI的——也就是做各种任务都不错的一个程序员。因为大部分任务，其实没有像软件开发这么明确和有逻辑。

挑战Google的历史性窗口

为什么这次不同

过去20年无数对手挑战Google都失败了——核心原因是没有fundamental的技术变革
这一次大模型给了大家机会——搜索从"搜出链接和网页"变成"搜出答案"
问答可能是"皇冠上的明珠"——能解决好就能获得用户信任和长期留存
ChatGPT从5000万DAU突破到几个亿必须做搜索——"这是挑战Google过去20年可能唯一的一个技术窗口"

SaaS公司的危机

微软和OpenAI激进推进，有可能把很多工具型、feature型的SaaS都干掉。只有积累了很深的workflow和数据的软件公司（如Salesforce、ServiceNow）可能还能发展。广密对SaaS公司的建议："只能积极拥抱，组织上多用好年轻人。"

六、AGI的登山路线图：南坡与北坡

广密用登山的比喻构建了AGI的完整路线图——南坡是模型，北坡是产品。

南坡：模型能力

底层：Scaling（更多数据+GPU+能源）

看产出智能的效率是否能持续提高。

核心：推理能力（Reasoning）

模型最重要的能力，需要复杂推理才能完成有经济价值的工作任务。

关键信号：Coding代码能力

"可能是AGI最早落地的一个信号——它既是一个走向AGI的能力，也是一个产品。"

多模态能力

对自动驾驶和机器人有提速作用，更多数据交互效率。

Agent

关键词但今天还不太work——"最主要是模型的Reasoning能力不够强也不够准确，多步推理下来很多任务都失败了。"

北坡：产品

谁能做出上亿活跃用户的Killer App——今天可能只有ChatGPT
信息检索：搜出答案而非链接，多模态搜索，主动式交互
ChatGPT做到3亿DAU才能对Google产生fundamental影响

李广密

如果让模型看1万次苹果掉下来，它能不能发现万有引力定律？如果更充足的更广范围的数据灌进去，它们能不能发现人类没有发现的问题、没有发现的规律？我觉得这有可能是一个新的文艺复兴。

南坡和北坡必须是一家公司吗？

广密的判断

不一定在一家公司——对组织能力、文化、人才和资源挑战很大
但模型公司做产品更容易——产品解决不了的任务可以向下改模型；产品公司改不了模型
SpaceX类比：火箭发射是基础能力（每年几十亿收入），Starlink是Killer App（几百万终端），Starship可能颠覆波音空客
"如果大模型是电，那灯泡不一定是电厂做出来的"

七、模型公司即价值沉淀之地

广密提出了一个重要的价值链判断：模型公司可能是价值最终沉淀的地方。

核心论点

两层价值结构

AGI时代的价值链与移动互联网完全不同：

移动互联网的价值沉淀在设备厂和广告平台
AGI的价值将沉淀在芯片公司（算力税）和模型公司（智能税）
模型公司的附加值后面肯定比较高——"模型能力最强，就可以顺理成章解锁最伟大的应用"

模型公司做Agent的逻辑

广密认为Agent可能是模型公司的核心附加值体现：

"模型公司可能就是Agent的公司"——很多Agent当模型本身可能就会自己做
第一波叙事大家讲Scaling，后面会讲Agent
Agent是公司的大附加值体现
但现在Agent还不work：Cognition和Magic没啥收入甚至没客户，估值已2B——"硅谷对Coding的hype还是比较高的"

巨头投入的受益链条

第一波：芯片

英伟达和台积电最先受益。

第二波：广告平台

Meta广告变现效率提高，Google广告变现效率可能在提。

第三波：云厂商

芯片和模型都跑在云上，企业上云需求很强，年化15%复合增长可能保持很长时间。

最终：两个终端

Apple（手机入口）和Tesla（物理AI终端）。

八、AGI大基建：物理瓶颈与能源账本

广密提出了本集最核心的概念——AGI大基建。他将当前AGI的状态类比为上世纪90年代克林顿推出美国信息高速公路建设：没有基建，就不可能有应用的大爆发。

核心框架

AGI的本质公式

电 + 芯片 = 产出智能

未来就看这个智能的产出效率和能力到底有多高。但最主要问题是——今天没办法给智能定价。所有AI产品定价都是20美元/月（SaaS based），未来能不能有Value based的定价？

历史上的大基建类比

时代	基建内容	催生的成果
曼哈顿计划	造原子弹	现代电子技术和整个计算机体系
美国登月	太空竞赛	电子产品微型化，个人电脑
1993年克林顿	信息高速公路建设（GDP的5-6%）	互联网泡沫+互联网黄金20年
中国近20年	公路、5G、城市化	短视频、直播、外卖、电商
当下AGI	GPU产能、数据中心、能源基建	待解锁——"基建来了应用才能大爆发"

能源账本：具体数字

训练不同级别模型的电力消耗对比

关键能源数据

三峡单日最大发电量 / 上海日均用电量：约5亿度
美国德州日用电量：约10亿度
GPT-3.5训练（500张H100，15天）：约25万度电 = 三峡/上海的0.05%
GPT-4训练（8000张H100，100天）：约2600万度电 = 三峡/上海一天的5%
GPT-5训练（3.2万张H100，100天）：约1.1亿度电 = 三峡/上海一天的20%
10万张H100年用电量：约12.4亿度 = 上海年用电量的0.8%，德州的0.3%

美国能源基建的结构性困难

美国过去20年总用电量稳定在4万亿度，数据中心用约2000亿度（5%）。但预计到2028年，数据中心用电将增至6700亿度——5年涨三倍，从5%增长到16%。广密指出："这对制造和基建能力明显退化的美国来讲，挑战是很大的。"美国能源基建是四五十年前规划的，能源结构突然新增大量用电需求，"确实跟不上"。

九、训练GPT级模型的算力与成本

广密给出了训练不同级别模型的详细成本拆解，这些数字揭示了AGI大基建的真实门槛。

训练成本拆解

模型级别	GPU需求	训练时长	买卡成本	租卡成本
GPT-3.5	~500张H100	15天	-	较低
GPT-4	8000张H100（有效近万卡）	100天	3亿美金（含周边设备）	1-2亿美元/年
GPT-5（估算）	3.2万张H100	100天	12-13亿美金	-
明年标配（预测）	10万张	-	40-50亿美金	-

李广密

3亿美金是GPT-4的入场券。现在有些公司是可以付得起的。中国公司也是可以负担得起的。但今天的万卡集群中国还是比较少的，瓶颈不在钱上——万卡集群是有钱不够的，它很难的。

训练量的科普公式

基本计算

训练量 = 参数量 x 训练Token数 x 6

以GPT-4为例：1.8万亿参数 x 13万亿Token x 6 = 25,000张A100（19.5 TFLOPS）x 60秒 x 60分钟 x 24小时 x 100天 x 利用率（一般50%，最强到60-70%）。

OpenAI的投入规模

微软给OpenAI投了130亿美金，大概能买30-40万张卡
英伟达H100年出货量约400万片，假设5%给OpenAI = 每年新增20万张
每张卡3万美金 + 其他设备约5万美金，一年新增100亿美元硬件投入
"这样算好像OpenAI的钱也不够"——估计还得做更大规模融资
头部AGI公司每年至少几个Billion的投入，而且要投很多年

数据中心建设的物理难题

万卡集群的挑战

互联通信难度大——不是一层网络而是三层网络，拓扑结构很复杂
稳定性要求极高
能耗和降温要求高——很多人在提液冷
需要找到适合GPU数据中心的土地和稳定便宜的电
"比特驱动的数字世界迭代很快，但原子驱动的物理世界迭代跟不上"

十、Scaling Law：加速、减速还是暂停

对于Scaling Law是否还有效，广密给出了细致的分析。

GPT-4的已知参数

1.8T

参数量（MOE架构）

~3T

训练数据量

2.5万

A100训练100天

Scale Up的算力瓶颈

如果下一代模型要Scale Up

3倍参数 x 3倍数据 = 9倍Compute —— 老黄公布的3.2万张H100集群加上优化效率提升刚好够
10倍参数 x 10倍数据 = 100倍Compute —— 现在GPU算力集群明显不够用
又回到大基建问题：物理机器的瓶颈导致今天无法Scale Up

数据瓶颈

增加数据可能比增加参数ROI更高
文本数据不够用——通过合成、改写可以扩大几倍
但要拿出GPT-410倍的数据（100多TB高质量数据）"可能没有人能拿出来"
多模态数据和文本数据一起训练很难——容易伤害原模型，还有很多Research问题
GPT-5的数据够用，但GPT-6肯定需要突破

李广密

Scaling Law是没有减速的。如果说变慢了，就是算力和数据没凑够。GPT-3.5走到GPT-4大概用了二三十倍的算力提升，GPT-4走向下一代今天还没凑够二三十倍有效算力。

Scaling Law的终极结论

广密认为Scaling Law目前仍是通往AGI最大概率的路线——"没有找到除了这条路线以外的其他路径"。在没有证伪之前，应对投入更多资源验证。关键变量是两个：数据和GPU。电力不是Research问题，通过投入能解决。但他也提出了一个深层疑问：Next Token架构到底能不能解决长期规划的问题？如果不能解决任务，Scaling下去意义不大。

十一、开源vs闭源：格局变化

广密在开源与闭源的判断上发生了微妙但重要的变化。

认知变化

上季度的观点

闭源比开源好，而且好很多
对开源价值持保留态度

本季度的调整

闭源最强的仍然比开源强很多（复杂推理）
但简单任务开源模型可以完成
开源会打掉闭源模型的部分商业价值
开源模型会覆盖很多企业内需求场景

开源打掉闭源商业价值的逻辑

GPT-3.5水平的模型一旦开源，大家就不需要调用OpenAI的3.5 API
如果马斯克的XAI持续开源，开源模型水位会很高
但开源模型没有忠诚度——之前觉得Llama最好，现在觉得Mistral最好，未来Grok开源可能更好——"哪个好用就用谁"

影响模型差异的最大因素

李广密

如果只说一个，我觉得就是数据。大部分模型的架构比较统一，Training包括各种Recipe也比较统一。数据决定了这个模型作为产品的特点——也就是说数据决定了这个模型的性格。

广密特别指出，OpenAI同时具备数据的经验、基建和投入意愿。而对很多Researcher来讲，数据是脏活累活，很多人不愿意干——"有很多公司人才密度很高，但数据并没有做好"。Google就是例子：版权包袱重、Legal关注度高、方向没有拦到一起。

十二、中美AGI大基建差异

美国的优势

大航海发现精神——面对不确定性的乐观冒险精神
资本充足、退出畅通，支持0到1的试错和发现
历史上芯片、计算机、互联网都是美国搞出来的
重投入的传统，相信科学
真的在做AGI

中国的特点

解决问题的能力很强，但提出新问题很少
0到1很少，但1到100很强
VC更"争气"——投了国内几家大模型公司从0到1起来
芯片受限——"只能期待国产芯片，期待华为的卡"
还在追GPT-4和审视低明——辨识度不够

一个反直觉的现象：美国VC反而miss了大模型

硅谷VC几乎全线miss掉了大模型投资——全都是巨头在支持的。中国VC好像更争气一些，还投了国内几家大模型从0到1起来。原因可能是：硅谷VC喜欢"小钱办大事"、以前在重资产上吃过亏（也miss了Tesla和SpaceX）。但这次不一样了——价值链发生了大变化，价值会沉淀在模型，大家都要交学费。

大基建的时间与规模

10-20年

大基建周期估计

3-4千亿$

3-4年后AI GPU产业年规模

30%+

GPU产能年复合增长率

广密预测：2024年GPU产能约400万片，2025年可能600多万片，未来每年复合增长不低于30%。"大基建看不到结束的那天"——计算的迭代可能停不下来，从单颗芯片的摩尔定律到整个数据中心的摩尔定律，再到跨数据中心效率提升。

十三、Sora、多模态与AGI主线之争

多模态的三层作用

补充数据：文本数据不够用了，多模态可以补充
用户体验：理解能力变强，交互效率大幅提升
生成能力：视频生成效果今年会大幅提升

但关键问题是：多模态数据对模型推理能力有没有大幅提升？今天还没有验证。这是不是AGI的主线，广密认为"见仁见智"。

Sora的技术门槛与成本

复刻Sora的难度

训练环节是LLM的好几倍：估计4000-10000+张H100做一个多月的最后训练
推理算力消耗很大：如果生成TikTok一天上传量（1500多万分钟），推理成本与训练差不多
需要采集收集几千万到上亿小时视频数据，并用GPT-4V打标签——"一般团队弄不了"
数据来源可能包括YouTube、游戏数据等
CTO Mira提到有机会把推理成本降到与图片生成差不多——那时才会公开release

李广密

Sora更多说明多模态能力进展会很快。OpenAI战线铺得更广了，好像不是那么高度聚焦在AGI这个事了。

创业公司应该跟进Sora吗？

广密直言"很凶险"：需要融几亿美金，数据获取难度在LLM和机器人之间，卡和数据成本都很高。而且"视频等不等于智能"还有争议，"是不是一定要做到效果最好才有人买单更看不清"。建议创业公司不如想想如何定义Sora的产品形态和未来AI内容的消费形态。

不同模态的上限差异

模态	上限	建议
大语言模型 + Coding	最高	智能能力强，核心竞争
视频	很高	进展会很快
声音、图片	较低	必须做好产品保证优势

十四、自动驾驶与机器人：从数字到物理

Tesla的矛盾处境

广密对Tesla的估值拆分

汽车销售业务：约150亿美元利润，20倍PE = 3000亿美金
AI业务（FSD + 机器人）：值另外两三千亿美金
但华尔街今天还不太认FSD——FSD未对新车销售带来fundamental影响
基本盘业务比较悲观：欧美疲软，中国竞争压力大，销量甚至负增长
"如果股价跌到100出头，我还是愿意买一点它的股票"

大模型对自动驾驶的帮助

多模态能力变强后，Corner Case的筛选和解决效率更高
Waymo在旧金山跑得非常好——以前每辆车一人监控，现在一人监控四辆
如果多模态能力强到AI能帮忙监控400-4000辆车，Operation Cost会降得很低，有利于大规模普及
FSD安全性已超过平均司机水平
更大的变革可能性：没有方向盘、卖车免费、把里程价值做更高

机器人：比自动驾驶更难

机器人 vs 自动驾驶：关键维度对比

机器人的核心挑战

最核心的还是数据问题——语言模型有过去几十年互联网积累的文本数据，机器人没有
很多人想做机器人的Foundation Model（大脑），但没有大量训练数据
现在很多机器人公司不超过100台机器，像Aloha那样采数据——数据量级太小
不像Tesla几百万辆车全球每天采数据回传训练
今天还不是商业和工业落地问题，还是research问题

机器人的希望

多模态带来fundamental突破解决数据问题
语言模型和机器人模型可能是一个模型
通用机器人长期看好——可能是大模型之后最大的事
成本降低：只有Tesla或中国供应链能解决

机器人的担忧

现在没有像手机/汽车那样的刚需场景
一台人形机器人10多万美金，离大规模商用很远
现在加入"不知道要加入哪个"公司
担心像2016年做自动驾驶——太早了

李广密

如果有机会深入下场创业，应该加入机器人团队。先去大模型再去机器人——机器人还需要更久一些。

十五、OpenAI解析与巨头结盟

对OpenAI的新认知

AGI时间拉长了——以前觉得两年，现在至少3-5年甚至5-10年
AGI公司一开始不应该太激进做产品——但OpenAI好像很激进
理解了"渐进式解锁"——不是一蹴而就的
OpenAI每年需要几个Billion甚至十个Billion投入——纯靠融资融不到那么多钱，需要健康的现金流
2C方面ChatGPT做到3000万付费用户就是年60亿美金订阅收入，可以健康支撑AGI投入
2B方面可能被微软拿走很大一部分——企业客户讲信任，OpenAI"容易瞎搞"的印象是障碍

OpenAI的战略预测

广密的判断

OpenAI很难跟微软抢2B、跟英伟达抢芯片、跟Apple抢终端
Google是个软柿子——去抢信息检索市场比较make sense
垂直领域不一定做（法律、金融、教育），但垂直领域数据会持续加上去
比较关注OpenAI会不会做机器人——以前做过觉得太慢，但最近投了三家机器人公司

全球巨头结盟格局

联盟	状态
微软 + OpenAI	目前很稳定，但关系复杂（微软又投Mistral又收购Inflection还自己Train）
AWS + Anthropic	互相被迫深入绑定，AWS销售已全线卖Claude 3
Google	自成一体（TPU + 全栈）
XAI	长期不排除并入Twitter/Tesla
Mistral	必须抱大腿——未来一年得融1-3个Billion做万卡集群
阿里	分散投资所有中国模型公司——辨识度不够高，但投资可绑定算力消耗

对Sam Altman的评价

李广密

Sam在OpenAI成名之前已经坚持做这个公司六七年了。很多人以前还不相信AGI这些东西。相比之下马斯克中途是下车了的。Sam非常值得尊敬——有很大的勇气去探索完全没有探索过的东西。

但广密也指出Sam的争议面："感觉他不够真实，一直在努力维持一个比较有爱的形象"。以及一个硅谷都好奇的问题："他怎么能有那么多钱？投一个公司都几千万上亿美金"。

十六、AGI时代的投资与Killer App

硅谷VC的三大投资主题

Coding

但核心能力来自模型公司

Agent

但模型公司会很激进做Agent

机器人

比较容易讲故事但太早

广密对这三大件都有怀疑：Coding一定在大模型公司和微软核心射程以内，模型公司可能会很激进做Agent，机器人很多Researcher创业因为容易讲故事但还有很多research问题没解决。

Killer App的形态

可能不是App形态

App还是互联网产物，AGI时代可能是更随时随地的Agent或Multimodal Agent
信息检索是潜在Killer App方向——搜出答案而非链接
自然语言编程确定性比较高——人人都是产品经理
灵感激发/Brainstorm——广密个人用Claude 3最多的场景
比较期待Agent今年能有一两个好的Use Case

对朱啸虎观点的回应

朱啸虎说"AGI至少5到10年看不见"、能量量级需升级。广密表示大部分观点认可，但有几点不同：

技术可能遇到短暂瓶颈但后面还会有跳跃——"过去一年可能是第一波小升浪，后面还会有更大的主升浪"
降低90%的工作三到五年实现已经很乐观——"剩下10%才是人类的价值"
相信摩尔定律、模型计算效率和推理效率会大幅提升
"五到十年内看到AGI是充满信心的——相信科学会有突破，相信这帮科学家"

十七、关键数据汇总

判断	具体内容
AGI时间线	从"百米冲刺"调整为"马拉松"，至少3-5年甚至5-10年
AGI大基建周期	10-20年，看不到结束的那天
AGI与GDP关系	未来10-15年全球GDP从100T到200T，当前直接相关不到0.1%
第一梯队	OpenAI、Anthropic、Google（3家确定）+ XAI（唯一黑马）
美国最终存活	4家：OpenAI、Anthropic、Google、XAI
GPT-4训练成本	买卡3亿美金起步，8000张H100训练100天
GPT-5训练成本	3.2万张H100训练100天，约12-13亿美金
明年标配集群	10万张H100，40-50亿美金
H100售价	约3万美金/张，租金3-4美元/小时
英伟达H100年出货量	2024年约400万片，2025年约600万片
AI GPU产业规模	3-4年后将达3-4千亿美元
OpenAI年硬件投入	约100亿美元
美国数据中心用电	当前约2000亿度（5%），2028年预计6700亿度（16%）
训练GPT-5用电	约1.1亿度 = 上海/三峡日用电量的20%
Scaling Law	没有减速，瓶颈在算力和数据凑不够
Coding领域AGI	三年内有机会看到
ChatGPT DAU	约5000万，需突破到3亿才能fundamental影响Google
ChatGPT付费用户	不到1000万，目标3000万（年60亿美金订阅）
OpenAI估值	约1000亿美金（可看作微软AI部门）
云厂商增长	年化15%复合增长可保持很长时间
数据中心大客户	收敛到4-5家：微软、Meta、AWS、Google、XAI
人形机器人成本	10多万美金，离大规模商用较远
模型差异最大因素	数据——"数据决定了模型的性格"

启示与延伸思考

1. "电+芯片=产出智能"是AGI时代最简洁的本质公式

广密将AGI还原到最底层的物理逻辑：能源和计算硬件是产出智能的基础设施。这意味着AGI的竞争不仅是算法竞争（Research Lab之间的较量），更是基建竞争——谁能建更大的集群、拿到更多的电力、维持更长的投入周期。这解释了为什么巨头而非创业公司主导这个赛道，也解释了为什么Sam提出7T美金融资——因为这本质上是一个基建工程。

2. 物理世界的迭代速度是AGI真正的"减速带"

广密最核心的认知转变是：AGI从百米冲刺变成马拉松，不是因为算法遇到了瓶颈，而是因为物理硬件跟不上。数据中心建设要几个月、万卡互联通信极其困难、美国能源基建是四五十年前规划的。"比特驱动的数字世界迭代很快，原子驱动的物理世界迭代跟不上"——这一判断在两年后看依然深刻，也被后来英伟达持续供不应求所验证。

3. "两道税"结构改变了整个科技产业的价值分配

广密提出的"算力税+智能税"框架是理解AGI时代价值链最清晰的模型。过去十年的"苹果入口税"让Apple成为3万亿公司，而算力税+智能税同时作用，意味着价值将更集中地流向英伟达和头部模型公司。这与传统VC"小钱办大事"的逻辑完全冲突——难怪硅谷VC全线miss掉了大模型投资。

4. "渐进式解锁"才是AGI的正确打开方式

广密反复强调AGI不是一个"某天突然到来"的临界点，而是一个从0.1%到20%到90%的GDP渗透过程。每次模型能力提升都会解锁新场景、诞生新应用。这意味着：(1) 不需要等到"真正的AGI"才能创造价值；(2) 每一次Scale Up的ROI都需要被具体场景验证；(3) Agent能否落地完成复杂任务是关键观测点。两年后回看，coding确实成了AGI最早落地的信号。

5. 数据中心大客户收敛到4-5家是结构性判断

广密预测建大集群的客户会收敛到微软、Meta、AWS、Google和XAI这4-5家。这意味着AGI的底层基础设施实际上是寡头垄断的。对创业公司而言，不在这个名单上就意味着永远在租算力——成本结构和迭代速度都会受制于人。Inflection的出局是第一个案例，后续还会有更多。

6. 开源的价值在于"拉高水位线"而非"替代闭源"

广密对开源的认知发生了微妙变化：不再认为闭源对开源有压倒性优势。开源模型在简单任务上已经可用，会打掉闭源模型的部分商业价值。但闭源在复杂推理上仍然领先很多——这是完成有经济价值任务的关键。开源的战略意义在于马斯克XAI：如果持续开源，整个开源水位线会被大幅拉高，二三线闭源公司的商业空间会被严重压缩。

7. 机器人是"大模型之后最大的事"但时机未到

广密对机器人的判断充满矛盾性的诚实：一方面认为"如果有机会深入下场创业应该加入机器人团队"，另一方面承认"今天不知道要加入哪个"——因为现有的机器人公司"都不像能scalable一直走很远的"。核心瓶颈仍是数据：语言模型有几十年互联网积累的文本数据，而机器人数据采集量级太小。广密期待多模态突破能从根本上解决这个问题。这与后来的VLA（视觉-语言-动作模型）方向高度吻合。

8. Scaling Law没有减速，但Next Token架构能否解决长期规划？

广密在坚定支持Scaling Law的同时提出了一个深层质疑：Next Token架构到底能不能解决长期规划问题？如果Agent不能完成复杂任务，Scaling下去意义不大。这个问题在两年后仍然是AGI研究最核心的争议之一——OpenAI后来通过o1/o3的推理链、Anthropic通过Claude的工具使用能力，都在试图回答这个问题。

9. "挑软柿子"——OpenAI最理性的战略方向是打Google

广密用排除法推导出OpenAI的最优战略：难打微软的2B、难抢英伟达的芯片、难夺Apple的终端，Google的信息检索市场是"最肥的软柿子"。ChatGPT做到3亿DAU + 3000万付费用户就能年入60亿美金，健康支撑AGI投入。这个预测与OpenAI后续推出SearchGPT、与Perplexity在搜索领域的竞争完全吻合。

AGI大基建时代：电+芯片=产出智能

目录

一、2024Q1全球大模型大事件复盘

Q1核心事件清单

从百米冲刺到马拉松的认知转变

二、大模型公司梯队与XAI黑马

全球梯队划分

Inflection提供的案例教训

生死线判断

三、英伟达GTC与黄仁勋的"算力税"

黄仁勋的核心贡献

主权AI：把GPU卖给政府

黄仁勋的市场扩展

老黄的管理风格

T5T制度

工作文化

"算力税"与"智能税"

四、AGI的定义与"渐进式解锁"

AGI的三种理解角度

角度一：三个90%

角度二：智能能力本身

角度三：渐进式解锁（核心观点）

五、改变软件生产方式与挑战Google

软件生产方式的颠覆

过去的软件（自动贩卖机）

未来的软件（98调酒）

挑战Google的历史性窗口

为什么这次不同

SaaS公司的危机

六、AGI的登山路线图：南坡与北坡

南坡：模型能力

底层：Scaling（更多数据+GPU+能源）

核心：推理能力（Reasoning）

关键信号：Coding代码能力

多模态能力

Agent

北坡：产品

南坡和北坡必须是一家公司吗？

广密的判断

七、模型公司即价值沉淀之地

两层价值结构

模型公司做Agent的逻辑

巨头投入的受益链条

第一波：芯片

第二波：广告平台

第三波：云厂商

最终：两个终端

八、AGI大基建：物理瓶颈与能源账本

AGI的本质公式

历史上的大基建类比

能源账本：具体数字

关键能源数据

美国能源基建的结构性困难

九、训练GPT级模型的算力与成本

训练成本拆解

训练量的科普公式

基本计算

OpenAI的投入规模

数据中心建设的物理难题

万卡集群的挑战

十、Scaling Law：加速、减速还是暂停

GPT-4的已知参数

Scale Up的算力瓶颈

如果下一代模型要Scale Up

数据瓶颈

Scaling Law的终极结论

十一、开源vs闭源：格局变化

认知变化

上季度的观点

本季度的调整

开源打掉闭源商业价值的逻辑

影响模型差异的最大因素

十二、中美AGI大基建差异

美国的优势

中国的特点

一个反直觉的现象：美国VC反而miss了大模型

大基建的时间与规模

十三、Sora、多模态与AGI主线之争

多模态的三层作用

Sora的技术门槛与成本