← 返回张小珺主页
一、2024Q1全球大模型大事件复盘
2024年一季度,全球AI领域密集发生了一系列重大事件。李广密(实相科技CEO)从信息密度和战略影响两个维度做了系统复盘。
Q1核心事件清单
| 事件 | 广密的判断 |
| OpenAI发布Sora | 比预期来得早,多模态理解和生成的进步幅度会很大,会解锁很多新东西 |
| Anthropic发布Claude 3 | Sota易主,但OpenAI并没有如预期快速反击 |
| GPT-4.5/5未发布 | 比预期来得慢,说明AGI战线被拉长拉宽 |
| 马斯克XAI加入开源 | 全球范围内争夺第一梯队的唯一黑马,开源水位线大幅提升 |
| Google加入开源大战 | 发的是小模型,不会把最强模型开源,开源主力仍是XAI和Llama |
| 英伟达GTC | 被冠以"新科技界春晚",英伟达股价一年涨三倍 |
| 微软收购Inflection | 模型公司收敛的信号,Inflection成为"第一个失败的VC重铸的大模型公司" |
李广密
去年初觉得AGI是一个百米冲刺,大家都没做好准备。今年就觉得AGI应该是马拉松,大家都有充足的时间做准备。
从百米冲刺到马拉松的认知转变
这是广密在一个季度内最大的认知变化。去年觉得可以"无限加GPU加数据就能到AGI",但突然发现GPU数据中心和物理硬件是巨大的瓶颈。物理硬件成为阻碍AGI时间表的最大因素——这一判断贯穿全篇。
二、大模型公司梯队与XAI黑马
广密对全球大模型公司做了明确的梯队划分,并指出了每个梯队的生死线。
全球梯队划分
| 梯队 | 公司 | 判断 |
| 第一梯队 | OpenAI、Anthropic、Google | 明确的第一梯队,人才密度最高 |
| 第二梯队(含黑马) | XAI、Mistral、Meta Llama | XAI是唯一有机会冲击第一梯队的黑马 |
| 出局/危险 | Inflection、Character、Cohere | "今年年内就得找买家了" |
Inflection提供的案例教训
- 没想到模型收敛如此之快,计算竞争是很残酷的
- Inflection没有绑定一个更深的巨头——"大模型VC是投不动的,还是一个巨头的游戏"
- 关键还是人才密度:前三家加上XAI明显高一阶,其他公司有明显差异
李广密
XAI有两个层面:第一它是全球范围内争夺第一梯队的唯一的黑马;第二如果它持续开源,对整个模型的格局生态和商业价值影响比较大。
生死线判断
- 技术上:今年内必须超过GPT-4水平,二三线公司至少超过最好的开源模型
- 基础设施上:今年必须用上万卡集群——"能做好万卡集群的公司还是比较少"
- 未来12个月:能不能有10万张H100的集群,大概3-10亿美元投入——这才是"明年第一梯队模型的标配"
三、英伟达GTC与黄仁勋的"算力税"
广密亲赴GTC现场,对黄仁勋和英伟达在AGI浪潮中的地位给出了极高评价。
李广密
硅谷最亮的仔,就从马斯克切换到老黄了。很多马斯克的粉丝变成老黄的粉丝,投资者的资金也从Tesla转到了英伟达。
黄仁勋的核心贡献
- 直接驱动了这波AGI浪潮,贡献不输OpenAI
- "算法等了算力30年"——半导体是人类最伟大的发明,计算还会驱动未来几十年
- AGI短期来看,老黄可能比Sam更重要——"AGI没有Sam可以,没有老黄不行"
主权AI:把GPU卖给政府
黄仁勋的市场扩展
- 以前GPU卖给美国科技公司,现在提出"主权AI"——把GPU卖给政府吃国防预算
- 美国军费每年8800亿美金,2-3%买GPU就是一个巨大的量
- GPU是"极其重要的战略储备物资"
- 销售能力超强——市场规模又大了一步
老黄的管理风格
T5T制度
- 内部每双周,每个大组发出最重要的五件事
- 这是一个非常好的管理习惯
工作文化
- 鼓励在办公室吃早饭和午饭
- 但鼓励大家晚饭回家陪家人
- 不鼓励996
核心判断
"算力税"与"智能税"
广密提出了一个结构性判断:人类社会将新增两道税——
- 算力税:所有商业社会都要给英伟达交算力税,就像过去十年给苹果交入口税
- 智能税:模型公司将收取"智能税"——模型能力最强的公司顺理成章解锁最伟大的应用
人类又多了两个"收税的基石公司"。
四、AGI的定义与"渐进式解锁"
广密认为对AGI的理解尚无共识,"就很像共产主义或者财务自由,因人而异"。
AGI的三种理解角度
角度一:三个90%
最激进的定义:AGI能在90%的行业,超过90%的专家,完成都有经济价值的工作。"我觉得这三个90%还是很激进的。"
角度二:智能能力本身
最重要的还是智能能力本身,不是形态和载体。"但肯定会从数字世界走向物理世界"——物理的机器人和设备怎么把智能产品化,是创业者很大的机会。
角度三:渐进式解锁(核心观点)
AGI不是一蹴而就的。广密提出关键词——"渐进式解锁":画一条登山路线图,模型能力每涨一些,就会解锁一些场景,诞生一些应用,创造相应的经济价值。
李广密
AGI能在未来10到15年让全球GDP翻倍,从今天的100T涨到200T。但今天100T的GDP和这波AGI直接相关的可能还不到0.1%。离解锁90%还很远。
AGI渐进式解锁:从0.1%到90%的GDP渗透路径
"5秒任务"理论
Sam曾提出不应从替代人的角度思考,而是看所有工作任务中有多少需要5秒内就能完成的——这些是模型第一波能做掉的。广密认为这个框架结合"渐进式解锁"来理解最为合适:从5秒任务扩展到5分钟任务,再到5小时任务,每一次扩展都解锁新的经济价值。
五、改变软件生产方式与挑战Google
广密认为AGI登山路线图的近处,最值得期待的两个方向是:改变软件生产方式和信息检索的变革。
软件生产方式的颠覆
过去的软件(自动贩卖机)
- 有限的SKU供给
- 大量非标需求未被满足
- 固定需求抽象 + 开发团队开发
- 开发者几千万人
未来的软件(98调酒)
- 任何口味都可以调出来
- 精准/简单的自然语言描述
- 模型用工具调用或coding生成复杂代码
- 人人都是产品经理
李广密
三年内是有机会看到coding领域的AGI的——也就是做各种任务都不错的一个程序员。因为大部分任务,其实没有像软件开发这么明确和有逻辑。
挑战Google的历史性窗口
为什么这次不同
- 过去20年无数对手挑战Google都失败了——核心原因是没有fundamental的技术变革
- 这一次大模型给了大家机会——搜索从"搜出链接和网页"变成"搜出答案"
- 问答可能是"皇冠上的明珠"——能解决好就能获得用户信任和长期留存
- ChatGPT从5000万DAU突破到几个亿必须做搜索——"这是挑战Google过去20年可能唯一的一个技术窗口"
SaaS公司的危机
微软和OpenAI激进推进,有可能把很多工具型、feature型的SaaS都干掉。只有积累了很深的workflow和数据的软件公司(如Salesforce、ServiceNow)可能还能发展。广密对SaaS公司的建议:"只能积极拥抱,组织上多用好年轻人。"
六、AGI的登山路线图:南坡与北坡
广密用登山的比喻构建了AGI的完整路线图——南坡是模型,北坡是产品。
南坡:模型能力
底层:Scaling(更多数据+GPU+能源)
看产出智能的效率是否能持续提高。
核心:推理能力(Reasoning)
模型最重要的能力,需要复杂推理才能完成有经济价值的工作任务。
关键信号:Coding代码能力
"可能是AGI最早落地的一个信号——它既是一个走向AGI的能力,也是一个产品。"
多模态能力
对自动驾驶和机器人有提速作用,更多数据交互效率。
Agent
关键词但今天还不太work——"最主要是模型的Reasoning能力不够强也不够准确,多步推理下来很多任务都失败了。"
北坡:产品
- 谁能做出上亿活跃用户的Killer App——今天可能只有ChatGPT
- 信息检索:搜出答案而非链接,多模态搜索,主动式交互
- ChatGPT做到3亿DAU才能对Google产生fundamental影响
李广密
如果让模型看1万次苹果掉下来,它能不能发现万有引力定律?如果更充足的更广范围的数据灌进去,它们能不能发现人类没有发现的问题、没有发现的规律?我觉得这有可能是一个新的文艺复兴。
南坡和北坡必须是一家公司吗?
广密的判断
- 不一定在一家公司——对组织能力、文化、人才和资源挑战很大
- 但模型公司做产品更容易——产品解决不了的任务可以向下改模型;产品公司改不了模型
- SpaceX类比:火箭发射是基础能力(每年几十亿收入),Starlink是Killer App(几百万终端),Starship可能颠覆波音空客
- "如果大模型是电,那灯泡不一定是电厂做出来的"
七、模型公司即价值沉淀之地
广密提出了一个重要的价值链判断:模型公司可能是价值最终沉淀的地方。
核心论点
两层价值结构
AGI时代的价值链与移动互联网完全不同:
- 移动互联网的价值沉淀在设备厂和广告平台
- AGI的价值将沉淀在芯片公司(算力税)和模型公司(智能税)
- 模型公司的附加值后面肯定比较高——"模型能力最强,就可以顺理成章解锁最伟大的应用"
模型公司做Agent的逻辑
广密认为Agent可能是模型公司的核心附加值体现:
- "模型公司可能就是Agent的公司"——很多Agent当模型本身可能就会自己做
- 第一波叙事大家讲Scaling,后面会讲Agent
- Agent是公司的大附加值体现
- 但现在Agent还不work:Cognition和Magic没啥收入甚至没客户,估值已2B——"硅谷对Coding的hype还是比较高的"
巨头投入的受益链条
第二波:广告平台
Meta广告变现效率提高,Google广告变现效率可能在提。
第三波:云厂商
芯片和模型都跑在云上,企业上云需求很强,年化15%复合增长可能保持很长时间。
最终:两个终端
Apple(手机入口)和Tesla(物理AI终端)。
八、AGI大基建:物理瓶颈与能源账本
广密提出了本集最核心的概念——AGI大基建。他将当前AGI的状态类比为上世纪90年代克林顿推出美国信息高速公路建设:没有基建,就不可能有应用的大爆发。
核心框架
AGI的本质公式
电 + 芯片 = 产出智能
未来就看这个智能的产出效率和能力到底有多高。但最主要问题是——今天没办法给智能定价。所有AI产品定价都是20美元/月(SaaS based),未来能不能有Value based的定价?
历史上的大基建类比
| 时代 | 基建内容 | 催生的成果 |
| 曼哈顿计划 | 造原子弹 | 现代电子技术和整个计算机体系 |
| 美国登月 | 太空竞赛 | 电子产品微型化,个人电脑 |
| 1993年克林顿 | 信息高速公路建设(GDP的5-6%) | 互联网泡沫+互联网黄金20年 |
| 中国近20年 | 公路、5G、城市化 | 短视频、直播、外卖、电商 |
| 当下AGI | GPU产能、数据中心、能源基建 | 待解锁——"基建来了应用才能大爆发" |
能源账本:具体数字
关键能源数据
- 三峡单日最大发电量 / 上海日均用电量:约5亿度
- 美国德州日用电量:约10亿度
- GPT-3.5训练(500张H100,15天):约25万度电 = 三峡/上海的0.05%
- GPT-4训练(8000张H100,100天):约2600万度电 = 三峡/上海一天的5%
- GPT-5训练(3.2万张H100,100天):约1.1亿度电 = 三峡/上海一天的20%
- 10万张H100年用电量:约12.4亿度 = 上海年用电量的0.8%,德州的0.3%
美国能源基建的结构性困难
美国过去20年总用电量稳定在4万亿度,数据中心用约2000亿度(5%)。但预计到2028年,数据中心用电将增至6700亿度——5年涨三倍,从5%增长到16%。广密指出:"这对制造和基建能力明显退化的美国来讲,挑战是很大的。"美国能源基建是四五十年前规划的,能源结构突然新增大量用电需求,"确实跟不上"。
九、训练GPT级模型的算力与成本
广密给出了训练不同级别模型的详细成本拆解,这些数字揭示了AGI大基建的真实门槛。
训练成本拆解
| 模型级别 | GPU需求 | 训练时长 | 买卡成本 | 租卡成本 |
| GPT-3.5 | ~500张H100 | 15天 | - | 较低 |
| GPT-4 | 8000张H100(有效近万卡) | 100天 | 3亿美金(含周边设备) | 1-2亿美元/年 |
| GPT-5(估算) | 3.2万张H100 | 100天 | 12-13亿美金 | - |
| 明年标配(预测) | 10万张 | - | 40-50亿美金 | - |
李广密
3亿美金是GPT-4的入场券。现在有些公司是可以付得起的。中国公司也是可以负担得起的。但今天的万卡集群中国还是比较少的,瓶颈不在钱上——万卡集群是有钱不够的,它很难的。
训练量的科普公式
基本计算
训练量 = 参数量 x 训练Token数 x 6
以GPT-4为例:1.8万亿参数 x 13万亿Token x 6 = 25,000张A100(19.5 TFLOPS)x 60秒 x 60分钟 x 24小时 x 100天 x 利用率(一般50%,最强到60-70%)。
OpenAI的投入规模
- 微软给OpenAI投了130亿美金,大概能买30-40万张卡
- 英伟达H100年出货量约400万片,假设5%给OpenAI = 每年新增20万张
- 每张卡3万美金 + 其他设备约5万美金,一年新增100亿美元硬件投入
- "这样算好像OpenAI的钱也不够"——估计还得做更大规模融资
- 头部AGI公司每年至少几个Billion的投入,而且要投很多年
数据中心建设的物理难题
万卡集群的挑战
- 互联通信难度大——不是一层网络而是三层网络,拓扑结构很复杂
- 稳定性要求极高
- 能耗和降温要求高——很多人在提液冷
- 需要找到适合GPU数据中心的土地和稳定便宜的电
- "比特驱动的数字世界迭代很快,但原子驱动的物理世界迭代跟不上"
对于Scaling Law是否还有效,广密给出了细致的分析。
GPT-4的已知参数
Scale Up的算力瓶颈
如果下一代模型要Scale Up
- 3倍参数 x 3倍数据 = 9倍Compute —— 老黄公布的3.2万张H100集群加上优化效率提升刚好够
- 10倍参数 x 10倍数据 = 100倍Compute —— 现在GPU算力集群明显不够用
- 又回到大基建问题:物理机器的瓶颈导致今天无法Scale Up
数据瓶颈
- 增加数据可能比增加参数ROI更高
- 文本数据不够用——通过合成、改写可以扩大几倍
- 但要拿出GPT-410倍的数据(100多TB高质量数据)"可能没有人能拿出来"
- 多模态数据和文本数据一起训练很难——容易伤害原模型,还有很多Research问题
- GPT-5的数据够用,但GPT-6肯定需要突破
李广密
Scaling Law是没有减速的。如果说变慢了,就是算力和数据没凑够。GPT-3.5走到GPT-4大概用了二三十倍的算力提升,GPT-4走向下一代今天还没凑够二三十倍有效算力。
Scaling Law的终极结论
广密认为Scaling Law目前仍是通往AGI最大概率的路线——"没有找到除了这条路线以外的其他路径"。在没有证伪之前,应对投入更多资源验证。关键变量是两个:数据和GPU。电力不是Research问题,通过投入能解决。但他也提出了一个深层疑问:Next Token架构到底能不能解决长期规划的问题?如果不能解决任务,Scaling下去意义不大。
十一、开源vs闭源:格局变化
广密在开源与闭源的判断上发生了微妙但重要的变化。
认知变化
本季度的调整
- 闭源最强的仍然比开源强很多(复杂推理)
- 但简单任务开源模型可以完成
- 开源会打掉闭源模型的部分商业价值
- 开源模型会覆盖很多企业内需求场景
开源打掉闭源商业价值的逻辑
- GPT-3.5水平的模型一旦开源,大家就不需要调用OpenAI的3.5 API
- 如果马斯克的XAI持续开源,开源模型水位会很高
- 但开源模型没有忠诚度——之前觉得Llama最好,现在觉得Mistral最好,未来Grok开源可能更好——"哪个好用就用谁"
影响模型差异的最大因素
李广密
如果只说一个,我觉得就是数据。大部分模型的架构比较统一,Training包括各种Recipe也比较统一。数据决定了这个模型作为产品的特点——也就是说数据决定了这个模型的性格。
广密特别指出,OpenAI同时具备数据的经验、基建和投入意愿。而对很多Researcher来讲,数据是脏活累活,很多人不愿意干——"有很多公司人才密度很高,但数据并没有做好"。Google就是例子:版权包袱重、Legal关注度高、方向没有拦到一起。
十二、中美AGI大基建差异
美国的优势
- 大航海发现精神——面对不确定性的乐观冒险精神
- 资本充足、退出畅通,支持0到1的试错和发现
- 历史上芯片、计算机、互联网都是美国搞出来的
- 重投入的传统,相信科学
- 真的在做AGI
中国的特点
- 解决问题的能力很强,但提出新问题很少
- 0到1很少,但1到100很强
- VC更"争气"——投了国内几家大模型公司从0到1起来
- 芯片受限——"只能期待国产芯片,期待华为的卡"
- 还在追GPT-4和审视低明——辨识度不够
一个反直觉的现象:美国VC反而miss了大模型
硅谷VC几乎全线miss掉了大模型投资——全都是巨头在支持的。中国VC好像更争气一些,还投了国内几家大模型从0到1起来。原因可能是:硅谷VC喜欢"小钱办大事"、以前在重资产上吃过亏(也miss了Tesla和SpaceX)。但这次不一样了——价值链发生了大变化,价值会沉淀在模型,大家都要交学费。
大基建的时间与规模
广密预测:2024年GPU产能约400万片,2025年可能600多万片,未来每年复合增长不低于30%。"大基建看不到结束的那天"——计算的迭代可能停不下来,从单颗芯片的摩尔定律到整个数据中心的摩尔定律,再到跨数据中心效率提升。
十三、Sora、多模态与AGI主线之争
多模态的三层作用
- 补充数据:文本数据不够用了,多模态可以补充
- 用户体验:理解能力变强,交互效率大幅提升
- 生成能力:视频生成效果今年会大幅提升
但关键问题是:多模态数据对模型推理能力有没有大幅提升?今天还没有验证。这是不是AGI的主线,广密认为"见仁见智"。
Sora的技术门槛与成本
复刻Sora的难度
- 训练环节是LLM的好几倍:估计4000-10000+张H100做一个多月的最后训练
- 推理算力消耗很大:如果生成TikTok一天上传量(1500多万分钟),推理成本与训练差不多
- 需要采集收集几千万到上亿小时视频数据,并用GPT-4V打标签——"一般团队弄不了"
- 数据来源可能包括YouTube、游戏数据等
- CTO Mira提到有机会把推理成本降到与图片生成差不多——那时才会公开release
李广密
Sora更多说明多模态能力进展会很快。OpenAI战线铺得更广了,好像不是那么高度聚焦在AGI这个事了。
创业公司应该跟进Sora吗?
广密直言"很凶险":需要融几亿美金,数据获取难度在LLM和机器人之间,卡和数据成本都很高。而且"视频等不等于智能"还有争议,"是不是一定要做到效果最好才有人买单更看不清"。建议创业公司不如想想如何定义Sora的产品形态和未来AI内容的消费形态。
不同模态的上限差异
| 模态 | 上限 | 建议 |
| 大语言模型 + Coding | 最高 | 智能能力强,核心竞争 |
| 视频 | 很高 | 进展会很快 |
| 声音、图片 | 较低 | 必须做好产品保证优势 |
十四、自动驾驶与机器人:从数字到物理
Tesla的矛盾处境
广密对Tesla的估值拆分
- 汽车销售业务:约150亿美元利润,20倍PE = 3000亿美金
- AI业务(FSD + 机器人):值另外两三千亿美金
- 但华尔街今天还不太认FSD——FSD未对新车销售带来fundamental影响
- 基本盘业务比较悲观:欧美疲软,中国竞争压力大,销量甚至负增长
- "如果股价跌到100出头,我还是愿意买一点它的股票"
大模型对自动驾驶的帮助
- 多模态能力变强后,Corner Case的筛选和解决效率更高
- Waymo在旧金山跑得非常好——以前每辆车一人监控,现在一人监控四辆
- 如果多模态能力强到AI能帮忙监控400-4000辆车,Operation Cost会降得很低,有利于大规模普及
- FSD安全性已超过平均司机水平
- 更大的变革可能性:没有方向盘、卖车免费、把里程价值做更高
机器人:比自动驾驶更难
机器人的核心挑战
- 最核心的还是数据问题——语言模型有过去几十年互联网积累的文本数据,机器人没有
- 很多人想做机器人的Foundation Model(大脑),但没有大量训练数据
- 现在很多机器人公司不超过100台机器,像Aloha那样采数据——数据量级太小
- 不像Tesla几百万辆车全球每天采数据回传训练
- 今天还不是商业和工业落地问题,还是research问题
机器人的希望
- 多模态带来fundamental突破解决数据问题
- 语言模型和机器人模型可能是一个模型
- 通用机器人长期看好——可能是大模型之后最大的事
- 成本降低:只有Tesla或中国供应链能解决
机器人的担忧
- 现在没有像手机/汽车那样的刚需场景
- 一台人形机器人10多万美金,离大规模商用很远
- 现在加入"不知道要加入哪个"公司
- 担心像2016年做自动驾驶——太早了
李广密
如果有机会深入下场创业,应该加入机器人团队。先去大模型再去机器人——机器人还需要更久一些。
十五、OpenAI解析与巨头结盟
对OpenAI的新认知
- AGI时间拉长了——以前觉得两年,现在至少3-5年甚至5-10年
- AGI公司一开始不应该太激进做产品——但OpenAI好像很激进
- 理解了"渐进式解锁"——不是一蹴而就的
- OpenAI每年需要几个Billion甚至十个Billion投入——纯靠融资融不到那么多钱,需要健康的现金流
- 2C方面ChatGPT做到3000万付费用户就是年60亿美金订阅收入,可以健康支撑AGI投入
- 2B方面可能被微软拿走很大一部分——企业客户讲信任,OpenAI"容易瞎搞"的印象是障碍
OpenAI的战略预测
广密的判断
- OpenAI很难跟微软抢2B、跟英伟达抢芯片、跟Apple抢终端
- Google是个软柿子——去抢信息检索市场比较make sense
- 垂直领域不一定做(法律、金融、教育),但垂直领域数据会持续加上去
- 比较关注OpenAI会不会做机器人——以前做过觉得太慢,但最近投了三家机器人公司
全球巨头结盟格局
| 联盟 | 状态 |
| 微软 + OpenAI | 目前很稳定,但关系复杂(微软又投Mistral又收购Inflection还自己Train) |
| AWS + Anthropic | 互相被迫深入绑定,AWS销售已全线卖Claude 3 |
| Google | 自成一体(TPU + 全栈) |
| XAI | 长期不排除并入Twitter/Tesla |
| Mistral | 必须抱大腿——未来一年得融1-3个Billion做万卡集群 |
| 阿里 | 分散投资所有中国模型公司——辨识度不够高,但投资可绑定算力消耗 |
对Sam Altman的评价
李广密
Sam在OpenAI成名之前已经坚持做这个公司六七年了。很多人以前还不相信AGI这些东西。相比之下马斯克中途是下车了的。Sam非常值得尊敬——有很大的勇气去探索完全没有探索过的东西。
但广密也指出Sam的争议面:"感觉他不够真实,一直在努力维持一个比较有爱的形象"。以及一个硅谷都好奇的问题:"他怎么能有那么多钱?投一个公司都几千万上亿美金"。
十六、AGI时代的投资与Killer App
硅谷VC的三大投资主题
广密对这三大件都有怀疑:Coding一定在大模型公司和微软核心射程以内,模型公司可能会很激进做Agent,机器人很多Researcher创业因为容易讲故事但还有很多research问题没解决。
Killer App的形态
可能不是App形态
- App还是互联网产物,AGI时代可能是更随时随地的Agent或Multimodal Agent
- 信息检索是潜在Killer App方向——搜出答案而非链接
- 自然语言编程确定性比较高——人人都是产品经理
- 灵感激发/Brainstorm——广密个人用Claude 3最多的场景
- 比较期待Agent今年能有一两个好的Use Case
朱啸虎说"AGI至少5到10年看不见"、能量量级需升级。广密表示大部分观点认可,但有几点不同:
- 技术可能遇到短暂瓶颈但后面还会有跳跃——"过去一年可能是第一波小升浪,后面还会有更大的主升浪"
- 降低90%的工作三到五年实现已经很乐观——"剩下10%才是人类的价值"
- 相信摩尔定律、模型计算效率和推理效率会大幅提升
- "五到十年内看到AGI是充满信心的——相信科学会有突破,相信这帮科学家"
十七、关键数据汇总
| 判断 | 具体内容 |
| AGI时间线 | 从"百米冲刺"调整为"马拉松",至少3-5年甚至5-10年 |
| AGI大基建周期 | 10-20年,看不到结束的那天 |
| AGI与GDP关系 | 未来10-15年全球GDP从100T到200T,当前直接相关不到0.1% |
| 第一梯队 | OpenAI、Anthropic、Google(3家确定)+ XAI(唯一黑马) |
| 美国最终存活 | 4家:OpenAI、Anthropic、Google、XAI |
| GPT-4训练成本 | 买卡3亿美金起步,8000张H100训练100天 |
| GPT-5训练成本 | 3.2万张H100训练100天,约12-13亿美金 |
| 明年标配集群 | 10万张H100,40-50亿美金 |
| H100售价 | 约3万美金/张,租金3-4美元/小时 |
| 英伟达H100年出货量 | 2024年约400万片,2025年约600万片 |
| AI GPU产业规模 | 3-4年后将达3-4千亿美元 |
| OpenAI年硬件投入 | 约100亿美元 |
| 美国数据中心用电 | 当前约2000亿度(5%),2028年预计6700亿度(16%) |
| 训练GPT-5用电 | 约1.1亿度 = 上海/三峡日用电量的20% |
| Scaling Law | 没有减速,瓶颈在算力和数据凑不够 |
| Coding领域AGI | 三年内有机会看到 |
| ChatGPT DAU | 约5000万,需突破到3亿才能fundamental影响Google |
| ChatGPT付费用户 | 不到1000万,目标3000万(年60亿美金订阅) |
| OpenAI估值 | 约1000亿美金(可看作微软AI部门) |
| 云厂商增长 | 年化15%复合增长可保持很长时间 |
| 数据中心大客户 | 收敛到4-5家:微软、Meta、AWS、Google、XAI |
| 人形机器人成本 | 10多万美金,离大规模商用较远 |
| 模型差异最大因素 | 数据——"数据决定了模型的性格" |
启示与延伸思考
1. "电+芯片=产出智能"是AGI时代最简洁的本质公式
广密将AGI还原到最底层的物理逻辑:能源和计算硬件是产出智能的基础设施。这意味着AGI的竞争不仅是算法竞争(Research Lab之间的较量),更是基建竞争——谁能建更大的集群、拿到更多的电力、维持更长的投入周期。这解释了为什么巨头而非创业公司主导这个赛道,也解释了为什么Sam提出7T美金融资——因为这本质上是一个基建工程。
2. 物理世界的迭代速度是AGI真正的"减速带"
广密最核心的认知转变是:AGI从百米冲刺变成马拉松,不是因为算法遇到了瓶颈,而是因为物理硬件跟不上。数据中心建设要几个月、万卡互联通信极其困难、美国能源基建是四五十年前规划的。"比特驱动的数字世界迭代很快,原子驱动的物理世界迭代跟不上"——这一判断在两年后看依然深刻,也被后来英伟达持续供不应求所验证。
3. "两道税"结构改变了整个科技产业的价值分配
广密提出的"算力税+智能税"框架是理解AGI时代价值链最清晰的模型。过去十年的"苹果入口税"让Apple成为3万亿公司,而算力税+智能税同时作用,意味着价值将更集中地流向英伟达和头部模型公司。这与传统VC"小钱办大事"的逻辑完全冲突——难怪硅谷VC全线miss掉了大模型投资。
4. "渐进式解锁"才是AGI的正确打开方式
广密反复强调AGI不是一个"某天突然到来"的临界点,而是一个从0.1%到20%到90%的GDP渗透过程。每次模型能力提升都会解锁新场景、诞生新应用。这意味着:(1) 不需要等到"真正的AGI"才能创造价值;(2) 每一次Scale Up的ROI都需要被具体场景验证;(3) Agent能否落地完成复杂任务是关键观测点。两年后回看,coding确实成了AGI最早落地的信号。
5. 数据中心大客户收敛到4-5家是结构性判断
广密预测建大集群的客户会收敛到微软、Meta、AWS、Google和XAI这4-5家。这意味着AGI的底层基础设施实际上是寡头垄断的。对创业公司而言,不在这个名单上就意味着永远在租算力——成本结构和迭代速度都会受制于人。Inflection的出局是第一个案例,后续还会有更多。
6. 开源的价值在于"拉高水位线"而非"替代闭源"
广密对开源的认知发生了微妙变化:不再认为闭源对开源有压倒性优势。开源模型在简单任务上已经可用,会打掉闭源模型的部分商业价值。但闭源在复杂推理上仍然领先很多——这是完成有经济价值任务的关键。开源的战略意义在于马斯克XAI:如果持续开源,整个开源水位线会被大幅拉高,二三线闭源公司的商业空间会被严重压缩。
7. 机器人是"大模型之后最大的事"但时机未到
广密对机器人的判断充满矛盾性的诚实:一方面认为"如果有机会深入下场创业应该加入机器人团队",另一方面承认"今天不知道要加入哪个"——因为现有的机器人公司"都不像能scalable一直走很远的"。核心瓶颈仍是数据:语言模型有几十年互联网积累的文本数据,而机器人数据采集量级太小。广密期待多模态突破能从根本上解决这个问题。这与后来的VLA(视觉-语言-动作模型)方向高度吻合。
8. Scaling Law没有减速,但Next Token架构能否解决长期规划?
广密在坚定支持Scaling Law的同时提出了一个深层质疑:Next Token架构到底能不能解决长期规划问题?如果Agent不能完成复杂任务,Scaling下去意义不大。这个问题在两年后仍然是AGI研究最核心的争议之一——OpenAI后来通过o1/o3的推理链、Anthropic通过Claude的工具使用能力,都在试图回答这个问题。
9. "挑软柿子"——OpenAI最理性的战略方向是打Google
广密用排除法推导出OpenAI的最优战略:难打微软的2B、难抢英伟达的芯片、难夺Apple的终端,Google的信息检索市场是"最肥的软柿子"。ChatGPT做到3亿DAU + 3000万付费用户就能年入60亿美金,健康支撑AGI投入。这个预测与OpenAI后续推出SearchGPT、与Perplexity在搜索领域的竞争完全吻合。
延伸阅读
- EP.54 口述全球大模型这一年 — 上一次广密做的年度总盘点
- EP.73 AGI范式大转移:和广密预言草莓、o1和self-play RL — 本集之后的下一次季报
- EP.86 大模型季报年终特辑:和广密预言LLM产品超越Google之路 — 验证"挑软柿子"预测
- EP.83 黄仁勋和3万亿美元英伟达是如何炼成的 — 关于算力税的完整叙事
- EP.67 谈谈黄仁勋搭建的组织系统 — T5T等管理细节的展开