广密亚(海外独角兽创始人)在 2023 年几乎将全部精力投入大模型赛道,肉身超过一半时间在硅谷,团队 10 人在过去一年接近"一万小时定律"级别的投入。他的公众号和朋友圈全年几乎只发 AI 内容,平均每天三条。
他们的投资策略极度聚焦:团队 90% 的时间只 focus 三家公司——OpenAI、Anthropic、Google。年初投了两家公司,目前都进入全球 chatbot 流量前五名。
这种 all-in 策略带来了三个直接结果:(1)新旗舰基金超募;(2)年初投的两家公司进入全球 chatbot 流量前五;(3)团队进入"加速成长"状态。广密亚判断"核心的 secret 就在硅谷",因此选择肉身驻扎。这种投资方法论本身就是对大模型这一波浪潮"赢家通吃"特征的押注。
广密亚认为其他公司带来的"噪音比较多",只有 OpenAI、Anthropic 和 Google 这三家"有核心的 secret"。这种判断背后是他对大模型竞争格局的根本认知:这不是一个百花齐放的赛道,而是一场只有极少数选手有资格参与的登月竞赛。
广密亚用"闭上眼睛一想"的方式,梳理了 2023 年大模型行业最重要的几个分水岭。
"Chat 就等于 ChatGPT",这个心智占位至今稳固。快速突破百万、一亿用户,稳定在 2 亿+ MAU,年化收入超 10 亿美元。
关键分水岭——代表 SOTA 最佳模型的标杆。"谁再能复刻 GPT-4,就是关键节点。"
"内部几乎复刻了 GPT-4"——比 OpenAI 晚约半年达到同等水平。
Llama 和 Mistral 发布多个模型。Mistral 团队是 Llama 1 的核心贡献者。开源最佳模型出自这两家。
Midjourney V1 到 V6 效果快速提升;Runway 和 Pika 视频生成有了大飞跃。
Pro 版本约等于 GPT-3.5,对标 GPT-4 的 Ultra 版"下个月才能发布"。Google 从头 pretrain 多模态模型,开创了新范式。
Sam Altman 被开除又回归,700+ 员工联名支持,"AGI 只耽误了四五天"。
OpenAI 在 2023 年 3 月发布 GPT-4,但实际训练完成可能更早(约一年前)。Anthropic 半年后接近复刻,Google 一年后才 deliver,全球其他团队还需 6-12 个月。这种时间差不仅是技术差距,更决定了数据飞轮的先发优势——更早的 GPT-4 能生成更高质量的合成数据,反哺下一代模型训练。
广密亚判断 2023 年首轮竞赛已经决出前三名。这三家公司是全球仅有的做出 GPT-4 水平模型的团队。
| 公司 | 估值(2023年底) | 达到 GPT-4 时间 | 核心优势 |
|---|---|---|---|
| OpenAI | ~1000 亿美元 | 2023.03(发布) | 品牌心智、产品先发、用户规模 |
| Anthropic | 150-250 亿美元 | 2023.07(内部) | Research 深度、safety 领先 |
| Google (Gemini) | —(上市公司) | 2024.01(预计) | 多模态原生训练、数据与算力 |
广密亚看好未来 6 个月三家公司有潜力做出 GPT-4 水平的模型:
广密亚认为,如果只说一个 secret,短期就是数据——预训练的数据配比、tokenizer、以及如何实现 reasoning(推理能力)。全球真正知道 GPT-4 data secret 的人只有两三百个,几乎都在前三家公司。其他公司想搞清楚,"至少得有几百次几千次充足的实验"。
广密亚强调"天才科学家的聚集效应是很强的"——这种人和这种文化组合在一起,形成了其他公司无法复制的 research lab 文化。OpenAI 的核心特征是"不知疲倦地持续做实验、做探索",而且"research 的卡是无限的",人均 research 用卡量是一个"非常高的数字"。
传统 VC 的投资框架习惯于把"钱"视为核心竞争要素,但大模型竞赛揭示了一个不同的逻辑:人才的稀缺性远比资金更为关键。全球仅 200-300 人掌握核心 secret,而且他们高度聚集在前三家公司。这意味着即使有充足资金,如果无法吸引这些核心人才,复刻 GPT-4 仍然极其困难。"从 GPT-3.5 走到 GPT-4,难度增加 5-10 倍"。
这是一个激烈的判断——将传统 AI(计算机视觉等)与大模型 paradigm 做了明确切割,暗示这一波技术革命需要的是完全不同的研究思维和能力集。
大模型能力随着参数量、数据量和计算量的增加而持续提升的经验规律。由 Anthropic 的 Dario Amodei 等人最早发现和系统研究。目前还没有理论支撑,只是"实验和试错总结的经验"。这是当前唯一已知的提升模型智能的路径。
| 科学家 | 所属公司 | 核心贡献 |
|---|---|---|
| Noam Shazeer | Character.AI | Transformer 最核心贡献者,最早提出 Scaling Law,提出 MoE |
| Dario Amodei | Anthropic | 系统研究 Scaling Law,发明 RLHF |
| Ilya Sutskever | OpenAI | 深度学习先驱,GPT 系列首席科学家 |
广密亚反复强调这一点:Scaling Law 是否能继续 work 是"所有人都无法回答的问题","还是个科研问题,还没有解决完"。如果不能继续 scale up,"那可能就停在这一代下一代"。这意味着人类正在用千亿美元赌一个尚未被理论证明的经验规律——这是这场"科学豪赌"的真正含义。
大模型训练成本分两部分:
700 亿参数是分界点:以下可以容忍很多错误,以上训练难度指数级提升,失败率非常高。
互联网产品边际成本趋近于零,而大模型训练呈现完全相反的特征:每一代模型的训练成本是前一代的数倍乃至十倍以上,且前一代模型的价值在新模型发布后迅速归零。这不是互联网式的"先亏损后盈利",而更接近芯片制造或航天发射的逻辑——巨额固定投入、极高失败率、赢家通吃。
广密亚特别指出一个被忽视的竞争力:OpenAI 训练完 GPT-4 后,可以用新能力重新训练 GPT-3.5,将推理成本降到极低。GPT-4 Turbo 是从头训练的,能力比 GPT-4 更强,但训练成本降了 4-5 倍,推理成本降了近 10 倍。
广密亚认为大模型最相关的三个大生意依次是:芯片(NVIDIA)、公有云(微软 Azure、亚马逊 AWS)、终端(手机 + 汽车)。其中终端最终可能最关键——Apple 和 Tesla 代表的手机端和车端是离用户最近的 AI 入口。
赌的是入口。ChatGPT 代表 Answer Engine(问答引擎),Google 代表 Search。广密亚比喻说:"问答引擎就像是直接点外卖,所有都做好了;Google Search 就是你去菜市场还要买菜。"如果 Answer Engine 最终颠覆 Search,那对 Google 来说就是主航道被替代。同理,Meta 的真人社交网络面临虚拟人 Agent 社交的潜在威胁,Apple 的 Siri 面临被更强 AI 替代的风险。
移动互联网时代是巨头 A 投 B 公司、巨头 C 投 D 公司,阵营分明。但大模型时代,"大家都一起进一家公司,而且可能一起进多家公司,每个人投个三五千万美金"。原因还是技术辨识度太低——"不知道该把十亿美金投给谁"。
广密亚认为大模型适合 top-down 来做,但中国目前的资源"比较分散",每天的资源都是 3-5 亿美金,且面临 GPU 不足的硬伤。他的建议是"提前抱大腿"——像硅谷的第二阵营那样和巨头深度绑定,而非各自为政。他甚至具体点名:阿里有云和钉钉("像微软"),字节的能力"可能在其他人之上",百度"觉得自己行但不知道未来真的行不行"。
传统软件开源的核心在于社区协作——代码可读、可改、可贡献。但大模型是"不可编码、不可解释"的,"模型为什么有这个智能大家今天还是不知道的,就像人脑一样"。GPU 需要在单一集群连起来训练才更高效,无法像开源软件一样分布式协作。
广密亚透露他们在看 Mistral 融资时"很难做决定",因为 Mistral 面临一个根本性风险:即使它在 7B 参数上做出最佳模型,OpenAI 也可能"顺手"训一个同等规模的模型将其碾压。"大模型公司向下覆盖"是一个结构性威胁。
广密亚用出行比喻需求分层:"从北京到天津,开车和高铁都可以,没必要用火箭飞船。但从北京到旧金山,SpaceX 两小时送过去,需要 capability 很强的。"开源模型服务"北京到天津"的需求完全成立,但这并不意味着它能替代闭源模型服务"北京到旧金山"的需求。长期来看,大的 Foundation Model 可以生成任意大小的模型来覆盖所有层级需求。
广密亚判断:明年底视频生成效果会像 2023 年图像生成效果(Midjourney V1→V6)一样快速提升。当前主流方案只能做到几秒钟动画效果,更长更复杂的视频"还需要技术突破"。Transformer 的核心优势是容易 scale up,视频生成模型如果也走 Transformer 路线持续 scale,可能是关键突破口。
Agent 需要执行多步推理,而每一步的错误会累积。如果单步推理准确率是 90%,10 步串联后整体准确率只有约 35%(0.9^10),这远远不够实用。因此 Agent 的大爆发取决于底层模型 reasoning 能力的根本性提升,以及推理速度的优化。
广密亚反复强调成本优化可能是大模型公司最重要的"隐形竞争力"——"如果你能把成本做的极低,你的模型还不输,那我觉得这就是极强的核心竞争力,就像芯片了。"这种"非常像芯片"的规模效应意味着:领先者能用更低成本提供更强能力,后来者的追赶窗口会越来越窄,"可能再过两代就追不动了"。
如果手机内存在未来两年提升 4-5 倍,端侧就能承载大量 AI 推理,AI 公司的成本结构将发生根本变化——从云侧推理转向端侧推理。这对 Apple 和 Tesla 来说是巨大利好,因为"端还是离用户更近"。
| 特征 | VC 产品偏好 | 大模型公司特征 |
|---|---|---|
| 投入规模 | 数百万~数千万美元 | 数十亿~百亿美元 |
| 商业模式 | 早期可见 | "今天还没有商业模式" |
| 回报周期 | 5-7 年 | 不确定,可能需要 10 年+ |
| 风险类型 | 市场风险 | 科学风险(Scaling Law 可能失效) |
| 退出方式 | IPO 或并购 | "80%-90% 大概率还是被收购" |
广密亚提出了一个有趣的类比:以前的关键生产资料是土地,黑石靠地产做大。现在关键生产资料可能是 GPU。AI 公司买不起 GPU,GPU 就变成了类似土地的资产类别。他预测"新的债的金融产品"可能因此出现——类似于地产开发中的项目融资结构。
硅谷 VC 面临双重压力:(1)大模型投资不 match VC 产品属性,错过了这一波最大的机会;(2)微软和 OpenAI 可能把很多软件的生意都做掉,威胁 VC 传统的 SaaS 投资领地。这揭示了一个更深层的问题:AI 时代的资本形态可能需要根本性变革——从 VC 的概率模型(投 30-50 个,靠 power law 赢)转向类似曼哈顿计划或举国体制的集中投入模式。
全球 DAU 稳定在 200 万以上的大模型原生产品,广密亚只能想到 ChatGPT 和 Character.AI 两个。企业级探索中只有微软和 Adobe 比较激进,其他成功案例"还不多"。
广密亚反复将大模型比作芯片——"你要等芯片的能力和成本再迭代个两三代,上面的消费电子才会慢慢的爆发。"他判断 GPT-4 "今天还代表未来黄金十年的开端",但"做不了太多事"。可能需要再卷过 GPT-4.5、到 GPT-5(2024 年可能看到),应用大爆发才有"一定可能性"。
广密亚提出了一个重要判断:在 AI 时代,"有可能模型即应用"——Character.AI 从用户角度是应用公司,但 99% 的体验由模型决定,团队核心都是做模型的人。用 Llama 开源模型做 Character 的效果"不够好",只有 MiniMax 等有自研模型的公司才做好了类似产品。如果这个判断成立,意味着没有自研模型能力的纯应用公司在 AI 时代可能没有生存空间。
700+ 员工一致跟随 Sam 的核心原因是利益:大部分激励靠股票,微软的合作也由 Sam 主导。微软 CTO Kevin Scott "赌上职业生涯来力挺"。
尽管 OpenAI 在品牌、用户规模和技术上领先,广密亚指出了几个结构性弱点:(1)ChatGPT 没有搜索和推荐那样的数据飞轮——模型是预训练的,无法实时反馈;(2)chat 数据比互联网和 AI 生成的数据质量低,大概率用不到训练;(3)OpenAI 是"追求 AGI 为导向"而非"以服务用户为导向"。这些弱点为竞争者留下了窗口。
目前 Transformer + Scaling Law "是走向 AGI 最有可能的路径,还没有第二个其他路径。"
Anthropic Claude 3 和 GPT-4.5 发布,模型能力再提升一个大台阶。
Google Gemini Ultra 发布。格局形成后"很难改变"。
GPT-5 有机会看到。应用大爆发可能有"一定可能性"。
全球至少花 1000 亿美金在大模型上。数据中心用电从 2-3% 涨到 10-20%。
AI 可能让全球 GDP 翻倍(96 万亿→200 万亿美元)。替代 10 亿白领,3-50 万亿美元 market size。
这场豪赌的特殊性在于:它不是赌市场(是否有需求),也不是赌技术(能否工程化),而是赌科学(Scaling Law 是否是通向 AGI 的正确路径)。人类历史上以这种规模赌科学发现的先例并不多——曼哈顿计划和阿波罗登月可能是最接近的类比。区别在于,那两个项目有明确的物理理论支撑,而 Scaling Law"今天还没有理论支撑"。这既是最大的风险,也是最大的机会。
广密亚提出了一个大胆的推测:如果硅谷提前实现 AGI,对全球地缘政治"会有很大的影响"。大模型融合了多种语言,可能带来新的文化融合。同声传译、翻译产品的普及意味着"一个中文人是不是可以跟一个印度民族方言的人谈恋爱"。AI 创造的增量 GDP 可能是互联网过去 20 年的 5-10 倍。
| 指标 | 数据 |
|---|---|
| 全球大模型核心人才 | 200-300 人 |
| OpenAI 人才占比 | 100+(约 50%) |
| ChatGPT MAU | 2 亿+(2023 年底) |
| ChatGPT 占 Chat 流量 | 70-80% |
| OpenAI 年化收入 | 10 亿+ 美元(2023),预期 50-60 亿(2024) |
| GPT-4 训练用卡 | 2.2 万张 A100,训练 100 天 |
| GPT-4 纯训练成本 | 约 8000 万美元 |
| 下一代模型训练成本 | 10-30 亿美元(2025 年) |
| 全球未来 3-5 年总投入 | 至少 1000 亿美元 |
| Anthropic 估值 | 150-250 亿美元 |
| OpenAI 估值 | 约 1000 亿美元 |
| H100 vs A100 实际性能 | 1.5-2 倍(非宣传的 3-6 倍) |
| 训练成本 18 个月降幅 | 4-5 倍 |
| 推理成本 18 个月降幅 | 10 倍 |
| GPT-3.5→GPT-4 难度倍数 | 5-10 倍 |
| 700 亿参数 | 训练稳定性分界点 |
| 全球第一梯队储备门槛 | 100 亿美元 |
| 数据中心用电占比(当前) | 2-3% |
| 数据中心用电占比(未来) | 10-20% |
| AI 替代白领规模 | 10 亿人 |
| DAU 超 200 万的 AI 原生产品 | 仅 2 个(ChatGPT、Character) |