本期是张小珺商业访谈录全球大模型季报的第三集,延续第54集和第64集的系列框架。嘉宾广密在2024年上半年依然在美国花了大量时间,从AI应用端出发,复盘全球大模型这半年的进展。
广密直言,抛开大模型公司自身的应用如ChatGPT,硅谷主流VC投的、跑出来的、上一定估值的AI原生应用公司,其实就想到Perplexity一家。2000多万月活、2000多万美金的ARR,其他很多还在PMF之前的阶段。
AI搜索是大模型纪元中,在应用端达成的第一个共识。信息检索仍是匹配当前模型能力最重要的use case。
首轮机构化融资,硅谷核心AI圈的个人投资人大量参与。
IVP等机构参与。
个人投资人仍然活跃,Daniel Gross(AI Grant创始人)个人投了很多钱。
由Betham领投,差不多每半年融一轮的节奏。
| 投资人 | 身份 |
|---|---|
| Jeff Dean | Google SVP |
| Yann LeCun | Meta首席AI科学家 |
| Andrej Karpathy | 前OpenAI / Tesla |
| Jeff Bezos | 亚马逊创始人(也是Google天使投资人) |
| Nat Friedman | 前GitHub CEO |
| Elad Gil | 知名Solo GP |
| Clement Delangue | Hugging Face CEO |
| Ron Conway | Databricks联合创始人 |
与中国以VC为主不同,硅谷AI核心圈的个人投资人钱多、更懂行、喜欢早期参与。如AI Grant的影响力在AI领域甚至比YC更强——"他们自己之前还买了很多H100给portfolio用"。早期逻辑是:从OpenAI出来的人做搜索,这种团队值得被OpenAI再收购回去,可以"换OpenAI股票"。
广密将知识工作者的创造性任务分为三类:
信息检索是组合性工作的典型代表,恰好匹配当前模型能力的边界。Perplexity团队对模型能力边界的理解非常深——模型今天还没有自由探索的能力,更多是信息组合能力。
中国过早进入移动互联网,内容严重割裂——小红书、微信、知乎的内容互不检索。百度搜索首页大量是自家内容。这与海外PC形态主导的开放网页生态差异巨大。中国的AI搜索"肯定是巨头的菜"——字节一年前就应该做这样的产品打百度。
| 梯队 | 公司 | 估值(美元) | 备注 |
|---|---|---|---|
| 第一梯队 | OpenAI | ~千亿级 | ChatGPT上亿DAU,ARR 34亿美金 |
| 第二梯队 | Anthropic | ~200亿 | AWS深度绑定 |
| 第二梯队 | xAI | ~200亿 | 马斯克融了60亿,拿到最后一张门票 |
| 第三梯队 | Mistral | ~50-60亿 | 刚融5-6亿美金 |
| 第三梯队 | Cohere | ~40-50亿 | 企业端 |
| 第三梯队 | Character | ~30-50亿 | 600-700万DAU,想再融几个billion很难 |
| AI应用 | Perplexity | 30亿 | 纯应用中估值最高 |
| AI应用 | Cursor(AI程序员) | ~20亿 | 最近较火 |
| AI应用 | 其他独角兽 | 数亿级 | 有规模化ARR超1000万美金的非常少 |
广密的担忧:"这三个大方向都在OpenAI未来模型的覆盖范围之内。出来了这些,就感觉在沙滩上建城堡,是不牢靠的。"
海外比中国更清晰,不那么混沌。独立的大模型公司只剩三家:OpenAI、Anthropic、xAI。年内需要3.2万卡集群,明年奔着10万卡。没有极强大腿再给几个billion,很难在大模型上卷。
广密期待未来6-12个月Apple和Meta怎么选。巴菲特减持Apple,Apple有1100亿美金回购——"如果是我,应该去收购一家公司"。Meta的Llama团队人才密度不够,GPU和集群能力很强但人才弱于前几家。
基于GPT-4水平还是有概率做出大应用的——过去NLP 20年也不算绝对成熟,但诞生了搜索这种Killer App。电发明后也只有电能Power这一个Killer App,随着时间各种消费电子都起来了。
即便是"会讲段子讨人开心"这样看似简单的需求,产品形态再怎么设计都很难——首先模型要理解用户、理解用户的环境背景context、还能举一反三。想实现幽默这一个点就不太容易,必须向下改模型、改模型的性格、改数据。这不是传统产品经理能解决的。
是时间和工程问题,下降速度可能大幅超越预期。创业者应该按照免费的心态去构建应用,用最好的模型API做PMF。围绕成本下降,之前哪些场景"突然work了"会出来很多机会——尤其是企业级应用。
| 维度 | GPT-3 → GPT-4 | GPT-4 → GPT-5 |
|---|---|---|
| 算力提升 | 几十倍 | 今天也就十几倍 |
| 训练集群 | - | 从拿到GPU到真正大规模训练需要半年 |
| 系统复杂度 | - | 模型变大后指数提升,出现想象不到的新问题 |
"就是为了降成本——这样又能省出来很多卡去给到research。"成本下降速度超出预期。
| 公司 | 关键判断 | 核心要点 |
|---|---|---|
| OpenAI | 核心团队极稳 | 伊利亚离开影响不大,最核心的100-200人没动,其他公司挖不动;工业化组织能力全球唯一 |
| Apple | 最稳的公司 | 手机未来三年仍最重要设备;关键看AI feature能否带来换机潮;"让妈妈养老钱买的公司我还是愿意买Apple" |
| 模型差一点意思 | 从Gemini 1.5后大幅提升好像没有;流量优势很强但模型总还差一点 | |
| 英伟达 | 超出可分析性 | 3万亿市值已price in未来一年半两年预期;没有竞争对手但叙事变化快;长期极其重要 |
| 微软 | 星际之门最有意思 | Copilot离预期差一些;1000亿美金超级计算机计划 |
| Meta | 人才密度不够 | Llama3 400B一直没发;内部还没搞懂MoE;卡和集群强但人才弱 |
| 特斯拉 | AI vs 车的估值争议 | FSD进步明显但AI revenue没有;100美元/月定价太高;xAI可能提供技术助力 |
| 台积电 | 不可替代 | 全球100% H100在台湾生产;体量这么大还有50%增速 |
创业公司与大公司不是颠覆关系而是依赖关系。OpenAI受限于英伟达(GPU)、微软(集群+49%股东+Azure渠道)、苹果(C端分发)。"OpenAI如果真要颠覆,好像只能挑战一下Google。"大家发现OpenAI没有颠覆巨头,最后都要求着巨头。
几十家公司在做RAG,但今天还很难分析谁能跑出来。RAG本质是工程问题——有十几个环节要优化,一个公司优化好一个环节容易,优化好十个环节很难。做得最好的还是Perplexity(检索网页)。企业级RAG如果成本降低、可以大规模无限试,会有很大帮助。
| 指标 | 数据 |
|---|---|
| OpenAI ARR | 34亿美金 |
| ChatGPT DAU | 1亿+ |
| Perplexity MAU | 2000万+ |
| Perplexity ARR | 2000万+美金(年底可能1亿MAU/1亿$ARR) |
| GPT-4 API定价降幅 | 过去一年10倍(输入60→5$/百万Token) |
| Bing全球搜索份额 | 3.4%,120亿美金年营收 |
| Google广告年营收 | 2000亿+美金 |
| xAI目标集群 | 10万卡H100(全球第一个全液冷充分互联) |
| 星际之门投入 | 1000亿美金 |
| OpenAI人才密度 | "一个人顶十个人",Sora团队不到10人 |
AI搜索匹配了当前模型的组合性创造能力,Perplexity用先发优势占住了用户心智。但护城河仍然脆弱——80%概率被并购。
从组合性创造(信息检索)→ 探索性创造(投研报告)→ 变革性创造(科学发现),每一次能力跃升都对应新的应用爆发窗口。GPT-5发布后的半年是关键时间窗口。
API定价一年降10倍,创业者应按免费心态构建应用。成本下降+速度提升让之前不work的场景突然work,企业级应用可能最先受益。
大公司与创业公司不是颠覆关系而是依赖关系。GPU受限英伟达、集群受限微软、C端受限苹果、企业端受限云厂商。巨头强者恒强,只有Google可能被挑战。
表面benchmark追上了,但泛化能力、人才密度、GPU集群规模差距仍在扩大。OpenAI公开的可能只是三成功力。蒸馏和刷榜带来虚假的追赶感。
GPT-4O端到端声音模型开启了低延迟高智能的新交互范式。声音降低交互能耗,就像触屏催生短视频一样,Voice Agent可能孕育全新产品形态。
Perplexity验证了先用最好的外部模型做PMF、再蒸馏小模型降成本、最终端到端优化的路径。产品心智 > 模型能力,在应用层面成立。
全球最顶尖的科学家和科技巨头都在巨量投入下一代模型,新架构都试过了没有发现真正work的替代。Transformer作为底座加上Data/Compute效率优化可能是未来方向。
像好莱坞持续产出好电影一样,OpenAI持续做科研的成功率最高——很年轻的PhD一年就能产出Sora。给单位GPU的产出最高,整个infra、做事方式、定目标能力形成了系统性优势。