← 返回张小珺主页
深度研究 Deep Dive

口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态

#69 全球大模型季报第三集
2024年6月 · 张小珺Jun|商业访谈录 · 嘉宾:广密
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 节目定位与半年复盘
  2. Perplexity:AI搜索的破局者
  3. Perplexity的资本游戏与融资历程
  4. 为什么是Perplexity跑出来了
  5. AI搜索与传统搜索的攻防
  6. 硅谷AI创业公司全景扫描
  7. 海外大模型的资本扑克牌
  8. AI应用为什么还没有大爆发
  9. 高确定性与高赔率问题
  10. GPT-5:为什么来得这么慢
  11. 大模型的商业模式与壁垒
  12. 中美差距:非共识的判断
  13. 硅谷科技巨头半年点评
  14. 通用机器人与无人驾驶
  15. 创新生态差异:零到一 vs 一到百
  16. 关键数据汇总与终局展望

一、节目定位与半年复盘

本期是张小珺商业访谈录全球大模型季报的第三集,延续第54集和第64集的系列框架。嘉宾广密在2024年上半年依然在美国花了大量时间,从AI应用端出发,复盘全球大模型这半年的进展。

2024上半年的总体判断

广密
GPT-4出来一年多了,AI应用还没有大爆发。从结果上看是比较无聊的。

广密直言,抛开大模型公司自身的应用如ChatGPT,硅谷主流VC投的、跑出来的、上一定估值的AI原生应用公司,其实就想到Perplexity一家。2000多万月活、2000多万美金的ARR,其他很多还在PMF之前的阶段。

核心共识

AI搜索是大模型纪元中,在应用端达成的第一个共识。信息检索仍是匹配当前模型能力最重要的use case。

二、Perplexity:AI搜索的破局者

创始团队画像

关键人物

  • CEO:印度裔,Berkeley CS PhD,最早在OpenAI/DeepMind实习,毕业后加入OpenAI一年即出来创业,约94年生
  • CTO:原微软Bing搜索工程师 → Quora → Meta AI
  • 团队规模约50人
  • 2020年8月成立,在ChatGPT发布之前就已成立

产品核心数据

2000万+
月活用户(MAU)
2000万+
年化营收(ARR / 美元)
3x+
单用户日均搜索量 vs Google
20%+
月度环比增长

关键决策与增长逻辑

广密
长期留存很高,显著比其他AI产品要高。跟2013年今日头条APP的次留46%基本上是一样的。

三、Perplexity的资本游戏与融资历程

融资历程

2023年初 · A轮

首轮机构化融资,硅谷核心AI圈的个人投资人大量参与。

2024年初 · 5亿美元估值轮

IVP等机构参与。

2024年中 · 10亿美元估值轮

个人投资人仍然活跃,Daniel Gross(AI Grant创始人)个人投了很多钱。

2024年最新 · 30亿美元估值

由Betham领投,差不多每半年融一轮的节奏。

个人投资人阵容

投资人身份
Jeff DeanGoogle SVP
Yann LeCunMeta首席AI科学家
Andrej Karpathy前OpenAI / Tesla
Jeff Bezos亚马逊创始人(也是Google天使投资人)
Nat Friedman前GitHub CEO
Elad Gil知名Solo GP
Clement DelangueHugging Face CEO
Ron ConwayDatabricks联合创始人

为什么个人投资人这么多

与中国以VC为主不同,硅谷AI核心圈的个人投资人钱多、更懂行、喜欢早期参与。如AI Grant的影响力在AI领域甚至比YC更强——"他们自己之前还买了很多H100给portfolio用"。早期逻辑是:从OpenAI出来的人做搜索,这种团队值得被OpenAI再收购回去,可以"换OpenAI股票"。

四、为什么是Perplexity跑出来了

核心框架

三种创造性任务与模型能力匹配

广密将知识工作者的创造性任务分为三类:

  • 组合性创造:信息检索、整理、组合——最匹配当前模型能力
  • 探索性创造:如写一篇Tesla投研报告,需要规划和多步推理——GPT-4水平尚不够
  • 变革性创造:如科学发现、万有引力定律——当前大模型很难做到

信息检索是组合性工作的典型代表,恰好匹配当前模型能力的边界。Perplexity团队对模型能力边界的理解非常深——模型今天还没有自由探索的能力,更多是信息组合能力。

"先产品后模型"的反直觉策略

Perplexity的路径

  • 先思考产品,再思考模型
  • 坚决先用外部最好的模型
  • 专注产品、用户增长、留存
  • 之后再fine-tune自己的Mistral 7B小模型
  • 最终走向端到端Full Stack优化

中国模型公司的路径

  • 先提高模型能力,同步想产品
  • 从大模型到应用的公司
  • 必须往上做应用
  • 美国好的use case出来后借鉴
  • "今天又回到copy from US的时代了"

广密建议的应用创业路径

  • 基于最好的模型API先做PMF
  • 之后想办法降成本
  • 再想办法own自己的模型——蒸馏(distill)一个小模型
  • 有可能未来很多应用公司也会own自己的小模型

五、AI搜索与传统搜索的攻防

搜索市场的巨大空间

广密
微软Bing只有全球搜索3.4%的份额,但产生了120亿美金的年营收。AI搜索只要抢到Google 1%到2%的份额,这个生意就很大。AI搜索应该是大模型初期最大的Killer App。

Perplexity的护城河

先发效应带来的用户心智

  • 今天AI产品还没有很强的网络效应、规模效应和数据飞轮
  • 核心壁垒是用户心智——就像Google早年占住了搜索心智
  • 错位竞争:对应传统搜索中约5%的复杂问题问答,这是传统搜索没做好的"皇冠上的明珠"
  • 未来想象空间:Agent落地后,搜索是最适合Agent落地的场景

终局判断

80%
被并购概率(广密判断)
30亿
当前估值(美元)

中国版Perplexity的困境

中国过早进入移动互联网,内容严重割裂——小红书、微信、知乎的内容互不检索。百度搜索首页大量是自家内容。这与海外PC形态主导的开放网页生态差异巨大。中国的AI搜索"肯定是巨头的菜"——字节一年前就应该做这样的产品打百度。

Perplexity vs 月之暗面Kimi

Perplexity

  • 从应用到模型的公司
  • 纯应用公司中估值最高
  • 30亿美元
  • 美国应用公司很难往下做基础模型

月之暗面(Kimi)

  • 从大模型到应用的公司
  • 基础大模型公司
  • 30亿美元(同一估值)
  • 中国模型公司必须往上做应用

六、硅谷AI创业公司全景扫描

硅谷AI公司估值梯队分布(2024年中)

估值梯队

梯队公司估值(美元)备注
第一梯队OpenAI~千亿级ChatGPT上亿DAU,ARR 34亿美金
第二梯队Anthropic~200亿AWS深度绑定
第二梯队xAI~200亿马斯克融了60亿,拿到最后一张门票
第三梯队Mistral~50-60亿刚融5-6亿美金
第三梯队Cohere~40-50亿企业端
第三梯队Character~30-50亿600-700万DAU,想再融几个billion很难
AI应用Perplexity30亿纯应用中估值最高
AI应用Cursor(AI程序员)~20亿最近较火
AI应用其他独角兽数亿级有规模化ARR超1000万美金的非常少
广密
整个硅谷其他所有AI公司的ARR加起来应该还不到15亿美金,可能还不到OpenAI的一半。

硅谷投资的三大方向

  • Agent:想做Agent的公司很多,如Reflection等出来就估值几亿美金
  • Coding:AI程序员方向火热
  • 通用机器人:需要长期投入

广密的担忧:"这三个大方向都在OpenAI未来模型的覆盖范围之内。出来了这些,就感觉在沙滩上建城堡,是不牢靠的。"

七、海外大模型的资本扑克牌

巨头绑定格局

AWS
深度绑定 Anthropic
微软
深度绑定 OpenAI(49%股东)
马斯克
xAI 自成一派

海外比中国更清晰,不那么混沌。独立的大模型公司只剩三家:OpenAI、Anthropic、xAI。年内需要3.2万卡集群,明年奔着10万卡。没有极强大腿再给几个billion,很难在大模型上卷。

GPU决定生死线

2024年生死线

  • 年内没有3.2万卡H100集群
  • 肯定不在第一梯队
  • 会加速二三线公司出局或被收购

2025年生死线

  • 第一梯队门票:10万卡
  • B系列可能明年才大规模到货
  • 马斯克xAI计划全球第一个10万卡集群

Apple与Meta的悬念

广密期待未来6-12个月Apple和Meta怎么选。巴菲特减持Apple,Apple有1100亿美金回购——"如果是我,应该去收购一家公司"。Meta的Llama团队人才密度不够,GPU和集群能力很强但人才弱于前几家。

八、AI应用为什么还没有大爆发

90%的原因:模型能力不够

广密
90%的原因是只基于GPT-4的能力水平是不够的。只能做信息组合这种创新,没办法做长距离的推理,包括一些创造性工作。所以还是得卷下一代模型,尤其是推理能力和多模态能力。

10%的原因:时间问题

基于GPT-4水平还是有概率做出大应用的——过去NLP 20年也不算绝对成熟,但诞生了搜索这种Killer App。电发明后也只有电能Power这一个Killer App,随着时间各种消费电子都起来了。

模型能力举例

想要一个"幽默版ChatGPT"有多难

即便是"会讲段子讨人开心"这样看似简单的需求,产品形态再怎么设计都很难——首先模型要理解用户、理解用户的环境背景context、还能举一反三。想实现幽默这一个点就不太容易,必须向下改模型、改模型的性格、改数据。这不是传统产品经理能解决的。

应用大爆发的关键条件

Scaling Law的两条线(延续前期判断)

  • 能力上涨:模型能力提升,尤其推理能力
  • 成本下降:GPT-4定价过去一年已降10倍(输入端60→5美元/百万Token,输出端120→15美元)
广密
GPT-5出来后的半年——给大家一些试验时间。我觉得需要年轻的产品天才。

九、高确定性与高赔率问题

AI发展趋势:确定性 vs 赔率矩阵

高确定性关键词

1
成本下降
2
多模态改变交互
3
端侧

成本下降

是时间和工程问题,下降速度可能大幅超越预期。创业者应该按照免费的心态去构建应用,用最好的模型API做PMF。围绕成本下降,之前哪些场景"突然work了"会出来很多机会——尤其是企业级应用。

多模态改变交互

Voice Agent:下一代交互界面

  • GPT-4O是第一个端到端声音进声音出的大模型
  • 声音大幅降低交互能耗——就像触屏手机比键盘手机能耗更低
  • 手机触屏催生了短视频,声音Agent能否孕育新的"抖音"?
  • 核心变量:4O的声音API什么时候开放

端侧模型

远被低估的模型变小速度

  • 未来6-12个月可能有一个3B模型达到极好效果
  • GPT-4O明年可能跑在手机上
  • iPhone内存从8GB → 12GB → 24GB往上提
  • 之前不work的IoT互联网有可能变得work
  • 隐私优势:如果强AI助理在手机上24小时打开,比云端更让用户放心

高赔率问题

十、GPT-5:为什么来得这么慢

核心原因:GPU物理世界的建设问题

广密
不是AI的问题,也不是大家提的数据不够用的问题,更不是Scaling Law遇到瓶颈。就是实实在在的GPU物理世界的建设问题。H100大批量到货已经是2023年Q4了,集群搭起来还需要很多时间,今年初才能做大规模训练。

算力对比

维度GPT-3GPT-4GPT-4 → GPT-5
算力提升几十倍今天也就十几倍
训练集群-从拿到GPU到真正大规模训练需要半年
系统复杂度-模型变大后指数提升,出现想象不到的新问题

GPT-5会长什么样

广密的预判

  • 预期2024年底发布
  • 参数比GPT-4大3-5倍,可能5-10T参数
  • 数据量比GPT-4大7-10倍
  • 可能走向非常大的MoE架构——参数量巨大但激活可能四五百B
  • 多模态输入输出,但很难做视频生成(成本太高)
  • 逻辑推理能力大幅提升——对解锁应用最关键
  • 可能发多个版本

为什么GPT-4和GPT-5之间插了GPT-4O

"就是为了降成本——这样又能省出来很多卡去给到research。"成本下降速度超出预期。

Scaling Law是否遇到瓶颈

广密
Scaling Law好像是最简单的路径了。简单粗暴的堆GPU就能通往AGI。成了就造福人类,败了都是科技巨头买单。新的架构他们应该全都试过了,至今没有发现其他真的work的路径。

十一、大模型的商业模式与壁垒

商业模式的困境

传统广告平台

  • Google广告年营收2000亿美金
  • 新增用户ROI可预测
  • 非常成熟的商业模式
  • 建立在人的注意力有限之上

大模型订阅

  • ChatGPT 1亿DAU × 10%付费 × 200美元/年 = 20亿美金
  • 只占Google营收1-2%
  • GPU投入ROI无法计算
  • AI助手反而让广告投放天然变差
广密
AI助手的产品都是帮助用户节约时间,那它就让广告投放天然变得比较差。AI公司想成为伟大公司,还是要有极好的商业模式。今天这个商业模式的0到1,这个1我觉得还是没有跑通的。

未来商业模式的可能性

Agent颠覆广告平台

  • Travel Agent帮用户比价谈价,用户不再被迫看广告
  • Agent 7x24小时工作,对传统广告平台有巨大颠覆效应
  • Value-based定价:用ChatGPT各种Agent增加了1万块产出,付5%服务费也make sense

壁垒是什么

十二、中美差距:非共识的判断

广密
我说一个非共识的观点——我觉得真实差距可能是在拉大的,而不是表面上看着真的追上了。更准确地说,可以局部追上,比如热门问题的问答。但国内模型处理长尾问题其实都还不太行,说明泛化能力还是不够。

差距拉大的核心论据

看不见的暗处

  • 不知道OpenAI内部又走到多远——GPT-4O可能只代表OpenAI"三成功力"
  • 人才密度极高、最领先的模型、更早拿到更大量的GPU做更多探索
  • "想用5%的资源真正超过OpenAI 100%的投入,比较难"
  • 人才密度:OpenAI一个人顶十个人,Sora团队不到十个人

Benchmark的可信度

榜单已经被hack掉了

  • 题目全都是公开的,可以做提前的充分训练
  • 国内模型做蒸馏(distill)做得比较凶,很多人在distill头部模型公司的数据
  • "相当于用小学生中学生的能力死记硬背变得能说会道了,但是不是真的智能不知道"
  • 蒸馏会增加hallucination——模型不知道自己不懂的问题但还是会回答

GPU差距

小几千张
国内GPU训练规模
2-3万张
美国一线GPU集群
10万+
美国下一阶段目标
1000亿$
微软+OpenAI星际之门

十三、硅谷科技巨头半年点评

科技巨头AI布局多维对比
公司关键判断核心要点
OpenAI核心团队极稳伊利亚离开影响不大,最核心的100-200人没动,其他公司挖不动;工业化组织能力全球唯一
Apple最稳的公司手机未来三年仍最重要设备;关键看AI feature能否带来换机潮;"让妈妈养老钱买的公司我还是愿意买Apple"
Google模型差一点意思从Gemini 1.5后大幅提升好像没有;流量优势很强但模型总还差一点
英伟达超出可分析性3万亿市值已price in未来一年半两年预期;没有竞争对手但叙事变化快;长期极其重要
微软星际之门最有意思Copilot离预期差一些;1000亿美金超级计算机计划
Meta人才密度不够Llama3 400B一直没发;内部还没搞懂MoE;卡和集群强但人才弱
特斯拉AI vs 车的估值争议FSD进步明显但AI revenue没有;100美元/月定价太高;xAI可能提供技术助力
台积电不可替代全球100% H100在台湾生产;体量这么大还有50%增速

巨头恒强,AI公司活在巨头阴影下

创业公司与大公司不是颠覆关系而是依赖关系。OpenAI受限于英伟达(GPU)、微软(集群+49%股东+Azure渠道)、苹果(C端分发)。"OpenAI如果真要颠覆,好像只能挑战一下Google。"大家发现OpenAI没有颠覆巨头,最后都要求着巨头。

十四、通用机器人与无人驾驶

通用机器人

当前状态

  • 大脑未来就是多模态大模型底座 + 机器人数据fine-tuning,不存在独立的机器人大脑模型
  • 难点:从大脑智能规划能力转化成控制信号,需要大规模设备铺设后持续RL
  • 硅谷除Tesla外,通用机器人公司都不具备硬件本体能力——大概率中国公司的机会
  • 没有人能定义出真正好的场景——先造出来让大家试,像个人电脑第一个场景是报税

无人驾驶

  • 落地更快——限定几个action(前进/刹车/转弯)
  • Tesla团队比较自信,可能两年内解决战斗
  • FSD从Palo Alto开到旧金山不用碰方向盘
  • 安全性已比人高很多

通用机器人

  • 落地更慢——要处理的事情太多
  • 目标还没定义清楚
  • 做家务还得5年
  • 中国供应链优势非常强

十五、创新生态差异:零到一 vs 一到百

广密
硅谷零到一还是比较多的,中国的创业者一到一百非常多。这是一个非常明显的体感差异。

差异背后的原因

硅谷:创新的温室

  • 资本充裕,容忍了非常多的失败
  • 失败后还能被收购、还能退出,收购环境好
  • 很多人可以异想天开,有充足的VC资本支持0到1创新

中国:一到百更多

  • 技术辨识度比较低——内卷的重要原因
  • 创业玩家多但差异化不够
  • "没有人跟SpaceX竞争,买无人机不知道大疆第二名是谁——大疆有技术辨识度"
  • 需要更多长期的风险资本支持

RAG的现状

几十家公司在做RAG,但今天还很难分析谁能跑出来。RAG本质是工程问题——有十几个环节要优化,一个公司优化好一个环节容易,优化好十个环节很难。做得最好的还是Perplexity(检索网页)。企业级RAG如果成本降低、可以大规模无限试,会有很大帮助。

十六、关键数据汇总与终局展望

核心数据一览

指标数据
OpenAI ARR34亿美金
ChatGPT DAU1亿+
Perplexity MAU2000万+
Perplexity ARR2000万+美金(年底可能1亿MAU/1亿$ARR)
GPT-4 API定价降幅过去一年10倍(输入60→5$/百万Token)
Bing全球搜索份额3.4%,120亿美金年营收
Google广告年营收2000亿+美金
xAI目标集群10万卡H100(全球第一个全液冷充分互联)
星际之门投入1000亿美金
OpenAI人才密度"一个人顶十个人",Sora团队不到10人

2024下半年重点关注方向

1
成本下降解锁的新应用
2
端侧设备与AI硬件
3
通用机器人

终局洞察

洞察一:信息检索是大模型第一个Killer App

AI搜索匹配了当前模型的组合性创造能力,Perplexity用先发优势占住了用户心智。但护城河仍然脆弱——80%概率被并购。

洞察二:模型能力渐进式解锁应用

从组合性创造(信息检索)→ 探索性创造(投研报告)→ 变革性创造(科学发现),每一次能力跃升都对应新的应用爆发窗口。GPT-5发布后的半年是关键时间窗口。

洞察三:成本下降是最高确定性的机会

API定价一年降10倍,创业者应按免费心态构建应用。成本下降+速度提升让之前不work的场景突然work,企业级应用可能最先受益。

洞察四:AI创业公司活在巨头阴影下

大公司与创业公司不是颠覆关系而是依赖关系。GPU受限英伟达、集群受限微软、C端受限苹果、企业端受限云厂商。巨头强者恒强,只有Google可能被挑战。

洞察五:中美差距在暗处拉大

表面benchmark追上了,但泛化能力、人才密度、GPU集群规模差距仍在扩大。OpenAI公开的可能只是三成功力。蒸馏和刷榜带来虚假的追赶感。

洞察六:Voice Agent可能是下一代交互革命

GPT-4O端到端声音模型开启了低延迟高智能的新交互范式。声音降低交互能耗,就像触屏催生短视频一样,Voice Agent可能孕育全新产品形态。

洞察七:"先产品后模型"是应用创业的正确路径

Perplexity验证了先用最好的外部模型做PMF、再蒸馏小模型降成本、最终端到端优化的路径。产品心智 > 模型能力,在应用层面成立。

洞察八:Scaling Law仍是通往AGI的最简单路径

全球最顶尖的科学家和科技巨头都在巨量投入下一代模型,新架构都试过了没有发现真正work的替代。Transformer作为底座加上Data/Compute效率优化可能是未来方向。

洞察九:OpenAI的工业化组织能力是真正的壁垒

像好莱坞持续产出好电影一样,OpenAI持续做科研的成功率最高——很年轻的PhD一年就能产出Sora。给单位GPU的产出最高,整个infra、做事方式、定目标能力形成了系统性优势。