深度研究 — #69 口述全球大模型这半年：Perplexity突然火爆和尚未爆发的AI应用生态

一、节目定位与半年复盘

本期是张小珺商业访谈录全球大模型季报的第三集，延续第54集和第64集的系列框架。嘉宾广密在2024年上半年依然在美国花了大量时间，从AI应用端出发，复盘全球大模型这半年的进展。

2024上半年的总体判断

广密

GPT-4出来一年多了，AI应用还没有大爆发。从结果上看是比较无聊的。

广密直言，抛开大模型公司自身的应用如ChatGPT，硅谷主流VC投的、跑出来的、上一定估值的AI原生应用公司，其实就想到Perplexity一家。2000多万月活、2000多万美金的ARR，其他很多还在PMF之前的阶段。

核心共识

AI搜索是大模型纪元中，在应用端达成的第一个共识。信息检索仍是匹配当前模型能力最重要的use case。

二、Perplexity：AI搜索的破局者

创始团队画像

关键人物

CEO：印度裔，Berkeley CS PhD，最早在OpenAI/DeepMind实习，毕业后加入OpenAI一年即出来创业，约94年生
CTO：原微软Bing搜索工程师 → Quora → Meta AI
团队规模约50人
2020年8月成立，在ChatGPT发布之前就已成立

产品核心数据

2000万+

月活用户（MAU）

2000万+

年化营收（ARR / 美元）

3x+

单用户日均搜索量 vs Google

20%+

月度环比增长

关键决策与增长逻辑

NVIDIA投资后，黄仁勋公开代言——称Perplexity是他用得最多的AI产品
CEO持续布道，占住AI搜索心智
在增长动作上做了非常多——"这个产品的核心就是增长"
产品心智已形成：Perplexity = AI搜索，ChatGPT = 对话，Character = 陪伴

广密

长期留存很高，显著比其他AI产品要高。跟2013年今日头条APP的次留46%基本上是一样的。

三、Perplexity的资本游戏与融资历程

融资历程

2023年初 · A轮

首轮机构化融资，硅谷核心AI圈的个人投资人大量参与。

2024年初 · 5亿美元估值轮

IVP等机构参与。

2024年中 · 10亿美元估值轮

个人投资人仍然活跃，Daniel Gross（AI Grant创始人）个人投了很多钱。

2024年最新 · 30亿美元估值

由Betham领投，差不多每半年融一轮的节奏。

个人投资人阵容

投资人	身份
Jeff Dean	Google SVP
Yann LeCun	Meta首席AI科学家
Andrej Karpathy	前OpenAI / Tesla
Jeff Bezos	亚马逊创始人（也是Google天使投资人）
Nat Friedman	前GitHub CEO
Elad Gil	知名Solo GP
Clement Delangue	Hugging Face CEO
Ron Conway	Databricks联合创始人

为什么个人投资人这么多

与中国以VC为主不同，硅谷AI核心圈的个人投资人钱多、更懂行、喜欢早期参与。如AI Grant的影响力在AI领域甚至比YC更强——"他们自己之前还买了很多H100给portfolio用"。早期逻辑是：从OpenAI出来的人做搜索，这种团队值得被OpenAI再收购回去，可以"换OpenAI股票"。

四、为什么是Perplexity跑出来了

核心框架

三种创造性任务与模型能力匹配

广密将知识工作者的创造性任务分为三类：

组合性创造：信息检索、整理、组合——最匹配当前模型能力
探索性创造：如写一篇Tesla投研报告，需要规划和多步推理——GPT-4水平尚不够
变革性创造：如科学发现、万有引力定律——当前大模型很难做到

信息检索是组合性工作的典型代表，恰好匹配当前模型能力的边界。Perplexity团队对模型能力边界的理解非常深——模型今天还没有自由探索的能力，更多是信息组合能力。

"先产品后模型"的反直觉策略

Perplexity的路径

先思考产品，再思考模型
坚决先用外部最好的模型
专注产品、用户增长、留存
之后再fine-tune自己的Mistral 7B小模型
最终走向端到端Full Stack优化

中国模型公司的路径

先提高模型能力，同步想产品
从大模型到应用的公司
必须往上做应用
美国好的use case出来后借鉴
"今天又回到copy from US的时代了"

广密建议的应用创业路径

基于最好的模型API先做PMF
之后想办法降成本
再想办法own自己的模型——蒸馏(distill)一个小模型
有可能未来很多应用公司也会own自己的小模型

五、AI搜索与传统搜索的攻防

搜索市场的巨大空间

广密

微软Bing只有全球搜索3.4%的份额，但产生了120亿美金的年营收。AI搜索只要抢到Google 1%到2%的份额，这个生意就很大。AI搜索应该是大模型初期最大的Killer App。

Perplexity的护城河

先发效应带来的用户心智

今天AI产品还没有很强的网络效应、规模效应和数据飞轮
核心壁垒是用户心智——就像Google早年占住了搜索心智
错位竞争：对应传统搜索中约5%的复杂问题问答，这是传统搜索没做好的"皇冠上的明珠"
未来想象空间：Agent落地后，搜索是最适合Agent落地的场景

终局判断

80%

被并购概率（广密判断）

30亿

当前估值（美元）

中国版Perplexity的困境

中国过早进入移动互联网，内容严重割裂——小红书、微信、知乎的内容互不检索。百度搜索首页大量是自家内容。这与海外PC形态主导的开放网页生态差异巨大。中国的AI搜索"肯定是巨头的菜"——字节一年前就应该做这样的产品打百度。

Perplexity vs 月之暗面（Kimi）

Perplexity

从应用到模型的公司
纯应用公司中估值最高
30亿美元
美国应用公司很难往下做基础模型

月之暗面（Kimi）

从大模型到应用的公司
基础大模型公司
30亿美元（同一估值）
中国模型公司必须往上做应用

六、硅谷AI创业公司全景扫描

硅谷AI公司估值梯队分布（2024年中）

估值梯队

梯队	公司	估值（美元）	备注
第一梯队	OpenAI	~千亿级	ChatGPT上亿DAU，ARR 34亿美金
第二梯队	Anthropic	~200亿	AWS深度绑定
第二梯队	xAI	~200亿	马斯克融了60亿，拿到最后一张门票
第三梯队	Mistral	~50-60亿	刚融5-6亿美金
第三梯队	Cohere	~40-50亿	企业端
第三梯队	Character	~30-50亿	600-700万DAU，想再融几个billion很难
AI应用	Perplexity	30亿	纯应用中估值最高
AI应用	Cursor（AI程序员）	~20亿	最近较火
AI应用	其他独角兽	数亿级	有规模化ARR超1000万美金的非常少

广密

整个硅谷其他所有AI公司的ARR加起来应该还不到15亿美金，可能还不到OpenAI的一半。

硅谷投资的三大方向

Agent：想做Agent的公司很多，如Reflection等出来就估值几亿美金
Coding：AI程序员方向火热
通用机器人：需要长期投入

广密的担忧："这三个大方向都在OpenAI未来模型的覆盖范围之内。出来了这些，就感觉在沙滩上建城堡，是不牢靠的。"

七、海外大模型的资本扑克牌

巨头绑定格局

AWS

深度绑定 Anthropic

微软

深度绑定 OpenAI（49%股东）

马斯克

xAI 自成一派

海外比中国更清晰，不那么混沌。独立的大模型公司只剩三家：OpenAI、Anthropic、xAI。年内需要3.2万卡集群，明年奔着10万卡。没有极强大腿再给几个billion，很难在大模型上卷。

GPU决定生死线

2024年生死线

年内没有3.2万卡H100集群
肯定不在第一梯队
会加速二三线公司出局或被收购

2025年生死线

第一梯队门票：10万卡
B系列可能明年才大规模到货
马斯克xAI计划全球第一个10万卡集群

Apple与Meta的悬念

广密期待未来6-12个月Apple和Meta怎么选。巴菲特减持Apple，Apple有1100亿美金回购——"如果是我，应该去收购一家公司"。Meta的Llama团队人才密度不够，GPU和集群能力很强但人才弱于前几家。

八、AI应用为什么还没有大爆发

90%的原因：模型能力不够

广密

90%的原因是只基于GPT-4的能力水平是不够的。只能做信息组合这种创新，没办法做长距离的推理，包括一些创造性工作。所以还是得卷下一代模型，尤其是推理能力和多模态能力。

10%的原因：时间问题

基于GPT-4水平还是有概率做出大应用的——过去NLP 20年也不算绝对成熟，但诞生了搜索这种Killer App。电发明后也只有电能Power这一个Killer App，随着时间各种消费电子都起来了。

模型能力举例

想要一个"幽默版ChatGPT"有多难

即便是"会讲段子讨人开心"这样看似简单的需求，产品形态再怎么设计都很难——首先模型要理解用户、理解用户的环境背景context、还能举一反三。想实现幽默这一个点就不太容易，必须向下改模型、改模型的性格、改数据。这不是传统产品经理能解决的。

应用大爆发的关键条件

Scaling Law的两条线（延续前期判断）

能力上涨：模型能力提升，尤其推理能力
成本下降：GPT-4定价过去一年已降10倍（输入端60→5美元/百万Token，输出端120→15美元）

广密

GPT-5出来后的半年——给大家一些试验时间。我觉得需要年轻的产品天才。

九、高确定性与高赔率问题

AI发展趋势：确定性 vs 赔率矩阵

高确定性关键词

1

成本下降

2

多模态改变交互

3

端侧

成本下降

是时间和工程问题，下降速度可能大幅超越预期。创业者应该按照免费的心态去构建应用，用最好的模型API做PMF。围绕成本下降，之前哪些场景"突然work了"会出来很多机会——尤其是企业级应用。

多模态改变交互

Voice Agent：下一代交互界面

GPT-4O是第一个端到端声音进声音出的大模型
声音大幅降低交互能耗——就像触屏手机比键盘手机能耗更低
手机触屏催生了短视频，声音Agent能否孕育新的"抖音"？
核心变量：4O的声音API什么时候开放

端侧模型

远被低估的模型变小速度

未来6-12个月可能有一个3B模型达到极好效果
GPT-4O明年可能跑在手机上
iPhone内存从8GB → 12GB → 24GB往上提
之前不work的IoT互联网有可能变得work
隐私优势：如果强AI助理在手机上24小时打开，比云端更让用户放心

高赔率问题

逻辑推理能力（Reasoning）：不确定的科学问题，有两三个路径在尝试
可解释性：打开后模型的可控性就解决了，被低估
模型的组织能力：全球只有OpenAI相对工业化，其他还像实验室
AGI产品载体：如果明天AGI实现了，用什么产品承接？手机APP？还是别的？
GPT-5和Claude 3的能力提升：应该乐观

十、GPT-5：为什么来得这么慢

核心原因：GPU物理世界的建设问题

广密

不是AI的问题，也不是大家提的数据不够用的问题，更不是Scaling Law遇到瓶颈。就是实实在在的GPU物理世界的建设问题。H100大批量到货已经是2023年Q4了，集群搭起来还需要很多时间，今年初才能做大规模训练。

算力对比

维度	GPT-3 → GPT-4	GPT-4 → GPT-5
算力提升	几十倍	今天也就十几倍
训练集群	-	从拿到GPU到真正大规模训练需要半年
系统复杂度	-	模型变大后指数提升，出现想象不到的新问题

GPT-5会长什么样

广密的预判

预期2024年底发布
参数比GPT-4大3-5倍，可能5-10T参数
数据量比GPT-4大7-10倍
可能走向非常大的MoE架构——参数量巨大但激活可能四五百B
多模态输入输出，但很难做视频生成（成本太高）
逻辑推理能力大幅提升——对解锁应用最关键
可能发多个版本

为什么GPT-4和GPT-5之间插了GPT-4O

"就是为了降成本——这样又能省出来很多卡去给到research。"成本下降速度超出预期。

Scaling Law是否遇到瓶颈

广密

Scaling Law好像是最简单的路径了。简单粗暴的堆GPU就能通往AGI。成了就造福人类，败了都是科技巨头买单。新的架构他们应该全都试过了，至今没有发现其他真的work的路径。

十一、大模型的商业模式与壁垒

商业模式的困境

传统广告平台

Google广告年营收2000亿美金
新增用户ROI可预测
非常成熟的商业模式
建立在人的注意力有限之上

大模型订阅

ChatGPT 1亿DAU × 10%付费 × 200美元/年 = 20亿美金
只占Google营收1-2%
GPU投入ROI无法计算
AI助手反而让广告投放天然变差

广密

AI助手的产品都是帮助用户节约时间，那它就让广告投放天然变得比较差。AI公司想成为伟大公司，还是要有极好的商业模式。今天这个商业模式的0到1，这个1我觉得还是没有跑通的。

未来商业模式的可能性

Agent颠覆广告平台

Travel Agent帮用户比价谈价，用户不再被迫看广告
Agent 7x24小时工作，对传统广告平台有巨大颠覆效应
Value-based定价：用ChatGPT各种Agent增加了1万块产出，付5%服务费也make sense

壁垒是什么

GPU：第一阶段最重要的门槛
人才：需要30-50个核心人才团队，今天很难再重新Build一个像xAI一样的团队
工业体系：像好莱坞一样的成熟组织方式和科研效率
综合壁垒：给了卡、投了钱，科研效率低也很容易掉队

十二、中美差距：非共识的判断

广密

我说一个非共识的观点——我觉得真实差距可能是在拉大的，而不是表面上看着真的追上了。更准确地说，可以局部追上，比如热门问题的问答。但国内模型处理长尾问题其实都还不太行，说明泛化能力还是不够。

差距拉大的核心论据

看不见的暗处

不知道OpenAI内部又走到多远——GPT-4O可能只代表OpenAI"三成功力"
人才密度极高、最领先的模型、更早拿到更大量的GPU做更多探索
"想用5%的资源真正超过OpenAI 100%的投入，比较难"
人才密度：OpenAI一个人顶十个人，Sora团队不到十个人

Benchmark的可信度

榜单已经被hack掉了

题目全都是公开的，可以做提前的充分训练
国内模型做蒸馏(distill)做得比较凶，很多人在distill头部模型公司的数据
"相当于用小学生中学生的能力死记硬背变得能说会道了，但是不是真的智能不知道"
蒸馏会增加hallucination——模型不知道自己不懂的问题但还是会回答

GPU差距

小几千张

国内GPU训练规模

2-3万张

美国一线GPU集群

10万+

美国下一阶段目标

1000亿$

微软+OpenAI星际之门

十三、硅谷科技巨头半年点评

科技巨头AI布局多维对比

公司	关键判断	核心要点
OpenAI	核心团队极稳	伊利亚离开影响不大，最核心的100-200人没动，其他公司挖不动；工业化组织能力全球唯一
Apple	最稳的公司	手机未来三年仍最重要设备；关键看AI feature能否带来换机潮；"让妈妈养老钱买的公司我还是愿意买Apple"
Google	模型差一点意思	从Gemini 1.5后大幅提升好像没有；流量优势很强但模型总还差一点
英伟达	超出可分析性	3万亿市值已price in未来一年半两年预期；没有竞争对手但叙事变化快；长期极其重要
微软	星际之门最有意思	Copilot离预期差一些；1000亿美金超级计算机计划
Meta	人才密度不够	Llama3 400B一直没发；内部还没搞懂MoE；卡和集群强但人才弱
特斯拉	AI vs 车的估值争议	FSD进步明显但AI revenue没有；100美元/月定价太高；xAI可能提供技术助力
台积电	不可替代	全球100% H100在台湾生产；体量这么大还有50%增速

巨头恒强，AI公司活在巨头阴影下

创业公司与大公司不是颠覆关系而是依赖关系。OpenAI受限于英伟达（GPU）、微软（集群+49%股东+Azure渠道）、苹果（C端分发）。"OpenAI如果真要颠覆，好像只能挑战一下Google。"大家发现OpenAI没有颠覆巨头，最后都要求着巨头。

十四、通用机器人与无人驾驶

通用机器人

当前状态

大脑未来就是多模态大模型底座 + 机器人数据fine-tuning，不存在独立的机器人大脑模型
难点：从大脑智能规划能力转化成控制信号，需要大规模设备铺设后持续RL
硅谷除Tesla外，通用机器人公司都不具备硬件本体能力——大概率中国公司的机会
没有人能定义出真正好的场景——先造出来让大家试，像个人电脑第一个场景是报税

无人驾驶

落地更快——限定几个action（前进/刹车/转弯）
Tesla团队比较自信，可能两年内解决战斗
FSD从Palo Alto开到旧金山不用碰方向盘
安全性已比人高很多

通用机器人

落地更慢——要处理的事情太多
目标还没定义清楚
做家务还得5年
中国供应链优势非常强

十五、创新生态差异：零到一 vs 一到百

广密

硅谷零到一还是比较多的，中国的创业者一到一百非常多。这是一个非常明显的体感差异。

差异背后的原因

硅谷：创新的温室

资本充裕，容忍了非常多的失败
失败后还能被收购、还能退出，收购环境好
很多人可以异想天开，有充足的VC资本支持0到1创新

中国：一到百更多

技术辨识度比较低——内卷的重要原因
创业玩家多但差异化不够
"没有人跟SpaceX竞争，买无人机不知道大疆第二名是谁——大疆有技术辨识度"
需要更多长期的风险资本支持

RAG的现状

几十家公司在做RAG，但今天还很难分析谁能跑出来。RAG本质是工程问题——有十几个环节要优化，一个公司优化好一个环节容易，优化好十个环节很难。做得最好的还是Perplexity（检索网页）。企业级RAG如果成本降低、可以大规模无限试，会有很大帮助。

十六、关键数据汇总与终局展望

核心数据一览

指标	数据
OpenAI ARR	34亿美金
ChatGPT DAU	1亿+
Perplexity MAU	2000万+
Perplexity ARR	2000万+美金（年底可能1亿MAU/1亿$ARR）
GPT-4 API定价降幅	过去一年10倍（输入60→5$/百万Token）
Bing全球搜索份额	3.4%，120亿美金年营收
Google广告年营收	2000亿+美金
xAI目标集群	10万卡H100（全球第一个全液冷充分互联）
星际之门投入	1000亿美金
OpenAI人才密度	"一个人顶十个人"，Sora团队不到10人

2024下半年重点关注方向

1

成本下降解锁的新应用

2

端侧设备与AI硬件

3

通用机器人

终局洞察

洞察一：信息检索是大模型第一个Killer App

AI搜索匹配了当前模型的组合性创造能力，Perplexity用先发优势占住了用户心智。但护城河仍然脆弱——80%概率被并购。

洞察二：模型能力渐进式解锁应用

从组合性创造（信息检索）→ 探索性创造（投研报告）→ 变革性创造（科学发现），每一次能力跃升都对应新的应用爆发窗口。GPT-5发布后的半年是关键时间窗口。

洞察三：成本下降是最高确定性的机会

API定价一年降10倍，创业者应按免费心态构建应用。成本下降+速度提升让之前不work的场景突然work，企业级应用可能最先受益。

洞察四：AI创业公司活在巨头阴影下

大公司与创业公司不是颠覆关系而是依赖关系。GPU受限英伟达、集群受限微软、C端受限苹果、企业端受限云厂商。巨头强者恒强，只有Google可能被挑战。

洞察五：中美差距在暗处拉大

表面benchmark追上了，但泛化能力、人才密度、GPU集群规模差距仍在扩大。OpenAI公开的可能只是三成功力。蒸馏和刷榜带来虚假的追赶感。

洞察六：Voice Agent可能是下一代交互革命

GPT-4O端到端声音模型开启了低延迟高智能的新交互范式。声音降低交互能耗，就像触屏催生短视频一样，Voice Agent可能孕育全新产品形态。

洞察七："先产品后模型"是应用创业的正确路径

Perplexity验证了先用最好的外部模型做PMF、再蒸馏小模型降成本、最终端到端优化的路径。产品心智 > 模型能力，在应用层面成立。

洞察八：Scaling Law仍是通往AGI的最简单路径

全球最顶尖的科学家和科技巨头都在巨量投入下一代模型，新架构都试过了没有发现真正work的替代。Transformer作为底座加上Data/Compute效率优化可能是未来方向。

洞察九：OpenAI的工业化组织能力是真正的壁垒

像好莱坞持续产出好电影一样，OpenAI持续做科研的成功率最高——很年轻的PhD一年就能产出Sora。给单位GPU的产出最高，整个infra、做事方式、定目标能力形成了系统性优势。

口述全球大模型这半年：Perplexity突然火爆和尚未爆发的AI应用生态

目录

一、节目定位与半年复盘

2024上半年的总体判断

核心共识

二、Perplexity：AI搜索的破局者

创始团队画像

关键人物

产品核心数据

关键决策与增长逻辑

三、Perplexity的资本游戏与融资历程

融资历程

2023年初 · A轮

2024年初 · 5亿美元估值轮

2024年中 · 10亿美元估值轮

2024年最新 · 30亿美元估值

个人投资人阵容

为什么个人投资人这么多

四、为什么是Perplexity跑出来了

三种创造性任务与模型能力匹配

"先产品后模型"的反直觉策略

Perplexity的路径

中国模型公司的路径

广密建议的应用创业路径

五、AI搜索与传统搜索的攻防

搜索市场的巨大空间

Perplexity的护城河

先发效应带来的用户心智

终局判断

中国版Perplexity的困境

Perplexity vs 月之暗面（Kimi）

Perplexity

月之暗面（Kimi）

六、硅谷AI创业公司全景扫描

估值梯队

硅谷投资的三大方向

七、海外大模型的资本扑克牌

巨头绑定格局

GPU决定生死线

2024年生死线

2025年生死线

Apple与Meta的悬念

八、AI应用为什么还没有大爆发

90%的原因：模型能力不够

10%的原因：时间问题

想要一个"幽默版ChatGPT"有多难

应用大爆发的关键条件

Scaling Law的两条线（延续前期判断）

九、高确定性与高赔率问题

高确定性关键词

成本下降

多模态改变交互

Voice Agent：下一代交互界面

端侧模型

远被低估的模型变小速度

高赔率问题

十、GPT-5：为什么来得这么慢

核心原因：GPU物理世界的建设问题

算力对比

GPT-5会长什么样

广密的预判

为什么GPT-4和GPT-5之间插了GPT-4O

Scaling Law是否遇到瓶颈

十一、大模型的商业模式与壁垒

商业模式的困境

传统广告平台

大模型订阅

未来商业模式的可能性

Agent颠覆广告平台

壁垒是什么

十二、中美差距：非共识的判断

差距拉大的核心论据

看不见的暗处

Benchmark的可信度

榜单已经被hack掉了

GPU差距

十三、硅谷科技巨头半年点评

巨头恒强，AI公司活在巨头阴影下

十四、通用机器人与无人驾驶

通用机器人