广密在本期季报中提出了过去半年他最强烈的认知变化——所有大模型产品的终极叙事殊途同归,收敛到同一个目标:下一个Google。
广密强调,"下一个Google"不是搜索引擎本身,而是重新组织信息的引擎。过去门户组织了信息,搜索引擎重新组织了网页,推荐引擎又重新组织了内容。未来重新组织token背后的本质是智能,代表的是任务和生产力。这是一张明牌——比拼综合能力:资金、GPU、人才、产品、品牌。
广密建议"来硅谷一定要去逛计算机历史博物馆",这能帮助理解计算架构和信息分发的主线演变。
人工编辑listing,最小单元是网页。门户模式只能listing头部网页,覆盖非常有限。
Index了整个互联网网页,用关键词搜索重新组织信息分发。红杉美国最早投雅虎,后来投Google——Michael Moritz当时希望Google能帮雅虎更好覆盖长尾网页内容。
根据用户行为做投票,AI更主动地推荐。最小单元从网页变成了内容。字节也一直在"超越Google的路上"。
融合了社区、信息流推荐、短视频、图文多模态,同时又是"最高质量的搜索引擎"——融合了搜索、推荐、问答。
最小单元比网页更小——Token。Token背后是人类几千年抽象的智能。未来会以Agent或做任务的形态输出,成为一个任务引擎。
广密特别强调:做门户的人当时都觉得Google这种关键词搜索"做不大的",但Google恰恰从雅虎的边缘市场做起来了。"一定要重视边缘市场——往往伟大公司都是从边缘市场做大了做起来的。"
广密提出AI产品的终极形态是任务引擎(Task Engine)或任务容器——完成Task Automation。
以前大家叫"内容容器"——头条是内容容器,微信也是内容容器,它们也都是浏览器。未来AI最大的是做任务——完成有经济价值的Task。以前生成最大的是内容,未来AI生成最大的是任务、Agent、Workflow。
| 级别 | 名称 | 描述 | 广密判断 |
|---|---|---|---|
| L1 | 聊天机器人 | 用自然语言对话的AI | 当前主流形态 |
| L2 | 推理者 | 解决人类级别智力问题(O1) | 今天处在二到三之间 |
| L3 | Agent智能主体 | 代表用户采取行动 | |
| L4 | 创新者 | - | - |
| L5 | 组织者 | 重写底层操作系统 | "架构逻辑复杂度非常非常高" |
广密判断:短期干到CEO层面比较难,但"两年左右的时间,干到一个Manager这个水平是有机会的"。长距离多步推理任务如果能落地,会超过90%的Manager。Agent在组织中"肯定还需要人配合,但能完成的任务数量会大幅提升"。
广密从投资视角算了一笔账,揭示了ChatGPT商业变现效率的核心问题。
广密提出:电商时代最核心指标是GMV和订单转化率,AI时代最关键的北极星指标可能是任务完成率(Task Completion Rate)。"你本质上要完成有经济价值的任务,只要价值足够厚了,肯定会有全新的商业模式出现——按照value-based的pricing。"
| 产品 | DAU/MAU | 月使用天数 |
|---|---|---|
| 微信 | ~100% | ~30天 |
| 抖音 | ~70%+ | ~20+天 |
| 小红书 | ~70%+ | ~20+天 |
| Google搜索 | ~50-60% | ~15-20天 |
| ChatGPT | ~15-20% | ~6天 |
广密指出ChatGPT 12个月留存可能有50%("跟Notion差不多"),留存很好,但使用频次和粘性还远不如Google和抖音——"说明它承载的需求和挖掘的空间是非常大的"。
广密在本期提出了一条新的暗线——继之前的Reasoning和Cost之后,这条暗线是Context。
红杉中国投电商时有一个精辟认知:电商两翼是物流和支付。没有这两个基础设施,网购体验很差,买东西成功率极低。AI模型帮你做任务,任务成功率的高低不完全取决于模型的生成或Coding能力,更取决于Context是否充分同步了。Context就是新时代的支付。
广密认为这"都是同一场仗"——所谓下一个Google,有可能是任务引擎,也有可能是助理形态,本质一样。
当被问到"如果AI的生成能力增强了,未来会生成的是什么"时,广密给出了一个判断:新时代的软件。
广密提出一个值得深思的问题:如果2025年AI Coding能力变强5倍、10倍、30倍,软件开发效率提升10倍,软件生产成本大幅降低——会有哪些机会?"推荐引擎造就了信息流这个产品,Coding未来会造就什么?"他认为需要一个天才来定义这个新的产品形态——就像当年字节定义出信息流。
| 维度 | 趋势 | 具体分析 |
|---|---|---|
| C端品牌/心智 | 放大 | ChatGPT领先第二名可能十倍甚至更多,明年可能十几亿MAU |
| 预训练模型 | 缩小 | 公开互联网文本数据20-30T可能就是极限,收益空间在变小 |
| 创新工业体系 | 放大 | "像好莱坞工业化拍电影——即便告诉你怎么拍的,也不一定能复现" |
| 搜索能力 | 错失 | 给Perplexity留了完整两年窗口,"非常不应该" |
| Coding能力 | 被反超 | 被Claude Sonnet反超,大量开发者迁移到Claude Sonnet生态 |
广密认为今天AI产品都是Post-train环节决定的。有可能未来的"超级产品经理"是从做Post-train的人里面出来的——因为Post-train决定了模型各方面的性格和偏好。"在这个基础上,需要对交互理解更深的人——什么交互效率会更高。"
广密指出O1路线最核心的瓶颈是Reward Model的泛化。"整个地球上也没有一个Reward Model能衡量所有人。"限定领域的Reward比较好定义(自动驾驶、Coding、数学、量化),但通用泛化需要科学突破。如果只能各行业垂直构建Reward Model,"那你得雇很多人设计任务、设计Reward——像老师出题一样,scale速度就比较慢了。"
广密做了一个尖锐的类比:如果商业模式和产品形态问题不解决,今天的AI"有点偏向SP移动梦网的时代——还没有看到iPhone"。更值得警惕的是:SP时代移动梦网的那些公司,在走向移动互联网时没有一家转型成为大公司。"不管头条、美团、拼多多——移动互联网公司没有从上一波留下来的。"
用户数据更多代表偏好数据(preference),而非能力数据(capability)。偏好数据能提升MAU和用户时长,但对AGI"可能没那么好,没有啥帮助"。搜索和推荐是整个人类在大规模投票——那是偏好级能力。但ChatGPT如果把用户偏好数据用太多,"答案会趋向一致,丧失多样性——本来可能一万种答案,投票投多了可能就两百种"。
| 产品/场景 | 数据类型 | 价值判断 |
|---|---|---|
| AI搜索(Perplexity) | 持续性研究话题 + 追问 + COT数据 | 高价值 |
| Notion等笔记软件 | 反复思考得出的知识结论 | 数据资产价值很高 |
| Artifacts/Canvas | 做任务过程中的拖拽和思考过程 | 记录思考过程的高价值数据 |
| 浏览器点击数据 | 用户行为和操作逻辑 | 操作性数据非常重要(但Chrome有合规问题) |
| Slack/微信工作讨论 | 讨论过程的COT数据 | "模型记录不了的,有价值的能力数据" |
| FSD/自动驾驶 | 闭环reward model数据 | 非常典型的端到端好模型 |
广密描绘了一个理想状态:"有个天才的产品经理设计了某个形态,把人类思考的过程——这种高价值数据——都传递给模型。"未来一个形态是:这边是模型,那边是个人软件——"你怎么把个人软件的数据给hack出来,作为Context自动放到模型里面,帮你完成任务。"
| 公司 | 核心优势 | 核心风险/问题 |
|---|---|---|
| 端到端Full Stack垂直整合,TPU代表无限算力,Android/Chrome最强分发 | 组织问题、CEO"比较面"、Chatbot形态转型难 | |
| OpenAI | 品牌壁垒最强、综合能力客观第一、创新工业体系 | 组织问题不比Google小、商业模式未定、与微软同床异梦 |
| Anthropic | 人才最牛的AI Lab、占住Coding和协议、管理层稳定 | C端比较弱、管理层太科学家 |
| Meta | 站稳开源生态、AI应用端充分受益 | Llama4待验证 |
| Amazon/AWS | 全球最好的云厂商、与Anthropic合作健康、自研芯片(Trainium) | - |
| 微软 | 销售和绑定能力极强、最后总能追回来(Teams/Octa) | "做产品一直很拉垮"、Copilot未达预期、让Cursor/Devin溜走 |
| Apple | 握着最好的牌、Siri位置特别好 | "还不知道怎么打" |
| xAI | 数据中心建设最快、马斯克资源 | 超大集群是否带来质变未知、"有点BTC化——算账就输了" |
OpenAI、Anthropic、Google——模型格局挺难改变。"谁今天还会再出来进到第一梯队?微软自己、Amazon自己都不容易。"
xAI、Meta(Llama)——字节"有可能"进入。
融合搜索、推荐、问答、Coding、做任务,可以更加主动和被动。不管是信息分发还是超级助理——确定性最高,是明牌竞争。
核心是互动性——形成新的内容消费和娱乐平台。可能从视频生成或其他路径切入,但"今天还高估了生成环节的重要性"。
全球最强两个Lab的CEO(Anthropic CEO Dario、DeepMind CEO Demis)都特别看好。Demis个人专注在制药公司。硅谷已有不少AI材料设计等新苗头。
广密的核心洞察在于:不要把各家AI公司看成在做不同的事——ChatGPT做聊天、Perplexity做搜索、Cursor做Coding——它们本质上都在争夺同一个位置:重新组织人类智能和任务的新型引擎。这个框架帮助投资人和从业者跳出产品形态的表象,看到底层竞争的本质。从门户到搜索到推荐到任务引擎,信息分发的主线从未改变,只是最小单元从网页变为内容再变为Token。
99%的从业者盯着模型生成能力和Coding能力,但广密认为Context才是决定任务成功率的关键。这解释了为什么ChatGPT虽然模型强大但使用频次(DAU/MAU仅15-20%)远不如Google——因为缺少持续的上下文同步。将Context比作"新时代的支付"是一个精准的类比:没有支付,电商再好也无法完成交易;没有Context,模型再聪明也无法完成复杂任务。MCP协议的意义正在于此。
每MAU仅0.5-0.6美金的变现效率,比传统互联网产品低10-20倍,同时后端CapEx每年5-10倍增长——这个剪刀差是不可持续的。Chatbot的Query结构(以知识问答为主而非导航类)决定了广告模式走不通。"按任务付费"(value-based pricing)可能是出路,但前提是任务完成率要足够高。在iPhone时刻到来之前,AI行业可能真的处于"SP移动梦网时代"——历史表明,那个时代的公司没有一家活到下一个时代。
这个区分解释了一个长期困惑:为什么ChatGPT有海量用户数据但数据飞轮一直转不起来?答案是:用户数据是偏好数据(preference),不是能力数据(capability)。偏好数据让产品更好用,但不让模型更聪明——就像给自动驾驶灌普通司机数据只会变差。真正有价值的能力数据在Notion笔记、Slack讨论、浏览器操作等场景中,但这些数据要么有隐私问题(Chrome数据),要么产品形态不对(Notion不是AI产品)。
在所有人关注C端的ChatGPT和搜索端的Perplexity时,Anthropic悄悄占住了Coding(Claude Sonnet)和协议(MCP)。"得Coding,得开发者,得API消耗,有机会得生态,做OS"——这条逻辑链完整且自洽。历史上微软的主线一直是OS,Cloud成为AI时代的OS厂商是一个合理的展望。而且Anthropic与Amazon的合作关系"比微软和OpenAI更健康",这是一个被忽视的结构性优势。
广密把O1/Reasoning路线定性为"走向AGI的必经之路",但天花板未知。他用了一个精妙的思想实验:70亿人忙碌一年产生的增量知识,是否多于老祖先几千年的积累?如果是,合成数据就成立,算力可以换数据;如果不是,O1很快到天花板。他自己"相信70亿人产生的知识还是多的"。但Reward Model的泛化仍然是核心瓶颈——"最top的researcher也还没想到怎么泛化Reward Model的方法"。
广密坦承自己的认知也在变化:"之前每期播客我都觉得智能和模型最重要,其他都不重要。但今天看未来两年,AI应用端的落地、Agent的落地是非常重要的。"原因是:最领先的三四家模型"可能在模型层面拉不开绝对差异了"。当模型趋同,竞争转向产品、Context、商业模式——谁能定义出信息流级别的新产品形态,谁就是这个时代的张一鸣。2024年的关键词是"Coding Coding Coding",2025年的关键词是"Agent Agent Agent"。