在EP.124(第一期创投观察)中,真格基金管理合伙人戴雨森预测2026年是"Year of R"(Return / Research / Recall),认为AI回报会落空,并在过年前清空了所有二级市场股票。半年后,他坦承部分观点"被打脸",但将此重新框定为投资方法论的核心。
戴雨森引用二级市场格言,将其应用于AI判断:你要有一个很强的观点,但不要被自己的观点绑架。关键是知道你的看法是怎么来的(一二三不同的原因),当这些原因发生变化时,真正的聪明人应该调整看法。他将播客的公开表达比作模型的强化学习——"你要得到一个反馈信号,高质量的反馈信号,而且很多时候是负反馈信号"。
戴雨森明确表示"世界本质上是个贝叶斯的世界,你前面发生的概率对后面事件判断就是有影响"。他看到Anthropic用量大涨后,自己频繁使用Claude Code,体感到这是一个深远变化,于是加回了一些仓位——存储、光模块、CPU等硬件瓶颈股。但坦言"受到了自己播客的影响",没有像朋友那样激进加仓。
戴雨森梳理了过去6-8个月"哪个模型最好"这个问题的答案如何快速轮转,揭示AI行业判断的高度不确定性。
OpenAI的DAU达8亿很快到10亿,宣布与Oracle合作股价跳涨几十个点。
Gemini 3发布,Google有TPU、最多算力、原生多模态模型,替代OpenAI成为"模型之王"。
Claude的Coding能力爆发,全民学Agentic Coding,Anthropic收入增长极快,二级市场市值超过OpenAI。
Codex新用户增速超过Claude Code,GPT 5.5表现出色,叙事又回到OpenAI。
| 时间尺度 | 判断 | 理由 |
|---|---|---|
| 短期(3个月) | Anthropic和OpenAI都被低估 | 目前二手股价约$9000亿,上市后市场情绪可能推至$2-3万亿;年底AR预期$1000亿,10x PS不算贵 |
| 中期(1-2年) | 可能被高估 | Return问题并未真正解决,只是被转移了 |
| 长期(10年) | 可能是$5-10万亿公司 | 如果赢家确立,长期价值巨大 |
戴雨森指出一个观察偏差:头部几家模型公司没有拉开真正大的差距,所以"谁最后发模型,谁就显得最厉害"——因为每个新模型都是一个较大提升。但如果用这个去过度推演,"可能也是会有些问题"。
戴雨森在2026年3月的硅谷之行后,对Anthropic产生了更深入的理解。他认为Anthropic的优势不仅在模型,更在于组织能力和组织形态。
这是一个被忽视的分析框架:AI行业在不同阶段需要不同的组织形态。探索期适合自下而上的发散型组织(OpenAI),执行期适合自上而下的对齐型组织(Anthropic)。关键变量是:如果一两年后下一个范式诞生,可能重新回到探索阶段——那时OpenAI的创新种子可能重新有价值。
戴雨森提出了本期最具结构性的认知转变之一:Coding不是一个垂直领域,而是一个水平层。
去年以前,很多人(包括资深研究员)把Coding和医疗、金融并列为"垂直领域"。但现在发现,Coding可以加强办公、加强医疗、加强研究的速度——它是一个水平的、跨领域的能力增强层。
戴雨森认为AI不同于互联网的渐进式发展,智力必须突破一定阈值才有价值:
戴雨森指出,"否则Claude 4.5就不会叫4.5,可能会叫5"——Anthropic自己对这个版本也没有那么大的期待。但从4到4.5再到4.6的过程中,没有范式变化、没有新模型架构,仅靠高质量Coding数据 + Agentic RL就带来了Coding体验的本质变化。
戴雨森对AI行业最具穿透力的分析框架是"投入-产出-结果"三步链条——他认为Return问题并未消失,只是被转移了。
Anthropic的收入大涨让很多人认为回报问题已解决。但戴雨森指出:Anthropic的收入不是最后的回报,它是客户的投入。掏了$100亿买Token的人,赚了多少钱?
戴雨森将AI Token消费比作一个水槽:上面有无数想吃螃蟹的人进来尝鲜,底部有人发现"螃蟹不好吃"离开。现在进来的人远多于离开的人,所以AR涨得很快。但最终要"把漏水堵住"——尝鲜者必须能赚到钱,且赚钱的周期不能太长。
戴雨森指出一个被忽视的风险:Meta等Hyperscaler已在举债建设数据中心,用资金杠杆放大投入。这意味着对回报的时间要求在变短——不像建GPU集群可以6年回本,Token烧掉是即时成本,"能不能过两年再赚回来"是个真问题。同时,三星海力士等硬件公司的利润已接近英伟达,传统CSP的利润已低于纯硬件厂商。
戴雨森对"AI带来降本增效"的叙事进行了犀利的解构。
戴雨森提出一个独特框架:一个组织里能承担的"锅"是有限的。AI可以多写十倍报告,但人还是要对报告驱动的行为负责(比如投资决策)。只要AI还不能端到端完成工作并承担责任,人的瓶颈就不会消除——"AI写了很多报告,但人还是要检查一下"。
戴雨森在本期访谈中最核心的概念重构是关于Harness——从一个被贬低的"套壳",到AI时代的操作系统层。
以前用一个产品像自己开车。现在构建的是一个F1赛事——车手是模型,它开得很好,但我们要搞一堆人给它保养换胎、控制在赛道里面。Harness(马具)的本意就是:怎样让一个非常强的东西在你规定的范围内运行。
| 层次 | 内容 | 典型代表 |
|---|---|---|
| 最底层 | 模型本身 | Claude、GPT、Kimi |
| Context层 | 实时Context + 组织专有信息 | Memory MD、Claude MD |
| 工具+循环层 | Agent Loop配置、可使用的工具 | Claude Code的Skill体系 |
| Runtime层 | Sandbox、持久化电脑 | E2B、Digital Ocean训练机 |
戴雨森巧妙地调和了杨植麟的"模型即产品"和自己的"壳变得更有价值":ChatGPT本身就是一个Harness(把InstructGPT包装成对话形式),没有这个Harness就没有AI革命。Cursor通过Harness获取数据做Post-Training训练出Composer模型——没有壳就没有独特模型。模型即产品可能没说错,但好产品(壳)是好模型的前提。
戴雨森逐一分析了当前主要Harness产品的创新点,揭示了每个产品如何引领了模型公司都没做到的体验创新。
| 产品 | 核心创新 | 意义 |
|---|---|---|
| Manus | Sandbox中的虚拟浏览器 + Wide Research(多Agent并行)+ Anthropic做Claude Code时借鉴了其经验 | 第一个在Sandbox中让AI访问网页执行操作的产品 |
| Claude Code | CLI形态——更便于AI操作而非人类GUI;Skill + Agent Loop配置体系 | Terminal是AI Native的交互形式 |
| OpenCrawl | 访问Mac所有文件/日历/信息 + Heartbeat MD(每30分钟检查待办)+ 单一对话流 + 插入IM(微信/Telegram) | 重新定义了记忆和产品分发 |
| Cursor | Composer模型(基于Kimi Post-Training + 自身高质量反馈数据) | 从Harness到模型的成功案例 |
戴雨森观察到一个关键现象:用户为了挽救小龙虾中的Memory(记忆)会不断修复它,但同时会为了降成本把Claude模型换成Kimi——"90分的表现,20分的价格"。这说明用户对Harness更有粘性,因为Context存在Harness层,模型是可替换的。
戴雨森提出了AI Agent发展的三阶段框架,将其比喻为"外星人来到人类世界"的适应过程。
三年前人类社会没有Agent,现在来了一些但不够多。Claude Code、Codex、OpenCrawl、Manus、Hermes全在做这件事——安装更简单、配置更容易、管理更方便。
人类的数字世界是为人类设计的——GUI、验证码、信用卡。AI原本是被阻止的对象(block bot),现在需要让好的bot平等使用人类系统。Stripe/Coinbase给AI发信用卡,Cloudflare让Agent平等注册服务,各种Computer Use和Sandbox让AI使用人类软件。
Agent的支付特点与人类完全不同(高频、小额、多对多)——不需要"卡"。Agent用CLI/API而非GUI。Agent之间通信不需要Excel表格,直接API传数据。微软的护城河(Office格式)可能被击穿。
戴雨森提出了一个他自称"暴论"但论证严密的判断:AI时代的革命性公司不会长得像字节跳动。
很多字节系创始人做的AI应用本质上是"AI信息流"——打开一个信息流,刷AI生成的小游戏、小组件、Challenge Board。这是把新技术包在字节最擅长的壳里。反例:OpenCrawl没有自己的App,连阵地都没有,但活在每个地方——微信、Telegram、Discord。
戴雨森总结了历史上大公司创业者在大厂"看得到但做不了"的缝隙中成长的五种理由:太小众(Airbnb、B站)、太low(内涵段子、拼多多)、太累(美团)、太不合规(比特币、滴滴)、太超前(OpenAI、SpaceX)。现在AI时代同样存在:Harness去年还被说"套壳没用"(太low),OpenCrawl安全性差(太不合规),开源没收入(没商业模式)——但这些恰恰是机会。
戴雨森提出了一个他认为"可能出现"的全新商业模式:Agent之间的网络效应和交易市场。
六个月前,你的Agent和我的Agent跑的都是Opus,没有理由互相雇佣。但现在,每个人的Agent在Harness中沉淀了不同的Context——Skills、讨论过的100个BP、准备过的采访问题。同一个任务给不同人的Agent做会得到不同结果。
过去AI一直被认为缺乏网络效应(ChatGPT没有数据飞轮,因为人类聊天数据很难让模型变更聪明)。但Agent时代的网络效应可能来自Agent之间的差异化和价值交换——每个Agent因为积累了不同的Context而具有不同的能力价值,形成交易需求。这本质上是"AI的电商"。
戴雨森强调真格"一直是投人"——不是因为看好某个方向去找创业者,而是跟踪优秀个体多年,等他们创业时成为第一轮投资人。
变化快、机会多的时候,最怕为了稳妥去跟风。"缺钱可以融资,创新失败可以再来,但事情一上来就不创新,在AI时候很危险。"
硅谷习惯做Vertical SaaS,但技术早期做太垂直容易困住自己。Manus一开始做通用Agent,后来衍生出PPT、网站、数据分析。"技术发展早期,Horizontal能让新浪潮的变化对你有用。"
戴雨森3月在硅谷的考察总结出三个过去6个月最火的方向。
| # | 方向 | 核心逻辑 | 代表 |
|---|---|---|---|
| 1 | Coding | 大跃进式烧Token——Meta有Leaderboard比谁烧得多;有浪费但也有创新被发现 | Claude Code、Codex、Cursor |
| 2 | 世界模型 | 将语言模型的Scaling Law平移到机器人——通过Ego-Centric视频数据或遥操数据训练,实现Zero-Shot泛化 | 刘松敏(RDT)、丁宁(Simple VLA)、Journalist |
| 3 | Auto Research | AI自我迭代、AI训练AI——递归式自我改进 | Cursive(铁面动) |
戴雨森在访谈最后提出了一个深层的人文反思。
人的体力变得不重要 → 脑力变重要 → 开始"读书改变命运",重视教育。
知识可以搜到 → 知识和能力分开 → "动手能力"(写代码等执行力)变重要。
执行力被AI替代 → 执行力和判断力分开 → 判断力(做什么)和Agency变得关键。
核心问题:AI非常擅长Within Distribution(人类已有代码中的任务),但对Out of Distribution(原创性创新)还是开放问题。"AI没法讲一个原创的笑话,它只能把人类已经讲过的笑话Rephrase。"
戴雨森两年前在播客中说"人类剩下Agency和Taste"。但他现在修正了这个判断:AI做的PPT已经很好看,Taste可能也不靠谱。目前人类真正的阵地可能只剩Agency——"不管它做得多好,要做什么还是你跟它讲的"。但连这个也面临挑战——Proactive Agent正在让Agent主动提出建议。
| 判断/数据 | 具体内容 |
|---|---|
| 二级市场偶像 | Stanley Druckenmiller(索罗斯的操盘手),交易型而非基本面投资 |
| Anthropic/OpenAI估值 | 二手股价各约$9000亿,预计上市后可能冲到$2-3万亿 |
| Anthropic年底AR预期 | $1000亿(每月$100亿Token销售) |
| AI硬件年投入 | $7000亿(2026年) |
| 三星海力士利润 | 已接近英伟达水平,工人年奖金数百万 |
| 硅谷大公司裁员 | 约15%(本来就有冗余),进一步裁员"没有那么简单" |
| New Labs数量 | 60+家(硅谷) |
| 真格2025年投资 | 看100+项目,投2个 |
| 真格2026年投资 | 截至5月投3个,节奏稍快 |
| 被投世界模型公司 | 刘松敏(00后,RDT系列)、丁宁(97年,Simple VLA系列),投资时估值约2亿人民币,现几十亿 |
| 被投机器人零件 | 5G(灵巧手)、方舟机械臂 |
| Cloud Code vs Codex | 5月中旬差距已不大,Codex成本便宜约50%,品牌+习惯锁定重要 |
| Perplexity AR | $4亿+ |
| Devin AR | $4亿+ |
| 戴雨森个人Token消耗 | 有朋友月烧数千至上万美金 |
| Cursor被收购 | "是xAI很想买它",但Composer模型让Cursor变得更有价值 |
| 对AI可穿戴硬件 | 基本没投,持谨慎看法 |
| 对AI 2C娱乐 | "暴论"——不一定是好的投资方向 |
戴雨森的"投入-产出-结果"三步链框架可能是当前对AI商业化最清醒的分析。Anthropic年底$1000亿AR意味着每月有$100亿的Token被消费——但消费者赚到了多少钱?当Hyperscaler开始举债建数据中心时,回报的时间压力不是在延长而是在缩短。这个问题的答案将决定2027年AI行业是继续狂飙还是迎来调整。
如果Harness真的演化为AI时代的操作系统层,其商业含义是深远的:(1)模型变成可替换的"CPU",品牌和用户锁定在Harness层;(2)应用开发者基于Harness而非直接面对模型开发;(3)Context和Memory成为核心资产,而非模型参数。这与"模型吞噬一切"的叙事形成有趣张力。
AI确实在快速提升编程生产力,但这并不等于企业收入增长。戴雨森指出了一个被广泛忽略的事实:AI毁灭旧价值的速度远高于创造新价值的速度。编程能力的民主化反而导致了硅谷的内卷——Lovable做PPT、Gamma做网站。创造新需求(OOD的创新)仍是人类的瓶颈。
ChatGPT时代AI缺乏网络效应(聊天数据不能让模型变更聪明),但Agent时代可能出现新型网络效应:每个Agent因积累不同的Proprietary Context而具有差异化价值,形成Agent之间的交易和雇佣市场。如果这个推演成立,最有价值的AI公司可能不是模型公司,而是Agent Marketplace的运营者。
戴雨森的蒸汽机-纺织-染料-化工类比揭示了一个重要规律:新工作不在技术的直接替代领域产生,而在其扩散后创造的全新需求中涌现。AI正在经历"新技术解决老问题"(用AI写代码/翻译/画图)的第一阶段。真正的Agent Native机会——就像搜索引擎、社交网络、推荐引擎之于移动互联网——需要AI渗透率达到一定程度后才会浮现。
戴雨森将"频繁被打脸"重新定义为正向信号:(1)说明你在获得反馈信号;(2)说明行业在快速变化,有机会;(3)说明你敢于做判断而非永远不说。这本质上是一种反脆弱的思维方式——通过公开表达暴露自己的判断于市场检验,利用负反馈信号持续修正。"如果一个人总是不被打脸,大概也不是因为他总是正确,而是因为他没有进步。"