深度研究 — #81 和<a href="https://en.wikipedia.org/wiki/Kai-Fu_Lee" target="_blank" rel="noopener" style="color:#667eea;text-decoration:none;border-bottom:1px dashed #667eea;">李开复</a>聊聊：如果美国形成AGI霸权，我们应该怎么办？

← 返回张小珺主页

🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

Hinton、诺贝尔奖与AI起源记忆
从CMU到零一万物：40年AI路径
创业决策：为什么必须亲自做CEO
推理成本：垂直整合的方法论
三层内存架构与推理引擎优化
AI First产品哲学
模型一体：让模型专家做产品负责人
AGI垄断者的终极威胁
中国的第二条道路：生态抵抗
AI生态倒三角与应用引爆逻辑
国内外双线作战：ToB与数字人
超级应用与委托式交互的未来
硅谷巨头卡位战：逐家点评
预训练的灵魂拷问与经济账
关键数据汇总
启示与延伸思考

一、Hinton、诺贝尔奖与AI起源记忆

访谈以2024年诺贝尔物理学奖颁给Geoffrey Hinton为切入点。李开复在CMU读博期间，Hinton是他的指导老师。

李开复

我觉得他是机器学习的超级专家。当时我用了贝叶斯的分类来做了一个黑白棋的game tree。不过我觉得跟他讲话，他完全没有在听我讲话。我觉得他的眼中——你这做的不就是个工程事情吗？我们要做伟大的事情的。然后他想都没有想，就帮我签字了。

Hinton的历史贡献与被忽视的洞察

Hinton的三重功劳

理论突破：Boltzmann Machine等深度学习基础理论
坚持30年：从CMU到多伦多大学，paper不断被拒仍坚持——与杨立昆一起经历"不被看好"的30年
识别GPU价值：作为数学家，很快认识到GPU对机器学习的价值——他的一个学生到微软邓力实验室，教会微软怎么用GPU做深度学习

李开复在CMU的早期AI工作

1987-1988年

用机器学习（贝叶斯+博弈树）打败世界冠军的黑白棋系统。

同期

做了第一套非指定语者的语音识别系统——之前语音识别只针对特定人训练。

博士论文期间

选择了隐马尔可夫模型而非Hinton的神经网络——当时觉得神经网络"不一定work"，因为只有三层，没有GPU，计算量太大。

一次错过的投资

李开复透露曾给Hinton的一个项目Level Six出过term sheet，但被百度抢先。这不是Hinton与Ilya Sutskever卖给Google的那笔著名交易，而是"一个比较小的项目"。Hinton当时"非常热情，请我们吃了饭，非常希望我们能够投资"。

二、从CMU到零一万物：40年AI路径

李开复认为自己的每一段职业经历都是为创办零一万物做的"预科"。

早期学术

在CMU做AI研究，选择机器学习方向，了解数据的重要性。

Apple、微软、Google

参与多家科技巨头的软件开发，经历PC时代和移动互联网时代。

创新工场

学会投资与商业模式，看到AI 1.0时代的各种挑战和机遇。

2023年5月

创立零一万物。被王慧文和杨植麟的创业"点醒"——原来可以这样做。

李开复

如果说20年后，当我80岁了，回头有过一个后悔的话，那这个后悔一定是我选择不去做他带来的后悔，而不是说他我试着去做，即便做失败了，我也不会后悔。

三、创业决策：为什么必须亲自做CEO

李开复最初考虑过两个选项：做董事长找CEO，或自己做CEO。最终选择后者。

选项A：做董事长

更符合外界预期
找三四十岁行业知名人士做CEO
认可的几个CEO都无法加入

选项B：自己做CEO（最终选择）

有兴趣的人"不认为会比我自己做得更好"
40年管理经验和AI领域人脉
"有史以来时间最短、最紧迫的猎头"

2023-2024年最重要的决策

三个关键选择

混合专家模型（MoE）：非常早启动探索，义无反顾走这个路径——高能力、快速、低成本
应用端引爆认知：整个行业的引爆一定在应用端，应用端需要非常便宜的推理
多模态执着：尚未验证，但坚定认为这个技术重要、应用会出来

创业团队的核心作用

李开复认为自己在零一万物起的最大作用是"做一个有史以来时间最短、最紧迫的猎头"——把一批特别棒的人说服到一个上升的火箭里。这与他此前组建微软亚洲研究院、Google中国、创新工场的经验一脉相承。

四、推理成本：垂直整合的方法论

李开复提出了零一万物的核心差异化：更廉价的模型和推理引擎。这不是等待行业自然降价，而是主动用垂直整合加速。

核心理念

为什么不能"躺平等降价"

推理成本自然下降约每年10倍，但这不够。原因在于应用难度是递增的：chatbot可以容忍慢慢吐字，搜索需要更快，视频类应用一天可能刷三五个小时——使用强度、模型难度、用户规模三者相乘，自然降价追不上需求增长。

李开复

垂直整合才是正确的方法。比如说iPhone就是一个垂直整合。乔布斯没有说，我等这个capacitive screen变得行业标准吧，我来等这个multi touch变成行业标准吧……他是一次把它全部揉了起来。因为你要等的话，可能就等个5到7年了，那iPhone的时刻就错过了。

与AGI路线的DNA差异

大厂打法 vs 零一打法

大厂：用5000-10000张GPU吸引博士，给资源做"畅想的事情"，再尝试缩小放入产品——"就像设计最豪华的厨房，然后塞进你家几平米"
零一：从一开始就以廉价推理为目标，训练适配推理引擎的模型——"加入的都是跟我们思维方式一致的、DNA一致的"

$10

GPT-4发布时每百万token价格

$0.14

零一5个月后同等能力价格

~70x

5个月内的价格降幅

五、三层内存架构与推理引擎优化

李开复详细描述了零一万物的推理优化方法论——核心思路是用内存换GPU计算。

技术架构

三层缓存体系

层级	存储类型	容量级别	用途
第一层	GPU旁HBM（High Bandwidth Memory）	~200GB	最常用数据，最快访问
第二层	CPU RAM	~10TB	次常用数据
第三层	SSD	~50TB	可预调度数据

这三层内存加起来的成本不到GPU的十分之一。多花10%的钱买内存，可以降40-50%的GPU运算。

三层内存架构：成本 vs 速度权衡

垂直整合的四层联动

硬件理解：三层cache的运算特性
推理引擎：为三层内存量身定做，处理任意模型
模型设计：训练适配推理引擎的模型——"你不要训练那么大的模型好不好，训练小一点"，正好放满机器
应用对接：fine tune到具体场景（搜索、社交等）

核心团队的几个人"坐在一起一起工作"，从AI科研到硬件到推理引擎到模型设计，是一体化优化出来的。

六、AI First产品哲学

李开复提出了严格的"AI First"定义：如果把gen AI拿掉，这个产品就没有存在的必要。

AI First的例子

类比：滴滴、美团——如果去掉移动端就不成立
搜索：打一个搜索词，直接出答案，不要点来点去
主要用自然语言交流，触屏为辅

不是AI First的例子

四大门户——有APP也有网页，内容差不多
Microsoft Office Copilot——打开还是blank document
Google Search Overview——"四不像"，既有overview又有链接又有广告

李开复

未来人应该大部分时候不需要自己写东西了，应该就是让AI写，写了人来指导他一下，最后可能修改几个字。你打开一个blank document就不是未来应有的应用。

历史规律：AI First将重演Mobile First

回看移动互联网，最大受益者都是mobile first（抖音、快手、美团、滴滴），四大门户经过洗礼"价值只有下降没有上升"。同理，AI时代真正崛起的一定是AI first产品。大厂转型的核心挑战在于商业模式——过去的商业模式是否能延续到AI first里面，不能延续的就会有很多挑战。

七、模型一体：让模型专家做产品负责人

零一万物提出了"模型一体"的产品方法论：一个AI first应用的好坏，80%看模型，20%是其他。因此需要让懂模型的人做产品负责人。

逻辑来源：Google的PM选拔

Marissa Mayer的规矩

Google PM必须是计算机专业出身
理由：让懂技术的人学PM/市场/用户，远比让MBA学计算机容易
斯坦福一年200个CS本硕来申请，里面总有10个适合做PM

零一万物是这个理念的延伸：懂模型的200人里，总有10个可以做产品。

反面案例：Character.AI

模型与应用的撕裂

创始人Noam一心做AGI，模型和产品都做得不错
但AGI路线的模型对Character场景是"杀鸡用牛刀"
最终分裂：想做AGI的人回Google，想做app的人留下
李开复与Character投资人的对话："你这个方法就是可以做成的——做app的方法。"

李开复

如果你要做AGI的话，你就是有一种理想和傲慢两者共存——就是我做成了AGI，我就碾压所有的竞争对手了。上面就未必有什么生态系统了，每一个app就是薄薄的一层壳，我们英文叫veneer（贴皮）。

八、AGI垄断者的终极威胁

李开复提出了本次访谈最核心的判断：第一个做出碾压式AGI的公司，将成为人类历史上最大的垄断者。

核心论点

AGI垄断 vs 历史上的垄断

过去微软不能让Windows消灭Mac、走进手机——因为Windows只是操作系统。但AGI是一个大脑，它有独立思考和发明创造能力。一旦做成，AGI可以帮垄断者设计商业模式打倒竞争对手、设计公关策略、甚至发起网络攻击。过去的微软垄断、Google垄断，与此相比"大得多得多"。

李开复

第一个做出AGI碾压对手的，当然是一个技术的理想，但是他也是一个商业霸权垄断者，而且会成为一个终极垄断者。

AGI的自我强化循环

从GPT-6到终极垄断

GPT-5/6具备创造发明能力和独立思考能力
AGI可以被指令"帮我维护垄断、帮我得到更大商业利益"
过去任何商人都梦想这样的霸权，但技术从未允许——AGI第一次让这成为可能
"有史以来所有的商人都梦想自己有这么大的一个霸权"

AGI垄断的自我强化飞轮

九、中国的第二条道路：生态抵抗

面对AGI霸权的可能性，李开复提出了中国的替代路径——不追求第一个做出碾压式AGI，而是用生态护城河抵抗。

战略框架

生态抵抗路线图

短期：推理成本每年降10倍，零一等中国公司努力降到20-50倍
中期：廉价推理点燃应用——搜索、社交、娱乐、电商如"雨后春笋冒出来"
应用建立护城河：靠品牌、用户数据、social graph——就像微信、抖音很难被打倒
长期：到AGI真正到来时（假设7年后），中国已有强大的社交应用、搜索、agent、硬件
终局：AGI垄断者想碾压，"我们至少还有抵抗的余地——用生态去抵抗"

李开复

到了那天OpenAI一统天下的时候，我们已经有了一个很强的社交应用、很强的搜索、很强的agent、很强的硬件。他想要来碾压我们，我们至少还有抵抗的余地。我们是用生态去抵抗。

为什么中国APP会做得比美国好

两次历史验证

AI Super Powers书中的核心论点：美国领先发明时刻，中国在执行时刻赶超甚至超过
移动互联网：美国发明，但中国APP强过美国
AI 1.0：深度学习和CNN美国发明，但中国应用和独角兽不逊于美国
当前：谁发明4O？美国。谁发明O1？美国。但"他发明一个，我们就能够赶超一个"——落后约5个月

AGI时间线判断

李开复认为AGI约7年后（~2030年）实现，引用APIC AI智库的分析。从GPT-2到GPT-4（幼儿园到高中生）花了4年，从GPT-4到AGI（高中生到天才）需要7年——存在diminishing return。关键瓶颈：数据增长、GPU/HBM生产力、传输瓶颈、电力。"三年达到AGI的预测可能是过度乐观了。"

十、AI生态倒三角与应用引爆逻辑

李开复指出当前AI生态的资金分配是一个病态的倒三角，与历史上每一次成功的技术生态完全相反。

AI生态资金分配：倒三角 vs 健康生态

健康生态（PC/互联网/移动/云）

芯片赚最少
平台赚蛮多
应用赚最多（所有应用 > 平台）
正向循环：用户付钱 -> APP进步 -> 平台有要求 -> 芯片进步

当前AI生态（倒三角）

GPU芯片：750亿美金
云厂商：100亿美金
应用（ChatGPT等）：50亿美金
应用无法像"雨后春笋"冒出来

垄断者不急于降推理成本

李开复指出一个反直觉的逻辑：如果推理成本由一个垄断者控制，"他未必会很急于推理成本降下来，因为他未必想很多应用冒出来"。这正是中国公司主动降低推理成本的战略意义——不是为了价格战，而是为了点燃应用生态。

TCPMF：比传统PMF更难的新框架

Technology-Cost-Product-Market Fit

传统PMF：产品与市场的匹配
TCPMF增加两个维度：需要多强的技术（多模态/视频/推理/O1能力？）和多低的成本
创业者需要预测技术何时成熟、成本何时够低，在点燃时刻精准引爆
"难度比以前应该是加倍了"

十一、国内外双线作战：ToB与数字人

为什么ToC先走海外

国内ToC的两个挑战

缺少ChatGPT Moment：中国错失了"天时地利人和"的全民教育时刻，用户教育成本高
流量太贵：友商烧的钱"总是烧不过大厂"，融资来的钱来之不易

海外ToC策略：先用GPT-4做产品磨练团队，再切换自有模型。已有约500-600万美元年收入。

国内ToB：数字人直播

商业模式

Service as Software

硅谷新共识：从SaaS（Software as Service）到SaaS（Service as Software）——用软件提供"数字员工"，按人头收费。零一万物选择了数字人电商直播作为切入点。

数字人直播的具体场景

连锁速食店的痛点

新店店长已经很忙，还被要求在线上直播
店长一天只能花1小时直播，数字人可以做8小时
店长只能做1个渠道（如美团），数字人可以同时做4-5个渠道
按一个钮，10分钟上线——完整解决方案
硬性商业指标：比如一天GMV多收5000块钱

李开复

就是先帮你赚钱，再给你收钱。然后是完整的解决方案，而不是说我有个技术你想用在哪里。

十二、超级应用与委托式交互的未来

李开复描绘了AI应用发展的三个阶段和一个终极形态。

第一阶段：重写

每一个移动互联网应用都会被颠覆重写一次。"投中了那个重写者，你就赢了。"Perplexity重写了Google搜索。

第二阶段：前所未有的应用

类似移动互联网时代的抖音、滴滴、美团——AI first的原生应用。

第三阶段：超级应用

一个智能助手成为所有服务的入口——截胡所有外部应用。

未来交互

从图形界面到委托式界面

用户界面将经历三次跃迁：图形界面 -> 语言界面 -> 委托式界面。当智能助手"比我聪明、比我能干、比我博学，还比我更懂我自己"，用户会自然地把一切委托给它。关键技术门槛：将当前四五十秒的交互流程降至一秒钟——需要always on、always listening的硬件（眼镜或耳机）。

超级应用对现有生态的颠覆

如果智能助手成为入口，电商变成"被动竞价的仓库"——用户不再把电商当入口，而是通过助手接触。这与今日头条成为内容载体的逻辑一致。"所以以后可能App Store也不存在了，你还要应用干什么？你的助手就一切帮你做了。"

十三、硅谷巨头卡位战：逐家点评

李开复刚从硅谷回来，逐一点评了主要科技巨头。

公司	定位	优势	挑战/风险
英伟达	最大获利者	GPU霸主地位	当GPU从训练转向推理时，优势能否持续？
OpenAI	特别强大的垄断型公司	还藏了很多好东西没放出来，战略性决定何时释放技术	Sam Altman是"有史以来最大的垄断者"——目前是陈述事实而非贬义
微软	位置最好，可攻可守	靠AI赚钱+持有OpenAI股份	自己的模型一直没做好；与OpenAI的蜜月期会结束
Meta	最大的搅局者	"打不过人家就开源"——已两次成功（PyTorch vs TensorFlow, Llama）	技术是落后的；Mark对AI是否很懂存疑
xAI	执行力非常强	管公司"跟中国公司一样"；小将非常能干	目前成就基本是复刻OpenAI和Google早期技术
Google	比较伤感	技术累积最强——最厉害的大模型论文和强化学习都出自此	搜索四面受敌；Gemini各种限制；商业搜索流失到Amazon
Perplexity	做对了产品心态	Citation模式部分化解了信任问题（虽然幻觉率仍高）	Google分分钟可以做一个，但基于商业考量不能做

OpenAI的牌局策略

战略性释放技术

GPT-5训练不太顺利，但为了融资"丢了一个O1出来"
手中还有很多牌——不急着出，每出一张牌全球公司就会去猜去做
想留到AGI有望的时候再有信心地打出
李开复判断OpenAI与Google的距离"不是Google在拉近，而是可能越来越远"

Google搜索的三难困境

大模型放不放进搜索？

选项一：完全取代搜索——所有广告业务拆没了，公司可以关门
选项二：做两个入口——掩耳盗铃
选项三（当前选择）：两者并存——overview+搜索结果+广告="四不像"

十四、预训练的灵魂拷问与经济账

面对开源模型（如Llama 405B）的挑战，李开复提出了预训练的两个决策标准。

标准一：打不打得过开源？

如果自己预训练的模型不比开源模型好，明智的做法就是不做
零一万物"有绝对的信心"——小模型在评比中胜过Llama 405B
而Llama 405B推理成本是零一的约20倍

标准二：经济账算不算得过来？

训练成本：约300多万美元
模型生命周期：目标撑9-12个月（而非3-4个月就淘汰）
均摊下来成本"绝对算得过来"

李开复

我们认为我们就这么多GPU，我们的GPU就是一个business expense——跟人的薪水、奖金、办公室都是一样的。我们就这么多。

零一万物的Vision

愿景

Make AGI beneficial and accessible to everyone

与OpenAI最大的差别是accessible（人人可用）这个词。"你在美国做了OpenAI不给中国人用，那就不是人人可用。所以你不敢把它写到你的vision。我们做了模型出来，我让全世界每个人用——中国的、美国的、非洲的都可以用。"

十五、关键数据汇总

判断	具体内容
AGI实现时间	约7年后（~2030年），从GPT-4到AGI存在diminishing return
推理成本下降速度	行业自然降约每年10倍，零一目标降20-50倍
GPT-4同等能力价格	5个月内从$10降至$0.14每百万token
零一预训练成本	约300多万美元
模型目标生命周期	9-12个月（而非行业常见3-4个月）
当前AI生态资金分配	GPU 750亿、云100亿、应用50亿（倒三角）
零一海外ToC收入	约500-600万美元/年
Llama 405B vs 零一	推理成本贵约20倍，评比中输给零一小模型
李开复AI从业年限	40年（始于1984年CMU博士）
零一创立时间	2023年5月，六小虎中最晚
ToC应用大爆发时间	"明年前半年"（从推理成本可以算出来）
中国APP终将胜出	"一定会发生"——移动互联网和AI 1.0已验证两次
Google每次搜索收入	1.6美分
李开复技术乐观/担忧比	八成乐观、两成担忧
零一愿景	Make AGI beneficial and accessible to everyone
与OpenAI愿景差异	"accessible"——人人可用，包括中国人
中国模型落后美国	约5个月，但能力基本match
Perplexity幻觉率	"其实还挺高的"——Citation让用户以为没有幻觉

十六、启示与延伸思考

1. AGI垄断是人类历史上前所未有的威胁形态

李开复对AGI垄断的分析超越了通常的"技术竞争"框架。他指出AGI与历史上的垄断有本质区别：Windows不能消灭Mac、不能走进手机，但AGI作为"大脑"可以被指令"帮我维护垄断"并自我执行。这意味着一旦形成，传统的反垄断工具可能完全失效。这不是市场竞争问题，而是权力结构问题。

2. "生态抵抗"是务实但充满风险的赌注

李开复提出的路径是：不追求第一个AGI，而是在AGI到来之前用7年时间建立强大的应用生态护城河。这个策略的前提假设是AGI至少还要7年。如果这个时间窗口比预期短——比如只有3-4年——生态还来不及成型就会被碾压。这是一个时间赌注。

3. 垂直整合 vs 等待行业标准：iPhone逻辑的AI翻版

零一万物从三层内存架构到推理引擎到模型设计的垂直整合，本质上是乔布斯iPhone战略的AI翻版——不等各层分别成熟再组装，而是一次全部揉在一起。这个策略的风险在于：如果某一层的方向判断错误（比如内存架构发生范式变化），整个垂直体系都需要重构。但历史表明，在技术范式早期，垂直整合者通常胜过等待者。

4. AI生态倒三角揭示了一个结构性矛盾

750亿（GPU）: 100亿（云）: 50亿（应用）——这个倒三角与PC、互联网、移动互联网的正三角形成鲜明对比。如果这个结构不翻转，应用生态就无法真正繁荣。李开复没有明说但隐含的逻辑是：英伟达的超额利润实际上在吸走整个AI生态的养分。推理成本的下降本质上是在倒逼这个三角翻转。

5. "模型一体"方法论挑战了传统产品管理范式

让懂模型的人做产品负责人、80%看模型20%看其他——这是对互联网时代"产品经理中心制"的根本挑战。Character.AI的分裂案例证明了模型与产品的撕裂有多致命。但这个方法论也有盲区：懂模型的人对用户的直觉可能系统性偏弱，尤其在非技术用户的场景中。Google PM必须学CS的规矩在某些产品线（如社交）也遇到了困难。

6. OpenAI的"牌局策略"暴露了信息不对称的本质

李开复揭示了一个少有人公开讨论的事实：OpenAI在战略性地控制技术释放节奏——每出一张牌，全球公司就去猜去追。这意味着跟随者永远在追一个不完整的信号。中国公司落后5个月的判断可能是乐观的：如果OpenAI真的"还藏了很多好东西"，实际差距可能大于表面看到的。

7. "委托式界面"如果实现，将重新定义所有商业关系

从图形界面到语言界面再到委托式界面——李开复描绘的终局中，电商变成"被动竞价的仓库"，App Store可能不再存在，所有服务都通过智能助手中介。这不仅仅是交互方式的变化，而是商业权力的根本转移：谁控制了助手入口，谁就控制了所有下游的商业关系。这可能催生比当前平台经济更集中的权力结构。

8. Perplexity的Citation幻觉揭示了AI信任的脆弱基础

李开复指出Perplexity的幻觉率"其实还挺高的"，但Citation机制让用户"看到了就放心"——大部分人不会真正去点开验证。这暴露了AI信任机制的一个深层问题：当前的"可解释性"工具可能更多是心理安慰而非真正的质量保证。对于搜索这样的高stakes场景，这种虚假的信任可能比没有信任更危险。

如果美国形成AGI霸权，我们应该怎么办？

目录