← 返回张小珺主页
深度研究 Deep Dive

如果美国形成AGI霸权,我们应该怎么办?

#81 和李开复聊聊AGI霸权、垄断与中国的第二条道路
2024 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. Hinton、诺贝尔奖与AI起源记忆
  2. 从CMU到零一万物:40年AI路径
  3. 创业决策:为什么必须亲自做CEO
  4. 推理成本:垂直整合的方法论
  5. 三层内存架构与推理引擎优化
  6. AI First产品哲学
  7. 模型一体:让模型专家做产品负责人
  8. AGI垄断者的终极威胁
  9. 中国的第二条道路:生态抵抗
  10. AI生态倒三角与应用引爆逻辑
  11. 国内外双线作战:ToB与数字人
  12. 超级应用与委托式交互的未来
  13. 硅谷巨头卡位战:逐家点评
  14. 预训练的灵魂拷问与经济账
  15. 关键数据汇总
  16. 启示与延伸思考

一、Hinton、诺贝尔奖与AI起源记忆

访谈以2024年诺贝尔物理学奖颁给Geoffrey Hinton为切入点。李开复在CMU读博期间,Hinton是他的指导老师。

李开复
我觉得他是机器学习的超级专家。当时我用了贝叶斯的分类来做了一个黑白棋的game tree。不过我觉得跟他讲话,他完全没有在听我讲话。我觉得他的眼中——你这做的不就是个工程事情吗?我们要做伟大的事情的。然后他想都没有想,就帮我签字了。

Hinton的历史贡献与被忽视的洞察

Hinton的三重功劳

  • 理论突破:Boltzmann Machine等深度学习基础理论
  • 坚持30年:从CMU到多伦多大学,paper不断被拒仍坚持——与杨立昆一起经历"不被看好"的30年
  • 识别GPU价值:作为数学家,很快认识到GPU对机器学习的价值——他的一个学生到微软邓力实验室,教会微软怎么用GPU做深度学习

李开复在CMU的早期AI工作

1987-1988年

用机器学习(贝叶斯+博弈树)打败世界冠军的黑白棋系统。

同期

做了第一套非指定语者的语音识别系统——之前语音识别只针对特定人训练。

博士论文期间

选择了隐马尔可夫模型而非Hinton的神经网络——当时觉得神经网络"不一定work",因为只有三层,没有GPU,计算量太大。

一次错过的投资

李开复透露曾给Hinton的一个项目Level Six出过term sheet,但被百度抢先。这不是Hinton与Ilya Sutskever卖给Google的那笔著名交易,而是"一个比较小的项目"。Hinton当时"非常热情,请我们吃了饭,非常希望我们能够投资"。

二、从CMU到零一万物:40年AI路径

李开复认为自己的每一段职业经历都是为创办零一万物做的"预科"。

早期学术

在CMU做AI研究,选择机器学习方向,了解数据的重要性。

Apple、微软、Google

参与多家科技巨头的软件开发,经历PC时代和移动互联网时代。

创新工场

学会投资与商业模式,看到AI 1.0时代的各种挑战和机遇。

2023年5月

创立零一万物。被王慧文和杨植麟的创业"点醒"——原来可以这样做。

李开复
如果说20年后,当我80岁了,回头有过一个后悔的话,那这个后悔一定是我选择不去做他带来的后悔,而不是说他我试着去做,即便做失败了,我也不会后悔。

三、创业决策:为什么必须亲自做CEO

李开复最初考虑过两个选项:做董事长找CEO,或自己做CEO。最终选择后者。

选项A:做董事长

  • 更符合外界预期
  • 找三四十岁行业知名人士做CEO
  • 认可的几个CEO都无法加入

选项B:自己做CEO(最终选择)

  • 有兴趣的人"不认为会比我自己做得更好"
  • 40年管理经验和AI领域人脉
  • "有史以来时间最短、最紧迫的猎头"

2023-2024年最重要的决策

三个关键选择

  • 混合专家模型(MoE):非常早启动探索,义无反顾走这个路径——高能力、快速、低成本
  • 应用端引爆认知:整个行业的引爆一定在应用端,应用端需要非常便宜的推理
  • 多模态执着:尚未验证,但坚定认为这个技术重要、应用会出来

创业团队的核心作用

李开复认为自己在零一万物起的最大作用是"做一个有史以来时间最短、最紧迫的猎头"——把一批特别棒的人说服到一个上升的火箭里。这与他此前组建微软亚洲研究院、Google中国、创新工场的经验一脉相承。

四、推理成本:垂直整合的方法论

李开复提出了零一万物的核心差异化:更廉价的模型和推理引擎。这不是等待行业自然降价,而是主动用垂直整合加速。

核心理念

为什么不能"躺平等降价"

推理成本自然下降约每年10倍,但这不够。原因在于应用难度是递增的:chatbot可以容忍慢慢吐字,搜索需要更快,视频类应用一天可能刷三五个小时——使用强度、模型难度、用户规模三者相乘,自然降价追不上需求增长。

李开复
垂直整合才是正确的方法。比如说iPhone就是一个垂直整合。乔布斯没有说,我等这个capacitive screen变得行业标准吧,我来等这个multi touch变成行业标准吧……他是一次把它全部揉了起来。因为你要等的话,可能就等个5到7年了,那iPhone的时刻就错过了。

与AGI路线的DNA差异

大厂打法 vs 零一打法

  • 大厂:用5000-10000张GPU吸引博士,给资源做"畅想的事情",再尝试缩小放入产品——"就像设计最豪华的厨房,然后塞进你家几平米"
  • 零一:从一开始就以廉价推理为目标,训练适配推理引擎的模型——"加入的都是跟我们思维方式一致的、DNA一致的"
$10
GPT-4发布时每百万token价格
$0.14
零一5个月后同等能力价格
~70x
5个月内的价格降幅

五、三层内存架构与推理引擎优化

李开复详细描述了零一万物的推理优化方法论——核心思路是用内存换GPU计算

技术架构

三层缓存体系

层级存储类型容量级别用途
第一层GPU旁HBM(High Bandwidth Memory)~200GB最常用数据,最快访问
第二层CPU RAM~10TB次常用数据
第三层SSD~50TB可预调度数据

这三层内存加起来的成本不到GPU的十分之一。多花10%的钱买内存,可以降40-50%的GPU运算。

三层内存架构:成本 vs 速度权衡

垂直整合的四层联动

  1. 硬件理解:三层cache的运算特性
  2. 推理引擎:为三层内存量身定做,处理任意模型
  3. 模型设计:训练适配推理引擎的模型——"你不要训练那么大的模型好不好,训练小一点",正好放满机器
  4. 应用对接:fine tune到具体场景(搜索、社交等)

核心团队的几个人"坐在一起一起工作",从AI科研到硬件到推理引擎到模型设计,是一体化优化出来的。

六、AI First产品哲学

李开复提出了严格的"AI First"定义:如果把gen AI拿掉,这个产品就没有存在的必要

AI First的例子

  • 类比:滴滴、美团——如果去掉移动端就不成立
  • 搜索:打一个搜索词,直接出答案,不要点来点去
  • 主要用自然语言交流,触屏为辅

不是AI First的例子

  • 四大门户——有APP也有网页,内容差不多
  • Microsoft Office Copilot——打开还是blank document
  • Google Search Overview——"四不像",既有overview又有链接又有广告
李开复
未来人应该大部分时候不需要自己写东西了,应该就是让AI写,写了人来指导他一下,最后可能修改几个字。你打开一个blank document就不是未来应有的应用。

历史规律:AI First将重演Mobile First

回看移动互联网,最大受益者都是mobile first(抖音、快手、美团、滴滴),四大门户经过洗礼"价值只有下降没有上升"。同理,AI时代真正崛起的一定是AI first产品。大厂转型的核心挑战在于商业模式——过去的商业模式是否能延续到AI first里面,不能延续的就会有很多挑战。

七、模型一体:让模型专家做产品负责人

零一万物提出了"模型一体"的产品方法论:一个AI first应用的好坏,80%看模型,20%是其他。因此需要让懂模型的人做产品负责人。

逻辑来源:Google的PM选拔

Marissa Mayer的规矩

  • Google PM必须是计算机专业出身
  • 理由:让懂技术的人学PM/市场/用户,远比让MBA学计算机容易
  • 斯坦福一年200个CS本硕来申请,里面总有10个适合做PM

零一万物是这个理念的延伸:懂模型的200人里,总有10个可以做产品。

反面案例:Character.AI

模型与应用的撕裂

  • 创始人Noam一心做AGI,模型和产品都做得不错
  • 但AGI路线的模型对Character场景是"杀鸡用牛刀"
  • 最终分裂:想做AGI的人回Google,想做app的人留下
  • 李开复与Character投资人的对话:"你这个方法就是可以做成的——做app的方法。"
李开复
如果你要做AGI的话,你就是有一种理想和傲慢两者共存——就是我做成了AGI,我就碾压所有的竞争对手了。上面就未必有什么生态系统了,每一个app就是薄薄的一层壳,我们英文叫veneer(贴皮)。

八、AGI垄断者的终极威胁

李开复提出了本次访谈最核心的判断:第一个做出碾压式AGI的公司,将成为人类历史上最大的垄断者

核心论点

AGI垄断 vs 历史上的垄断

过去微软不能让Windows消灭Mac、走进手机——因为Windows只是操作系统。但AGI是一个大脑,它有独立思考和发明创造能力。一旦做成,AGI可以帮垄断者设计商业模式打倒竞争对手、设计公关策略、甚至发起网络攻击。过去的微软垄断、Google垄断,与此相比"大得多得多"。

李开复
第一个做出AGI碾压对手的,当然是一个技术的理想,但是他也是一个商业霸权垄断者,而且会成为一个终极垄断者。

AGI的自我强化循环

从GPT-6到终极垄断

  • GPT-5/6具备创造发明能力和独立思考能力
  • AGI可以被指令"帮我维护垄断、帮我得到更大商业利益"
  • 过去任何商人都梦想这样的霸权,但技术从未允许——AGI第一次让这成为可能
  • "有史以来所有的商人都梦想自己有这么大的一个霸权"
AGI垄断的自我强化飞轮

九、中国的第二条道路:生态抵抗

面对AGI霸权的可能性,李开复提出了中国的替代路径——不追求第一个做出碾压式AGI,而是用生态护城河抵抗

战略框架

生态抵抗路线图

  1. 短期:推理成本每年降10倍,零一等中国公司努力降到20-50倍
  2. 中期:廉价推理点燃应用——搜索、社交、娱乐、电商如"雨后春笋冒出来"
  3. 应用建立护城河:靠品牌、用户数据、social graph——就像微信、抖音很难被打倒
  4. 长期:到AGI真正到来时(假设7年后),中国已有强大的社交应用、搜索、agent、硬件
  5. 终局:AGI垄断者想碾压,"我们至少还有抵抗的余地——用生态去抵抗"
李开复
到了那天OpenAI一统天下的时候,我们已经有了一个很强的社交应用、很强的搜索、很强的agent、很强的硬件。他想要来碾压我们,我们至少还有抵抗的余地。我们是用生态去抵抗。

为什么中国APP会做得比美国好

两次历史验证

  • AI Super Powers书中的核心论点:美国领先发明时刻,中国在执行时刻赶超甚至超过
  • 移动互联网:美国发明,但中国APP强过美国
  • AI 1.0:深度学习和CNN美国发明,但中国应用和独角兽不逊于美国
  • 当前:谁发明4O?美国。谁发明O1?美国。但"他发明一个,我们就能够赶超一个"——落后约5个月

AGI时间线判断

李开复认为AGI约7年后(~2030年)实现,引用APIC AI智库的分析。从GPT-2到GPT-4(幼儿园到高中生)花了4年,从GPT-4到AGI(高中生到天才)需要7年——存在diminishing return。关键瓶颈:数据增长、GPU/HBM生产力、传输瓶颈、电力。"三年达到AGI的预测可能是过度乐观了。"

十、AI生态倒三角与应用引爆逻辑

李开复指出当前AI生态的资金分配是一个病态的倒三角,与历史上每一次成功的技术生态完全相反。

AI生态资金分配:倒三角 vs 健康生态

健康生态(PC/互联网/移动/云)

  • 芯片赚最少
  • 平台赚蛮多
  • 应用赚最多(所有应用 > 平台)
  • 正向循环:用户付钱 -> APP进步 -> 平台有要求 -> 芯片进步

当前AI生态(倒三角)

  • GPU芯片:750亿美金
  • 云厂商:100亿美金
  • 应用(ChatGPT等):50亿美金
  • 应用无法像"雨后春笋"冒出来

垄断者不急于降推理成本

李开复指出一个反直觉的逻辑:如果推理成本由一个垄断者控制,"他未必会很急于推理成本降下来,因为他未必想很多应用冒出来"。这正是中国公司主动降低推理成本的战略意义——不是为了价格战,而是为了点燃应用生态。

TCPMF:比传统PMF更难的新框架

Technology-Cost-Product-Market Fit

  • 传统PMF:产品与市场的匹配
  • TCPMF增加两个维度:需要多强的技术(多模态/视频/推理/O1能力?)和多低的成本
  • 创业者需要预测技术何时成熟、成本何时够低,在点燃时刻精准引爆
  • "难度比以前应该是加倍了"

十一、国内外双线作战:ToB与数字人

为什么ToC先走海外

国内ToC的两个挑战

  • 缺少ChatGPT Moment:中国错失了"天时地利人和"的全民教育时刻,用户教育成本高
  • 流量太贵:友商烧的钱"总是烧不过大厂",融资来的钱来之不易

海外ToC策略:先用GPT-4做产品磨练团队,再切换自有模型。已有约500-600万美元年收入。

国内ToB:数字人直播

商业模式

Service as Software

硅谷新共识:从SaaS(Software as Service)到SaaS(Service as Software)——用软件提供"数字员工",按人头收费。零一万物选择了数字人电商直播作为切入点。

数字人直播的具体场景

连锁速食店的痛点

  • 新店店长已经很忙,还被要求在线上直播
  • 店长一天只能花1小时直播,数字人可以做8小时
  • 店长只能做1个渠道(如美团),数字人可以同时做4-5个渠道
  • 按一个钮,10分钟上线——完整解决方案
  • 硬性商业指标:比如一天GMV多收5000块钱
李开复
就是先帮你赚钱,再给你收钱。然后是完整的解决方案,而不是说我有个技术你想用在哪里。

十二、超级应用与委托式交互的未来

李开复描绘了AI应用发展的三个阶段和一个终极形态。

第一阶段:重写

每一个移动互联网应用都会被颠覆重写一次。"投中了那个重写者,你就赢了。"Perplexity重写了Google搜索。

第二阶段:前所未有的应用

类似移动互联网时代的抖音、滴滴、美团——AI first的原生应用。

第三阶段:超级应用

一个智能助手成为所有服务的入口——截胡所有外部应用。

未来交互

从图形界面到委托式界面

用户界面将经历三次跃迁:图形界面 -> 语言界面 -> 委托式界面。当智能助手"比我聪明、比我能干、比我博学,还比我更懂我自己",用户会自然地把一切委托给它。关键技术门槛:将当前四五十秒的交互流程降至一秒钟——需要always on、always listening的硬件(眼镜或耳机)。

超级应用对现有生态的颠覆

如果智能助手成为入口,电商变成"被动竞价的仓库"——用户不再把电商当入口,而是通过助手接触。这与今日头条成为内容载体的逻辑一致。"所以以后可能App Store也不存在了,你还要应用干什么?你的助手就一切帮你做了。"

十三、硅谷巨头卡位战:逐家点评

李开复刚从硅谷回来,逐一点评了主要科技巨头。

公司定位优势挑战/风险
英伟达最大获利者GPU霸主地位当GPU从训练转向推理时,优势能否持续?
OpenAI特别强大的垄断型公司还藏了很多好东西没放出来,战略性决定何时释放技术Sam Altman是"有史以来最大的垄断者"——目前是陈述事实而非贬义
微软位置最好,可攻可守靠AI赚钱+持有OpenAI股份自己的模型一直没做好;与OpenAI的蜜月期会结束
Meta最大的搅局者"打不过人家就开源"——已两次成功(PyTorch vs TensorFlow, Llama技术是落后的;Mark对AI是否很懂存疑
xAI执行力非常强管公司"跟中国公司一样";小将非常能干目前成就基本是复刻OpenAI和Google早期技术
Google比较伤感技术累积最强——最厉害的大模型论文和强化学习都出自此搜索四面受敌;Gemini各种限制;商业搜索流失到Amazon
Perplexity做对了产品心态Citation模式部分化解了信任问题(虽然幻觉率仍高)Google分分钟可以做一个,但基于商业考量不能做

OpenAI的牌局策略

战略性释放技术

  • GPT-5训练不太顺利,但为了融资"丢了一个O1出来"
  • 手中还有很多牌——不急着出,每出一张牌全球公司就会去猜去做
  • 想留到AGI有望的时候再有信心地打出
  • 李开复判断OpenAI与Google的距离"不是Google在拉近,而是可能越来越远"

Google搜索的三难困境

大模型放不放进搜索?

  • 选项一:完全取代搜索——所有广告业务拆没了,公司可以关门
  • 选项二:做两个入口——掩耳盗铃
  • 选项三(当前选择):两者并存——overview+搜索结果+广告="四不像"

十四、预训练的灵魂拷问与经济账

面对开源模型(如Llama 405B)的挑战,李开复提出了预训练的两个决策标准。

标准一:打不打得过开源?

  • 如果自己预训练的模型不比开源模型好,明智的做法就是不做
  • 零一万物"有绝对的信心"——小模型在评比中胜过Llama 405B
  • 而Llama 405B推理成本是零一的约20倍

标准二:经济账算不算得过来?

  • 训练成本:约300多万美元
  • 模型生命周期:目标撑9-12个月(而非3-4个月就淘汰)
  • 均摊下来成本"绝对算得过来"
李开复
我们认为我们就这么多GPU,我们的GPU就是一个business expense——跟人的薪水、奖金、办公室都是一样的。我们就这么多。

零一万物的Vision

愿景

Make AGI beneficial and accessible to everyone

与OpenAI最大的差别是accessible(人人可用)这个词。"你在美国做了OpenAI不给中国人用,那就不是人人可用。所以你不敢把它写到你的vision。我们做了模型出来,我让全世界每个人用——中国的、美国的、非洲的都可以用。"

十五、关键数据汇总

判断具体内容
AGI实现时间约7年后(~2030年),从GPT-4到AGI存在diminishing return
推理成本下降速度行业自然降约每年10倍,零一目标降20-50倍
GPT-4同等能力价格5个月内从$10降至$0.14每百万token
零一预训练成本约300多万美元
模型目标生命周期9-12个月(而非行业常见3-4个月)
当前AI生态资金分配GPU 750亿、云100亿、应用50亿(倒三角)
零一海外ToC收入约500-600万美元/年
Llama 405B vs 零一推理成本贵约20倍,评比中输给零一小模型
李开复AI从业年限40年(始于1984年CMU博士)
零一创立时间2023年5月,六小虎中最晚
ToC应用大爆发时间"明年前半年"(从推理成本可以算出来)
中国APP终将胜出"一定会发生"——移动互联网和AI 1.0已验证两次
Google每次搜索收入1.6美分
李开复技术乐观/担忧比八成乐观、两成担忧
零一愿景Make AGI beneficial and accessible to everyone
与OpenAI愿景差异"accessible"——人人可用,包括中国人
中国模型落后美国约5个月,但能力基本match
Perplexity幻觉率"其实还挺高的"——Citation让用户以为没有幻觉

十六、启示与延伸思考

1. AGI垄断是人类历史上前所未有的威胁形态

李开复对AGI垄断的分析超越了通常的"技术竞争"框架。他指出AGI与历史上的垄断有本质区别:Windows不能消灭Mac、不能走进手机,但AGI作为"大脑"可以被指令"帮我维护垄断"并自我执行。这意味着一旦形成,传统的反垄断工具可能完全失效。这不是市场竞争问题,而是权力结构问题。

2. "生态抵抗"是务实但充满风险的赌注

李开复提出的路径是:不追求第一个AGI,而是在AGI到来之前用7年时间建立强大的应用生态护城河。这个策略的前提假设是AGI至少还要7年。如果这个时间窗口比预期短——比如只有3-4年——生态还来不及成型就会被碾压。这是一个时间赌注。

3. 垂直整合 vs 等待行业标准:iPhone逻辑的AI翻版

零一万物从三层内存架构到推理引擎到模型设计的垂直整合,本质上是乔布斯iPhone战略的AI翻版——不等各层分别成熟再组装,而是一次全部揉在一起。这个策略的风险在于:如果某一层的方向判断错误(比如内存架构发生范式变化),整个垂直体系都需要重构。但历史表明,在技术范式早期,垂直整合者通常胜过等待者。

4. AI生态倒三角揭示了一个结构性矛盾

750亿(GPU): 100亿(云): 50亿(应用)——这个倒三角与PC、互联网、移动互联网的正三角形成鲜明对比。如果这个结构不翻转,应用生态就无法真正繁荣。李开复没有明说但隐含的逻辑是:英伟达的超额利润实际上在吸走整个AI生态的养分。推理成本的下降本质上是在倒逼这个三角翻转。

5. "模型一体"方法论挑战了传统产品管理范式

让懂模型的人做产品负责人、80%看模型20%看其他——这是对互联网时代"产品经理中心制"的根本挑战。Character.AI的分裂案例证明了模型与产品的撕裂有多致命。但这个方法论也有盲区:懂模型的人对用户的直觉可能系统性偏弱,尤其在非技术用户的场景中。Google PM必须学CS的规矩在某些产品线(如社交)也遇到了困难。

6. OpenAI的"牌局策略"暴露了信息不对称的本质

李开复揭示了一个少有人公开讨论的事实:OpenAI在战略性地控制技术释放节奏——每出一张牌,全球公司就去猜去追。这意味着跟随者永远在追一个不完整的信号。中国公司落后5个月的判断可能是乐观的:如果OpenAI真的"还藏了很多好东西",实际差距可能大于表面看到的。

7. "委托式界面"如果实现,将重新定义所有商业关系

从图形界面到语言界面再到委托式界面——李开复描绘的终局中,电商变成"被动竞价的仓库",App Store可能不再存在,所有服务都通过智能助手中介。这不仅仅是交互方式的变化,而是商业权力的根本转移:谁控制了助手入口,谁就控制了所有下游的商业关系。这可能催生比当前平台经济更集中的权力结构。

8. Perplexity的Citation幻觉揭示了AI信任的脆弱基础

李开复指出Perplexity的幻觉率"其实还挺高的",但Citation机制让用户"看到了就放心"——大部分人不会真正去点开验证。这暴露了AI信任机制的一个深层问题:当前的"可解释性"工具可能更多是心理安慰而非真正的质量保证。对于搜索这样的高stakes场景,这种虚假的信任可能比没有信任更危险。

延伸阅读