访谈以2024年诺贝尔物理学奖颁给Geoffrey Hinton为切入点。李开复在CMU读博期间,Hinton是他的指导老师。
用机器学习(贝叶斯+博弈树)打败世界冠军的黑白棋系统。
做了第一套非指定语者的语音识别系统——之前语音识别只针对特定人训练。
选择了隐马尔可夫模型而非Hinton的神经网络——当时觉得神经网络"不一定work",因为只有三层,没有GPU,计算量太大。
李开复透露曾给Hinton的一个项目Level Six出过term sheet,但被百度抢先。这不是Hinton与Ilya Sutskever卖给Google的那笔著名交易,而是"一个比较小的项目"。Hinton当时"非常热情,请我们吃了饭,非常希望我们能够投资"。
李开复认为自己的每一段职业经历都是为创办零一万物做的"预科"。
在CMU做AI研究,选择机器学习方向,了解数据的重要性。
参与多家科技巨头的软件开发,经历PC时代和移动互联网时代。
学会投资与商业模式,看到AI 1.0时代的各种挑战和机遇。
创立零一万物。被王慧文和杨植麟的创业"点醒"——原来可以这样做。
李开复最初考虑过两个选项:做董事长找CEO,或自己做CEO。最终选择后者。
李开复认为自己在零一万物起的最大作用是"做一个有史以来时间最短、最紧迫的猎头"——把一批特别棒的人说服到一个上升的火箭里。这与他此前组建微软亚洲研究院、Google中国、创新工场的经验一脉相承。
李开复提出了零一万物的核心差异化:更廉价的模型和推理引擎。这不是等待行业自然降价,而是主动用垂直整合加速。
推理成本自然下降约每年10倍,但这不够。原因在于应用难度是递增的:chatbot可以容忍慢慢吐字,搜索需要更快,视频类应用一天可能刷三五个小时——使用强度、模型难度、用户规模三者相乘,自然降价追不上需求增长。
李开复详细描述了零一万物的推理优化方法论——核心思路是用内存换GPU计算。
| 层级 | 存储类型 | 容量级别 | 用途 |
|---|---|---|---|
| 第一层 | GPU旁HBM(High Bandwidth Memory) | ~200GB | 最常用数据,最快访问 |
| 第二层 | CPU RAM | ~10TB | 次常用数据 |
| 第三层 | SSD | ~50TB | 可预调度数据 |
这三层内存加起来的成本不到GPU的十分之一。多花10%的钱买内存,可以降40-50%的GPU运算。
核心团队的几个人"坐在一起一起工作",从AI科研到硬件到推理引擎到模型设计,是一体化优化出来的。
李开复提出了严格的"AI First"定义:如果把gen AI拿掉,这个产品就没有存在的必要。
回看移动互联网,最大受益者都是mobile first(抖音、快手、美团、滴滴),四大门户经过洗礼"价值只有下降没有上升"。同理,AI时代真正崛起的一定是AI first产品。大厂转型的核心挑战在于商业模式——过去的商业模式是否能延续到AI first里面,不能延续的就会有很多挑战。
零一万物提出了"模型一体"的产品方法论:一个AI first应用的好坏,80%看模型,20%是其他。因此需要让懂模型的人做产品负责人。
零一万物是这个理念的延伸:懂模型的200人里,总有10个可以做产品。
李开复提出了本次访谈最核心的判断:第一个做出碾压式AGI的公司,将成为人类历史上最大的垄断者。
过去微软不能让Windows消灭Mac、走进手机——因为Windows只是操作系统。但AGI是一个大脑,它有独立思考和发明创造能力。一旦做成,AGI可以帮垄断者设计商业模式打倒竞争对手、设计公关策略、甚至发起网络攻击。过去的微软垄断、Google垄断,与此相比"大得多得多"。
面对AGI霸权的可能性,李开复提出了中国的替代路径——不追求第一个做出碾压式AGI,而是用生态护城河抵抗。
李开复认为AGI约7年后(~2030年)实现,引用APIC AI智库的分析。从GPT-2到GPT-4(幼儿园到高中生)花了4年,从GPT-4到AGI(高中生到天才)需要7年——存在diminishing return。关键瓶颈:数据增长、GPU/HBM生产力、传输瓶颈、电力。"三年达到AGI的预测可能是过度乐观了。"
李开复指出当前AI生态的资金分配是一个病态的倒三角,与历史上每一次成功的技术生态完全相反。
李开复指出一个反直觉的逻辑:如果推理成本由一个垄断者控制,"他未必会很急于推理成本降下来,因为他未必想很多应用冒出来"。这正是中国公司主动降低推理成本的战略意义——不是为了价格战,而是为了点燃应用生态。
海外ToC策略:先用GPT-4做产品磨练团队,再切换自有模型。已有约500-600万美元年收入。
硅谷新共识:从SaaS(Software as Service)到SaaS(Service as Software)——用软件提供"数字员工",按人头收费。零一万物选择了数字人电商直播作为切入点。
李开复描绘了AI应用发展的三个阶段和一个终极形态。
每一个移动互联网应用都会被颠覆重写一次。"投中了那个重写者,你就赢了。"Perplexity重写了Google搜索。
类似移动互联网时代的抖音、滴滴、美团——AI first的原生应用。
一个智能助手成为所有服务的入口——截胡所有外部应用。
用户界面将经历三次跃迁:图形界面 -> 语言界面 -> 委托式界面。当智能助手"比我聪明、比我能干、比我博学,还比我更懂我自己",用户会自然地把一切委托给它。关键技术门槛:将当前四五十秒的交互流程降至一秒钟——需要always on、always listening的硬件(眼镜或耳机)。
如果智能助手成为入口,电商变成"被动竞价的仓库"——用户不再把电商当入口,而是通过助手接触。这与今日头条成为内容载体的逻辑一致。"所以以后可能App Store也不存在了,你还要应用干什么?你的助手就一切帮你做了。"
李开复刚从硅谷回来,逐一点评了主要科技巨头。
| 公司 | 定位 | 优势 | 挑战/风险 |
|---|---|---|---|
| 英伟达 | 最大获利者 | GPU霸主地位 | 当GPU从训练转向推理时,优势能否持续? |
| OpenAI | 特别强大的垄断型公司 | 还藏了很多好东西没放出来,战略性决定何时释放技术 | Sam Altman是"有史以来最大的垄断者"——目前是陈述事实而非贬义 |
| 微软 | 位置最好,可攻可守 | 靠AI赚钱+持有OpenAI股份 | 自己的模型一直没做好;与OpenAI的蜜月期会结束 |
| Meta | 最大的搅局者 | "打不过人家就开源"——已两次成功(PyTorch vs TensorFlow, Llama) | 技术是落后的;Mark对AI是否很懂存疑 |
| xAI | 执行力非常强 | 管公司"跟中国公司一样";小将非常能干 | 目前成就基本是复刻OpenAI和Google早期技术 |
| 比较伤感 | 技术累积最强——最厉害的大模型论文和强化学习都出自此 | 搜索四面受敌;Gemini各种限制;商业搜索流失到Amazon | |
| Perplexity | 做对了产品心态 | Citation模式部分化解了信任问题(虽然幻觉率仍高) | Google分分钟可以做一个,但基于商业考量不能做 |
面对开源模型(如Llama 405B)的挑战,李开复提出了预训练的两个决策标准。
与OpenAI最大的差别是accessible(人人可用)这个词。"你在美国做了OpenAI不给中国人用,那就不是人人可用。所以你不敢把它写到你的vision。我们做了模型出来,我让全世界每个人用——中国的、美国的、非洲的都可以用。"
| 判断 | 具体内容 |
|---|---|
| AGI实现时间 | 约7年后(~2030年),从GPT-4到AGI存在diminishing return |
| 推理成本下降速度 | 行业自然降约每年10倍,零一目标降20-50倍 |
| GPT-4同等能力价格 | 5个月内从$10降至$0.14每百万token |
| 零一预训练成本 | 约300多万美元 |
| 模型目标生命周期 | 9-12个月(而非行业常见3-4个月) |
| 当前AI生态资金分配 | GPU 750亿、云100亿、应用50亿(倒三角) |
| 零一海外ToC收入 | 约500-600万美元/年 |
| Llama 405B vs 零一 | 推理成本贵约20倍,评比中输给零一小模型 |
| 李开复AI从业年限 | 40年(始于1984年CMU博士) |
| 零一创立时间 | 2023年5月,六小虎中最晚 |
| ToC应用大爆发时间 | "明年前半年"(从推理成本可以算出来) |
| 中国APP终将胜出 | "一定会发生"——移动互联网和AI 1.0已验证两次 |
| Google每次搜索收入 | 1.6美分 |
| 李开复技术乐观/担忧比 | 八成乐观、两成担忧 |
| 零一愿景 | Make AGI beneficial and accessible to everyone |
| 与OpenAI愿景差异 | "accessible"——人人可用,包括中国人 |
| 中国模型落后美国 | 约5个月,但能力基本match |
| Perplexity幻觉率 | "其实还挺高的"——Citation让用户以为没有幻觉 |
李开复对AGI垄断的分析超越了通常的"技术竞争"框架。他指出AGI与历史上的垄断有本质区别:Windows不能消灭Mac、不能走进手机,但AGI作为"大脑"可以被指令"帮我维护垄断"并自我执行。这意味着一旦形成,传统的反垄断工具可能完全失效。这不是市场竞争问题,而是权力结构问题。
李开复提出的路径是:不追求第一个AGI,而是在AGI到来之前用7年时间建立强大的应用生态护城河。这个策略的前提假设是AGI至少还要7年。如果这个时间窗口比预期短——比如只有3-4年——生态还来不及成型就会被碾压。这是一个时间赌注。
零一万物从三层内存架构到推理引擎到模型设计的垂直整合,本质上是乔布斯iPhone战略的AI翻版——不等各层分别成熟再组装,而是一次全部揉在一起。这个策略的风险在于:如果某一层的方向判断错误(比如内存架构发生范式变化),整个垂直体系都需要重构。但历史表明,在技术范式早期,垂直整合者通常胜过等待者。
750亿(GPU): 100亿(云): 50亿(应用)——这个倒三角与PC、互联网、移动互联网的正三角形成鲜明对比。如果这个结构不翻转,应用生态就无法真正繁荣。李开复没有明说但隐含的逻辑是:英伟达的超额利润实际上在吸走整个AI生态的养分。推理成本的下降本质上是在倒逼这个三角翻转。
让懂模型的人做产品负责人、80%看模型20%看其他——这是对互联网时代"产品经理中心制"的根本挑战。Character.AI的分裂案例证明了模型与产品的撕裂有多致命。但这个方法论也有盲区:懂模型的人对用户的直觉可能系统性偏弱,尤其在非技术用户的场景中。Google PM必须学CS的规矩在某些产品线(如社交)也遇到了困难。
李开复揭示了一个少有人公开讨论的事实:OpenAI在战略性地控制技术释放节奏——每出一张牌,全球公司就去猜去追。这意味着跟随者永远在追一个不完整的信号。中国公司落后5个月的判断可能是乐观的:如果OpenAI真的"还藏了很多好东西",实际差距可能大于表面看到的。
从图形界面到语言界面再到委托式界面——李开复描绘的终局中,电商变成"被动竞价的仓库",App Store可能不再存在,所有服务都通过智能助手中介。这不仅仅是交互方式的变化,而是商业权力的根本转移:谁控制了助手入口,谁就控制了所有下游的商业关系。这可能催生比当前平台经济更集中的权力结构。
李开复指出Perplexity的幻觉率"其实还挺高的",但Citation机制让用户"看到了就放心"——大部分人不会真正去点开验证。这暴露了AI信任机制的一个深层问题:当前的"可解释性"工具可能更多是心理安慰而非真正的质量保证。对于搜索这样的高stakes场景,这种虚假的信任可能比没有信任更危险。