← 返回张小珺主页
深度研究 Deep Dive

MiniMax幕后故事和大模型资本扑克牌

#68 和MiniMax天使投资人陈玉的深度对话
2024 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 嘉宾画像:从约翰霍普金斯到云起资本
  2. GenAI大会见闻:硅谷的热闹与中美资本博弈
  3. 中美AI投资的四个关键差异
  4. AI十年三波浪潮:从CV到自动驾驶到大模型
  5. 技术演进的启示:Corner Cases与成本铁律
  6. MiniMax创业起源:约翰霍普金斯的NLP人脉网
  7. 与颜俊杰的三次会面:从方向到下注
  8. 商汤的局限与MiniMax的超越逻辑
  9. 产品演进:从超写实数字人到GLOW到Toki
  10. 融资内幕:高度保密的一把手项目
  11. 大模型降价潮:创业公司的生死考验
  12. 大模型的资本扑克牌:玩家分类与筹码逻辑
  13. 创业公司的生态位危机与生存策略
  14. Google文化遗产与人才密度的启示
  15. 关键数据汇总

一、嘉宾画像:从约翰霍普金斯到云起资本

本期嘉宾陈玉是MiniMax的天使投资人,也是其第一位投资人,来自云起资本。他的履历横跨学术、工程、商学和投资四个领域,这种复合背景深刻影响了他对AI创业的判断方式。

约翰霍普金斯大学 计算机系

9个月修完研究生课程毕业。与出门问问李志飞是同班同学,在信息提取与处理课程中是唯一拿到A+的学生。

Google纽约 软件工程师(约5年)

参与个性化搜索、展示广告等工作。当时Google全球仅约4000人,其中2000名工程师。同期同事包括黄峥(拼多多)、宿华(快手)、阳萌(安克)等。

芝加哥大学商学院(2010-2012)

攻读MBA学位,完成从工程师到投资人的认知转型。

2014年 加入云起资本

作为第一个投资人加入,负责AI、大数据、云计算、机器人、自动驾驶方向投资。投资策略:invest in global Chinese——投资全球华人创业者。

约翰霍普金斯的NLP人才网络

陈玉反复提及约翰霍普金斯是NLP领域创业者的摇篮。李志飞(出门问问)、MiniMax联创叶一、另一位合伙人均出自该校。这种校友网络直接促成了他与MiniMax的早期连接——叶一在商汤工作期间就已是陈玉的朋友,"在他真正创业前五六七年我们其实就已经成为了好朋友"。

二、GenAI大会见闻:硅谷的热闹与中美资本博弈

2024年5月下旬,一个名为GPTDAO的Web3组织在旧金山举办了为期三天的GenAI大会。陈玉分享了他在现场的观察。

大会的真实面貌

"草台班子"式的组织

  • 第一天早上排队一两个小时才能进入会场
  • 日程"直到最后一刻都还在不断的变化"
  • 很多之前宣传的大牌演讲"到最后一刻也没有兑现"
  • 但邀请到了NVIDIA巨神智能研究科学家、贾扬清等重量级嘉宾

陈玉坦言,绝大多数参会者的真实目的并非听会——而是趁此机会在硅谷见人。"很多人在国内想约,约不到,谁知道就是在三藩见面了。"在场的中国投资人包括红点刘岚、朱啸虎等。

陈玉
会议组织上还是有些问题的,不过能够把这么多人聚在一起,也是个不错的一个结果了。

三、中美AI投资的四个关键差异

陈玉通过与Goodwater等美国基金同学的交流,总结了中美AI投资环境的四个核心差异点。

$20-30万
美国AI初级工程师年薪
80%+
GPT-4在中国API市场占有率
$10亿+
大模型创业的牌桌门槛
#维度具体情况
1对中国创始人的态度美国VC不排斥中国创始人参与,只要商业运作在美国。开发团队在中国也可接受
2AI估值水平AI领域估值相对较高,其他方向"都不太行"。客观原因是AI工程师薪资昂贵,融资额必须大
3不投中国的真实原因不是中美纷争,而是退出环境恶劣——"配置中国企业到时会遇到有些退出的问题"
4中国VC投美国项目目前没有法案阻止,做好申报即可。但双币基金(管理过政府基金的)会被额外审视

中美投资条款的关键差异

回购权之争

  • 美国VC惯例:协议中没有回购——因为回购条款会在税收上产生影响
  • 中国VC惯例:"总是需要有回购作为保护"
  • 这只是众多条款差异中的一个,"中国VC得在实战中去慢慢学习"

"纯市场化"是关键分界线

陈玉明确指出:如果基金是纯市场化的,问题不大,"和国籍没什么关系"。但如果美元基金和中国政府关系紧密(如帮政府管理基金),在美国"大家是会比较担心的"。这意味着双币基金在美国AI投资中面临结构性劣势。

四、AI十年三波浪潮:从CV到自动驾驶到大模型

陈玉在AI投资领域深耕十年,他从技术和投资双重视角梳理了三波AI浪潮的演进逻辑。

AI十年三波浪潮时间线
浪潮时间技术驱动代表公司/产品结局/现状
计算机视觉2014年前后CNN卷积网络AI四小龙(商汤等)算法无壁垒,"很多时候算法都是免费送的"
自动驾驶2016年起端到端/L4路线Waymo、百度、元戎启行L4规模不经济,退而求其次走L2+
大模型2022.11起Transformer scale upOpenAIMiniMax月之暗面竞争惨烈,尚未分出胜负

技术路线的关键转折

2012年 深度学习兴起

CNN、DNN、RNN等技术出现,迸发第一波AI应用。

2016-2017年 Transformer与BERT分叉

Google提出Transformer,随后选择了BERT路线。2017-2021年间BERT占据主导位置。

2021-2022年 Transformer逆袭

大家发现Transformer在scale up时"表现非常非常好,出乎大家的意料"。此后所有大模型都基于Transformer。

2023年下半年 MOE架构

Scale up遇到困难、推理成本高昂,诞生了MoE(混合专家模型)架构。

2024年 多模态时代

Sora(视频生成)、GPT-4o(多模态融合)出现,实现任意模态输入输出,延迟从3-5秒降到300毫秒

核心判断

大模型对前两波浪潮的吞噬效应

计算机视觉:多模态模型可以直接处理图像和视频,"基本上可以把CV赛道给吞噬掉"。自动驾驶:则不会被吞噬——"无图加端到端的L3方案已经非常好了,不需要这么大参数量,是个更加经济有效的方法"。

五、技术演进的启示:Corner Cases与成本铁律

陈玉从前两波AI浪潮中提炼了三条对大模型至关重要的启示。

启示一:完美不可能,但逼近有价值

陈玉
你能不能期望说大模型完全没有幻觉?答案肯定是否定的。能做到的只是说无限的去逼近这个理想的状态,但是永远是不可能做到100%准确的。其实就是和人是一样的,人自己也会犯错。

启示二:成本是商业模式成立的铁律

从自动驾驶到大模型的成本逻辑

  • 自动驾驶L4难落地,除了Corner Cases外,"更大的原因还是成本问题——当AI比人力贵,AI肯定很难普及"
  • 大模型成本两年内下降了一到两个数量级,"这个还是令人欣喜的"
  • 元戎启行将软硬件方案成本降到2000美元,终端消费者加价2-3万人民币——远比特斯拉FSD的99美元/月方案划算

启示三:算力和能源成为新瓶颈

算力瓶颈

  • GPT-4参数量已达1.8T
  • 多模态和GPT-5参数量将进一步提升
  • 受限于台积电产能(但"始终会被解决")

能源瓶颈

  • "更难解决的问题"
  • 美国大厂开始减少本土数据中心投资
  • 可能转向北欧等电费便宜的地区
  • 中国有核电优势

六、MiniMax创业起源:约翰霍普金斯的NLP人脉网

MiniMax的创业故事与约翰霍普金斯大学的NLP学术圈密不可分。陈玉从第一视角还原了这个故事的起点。

核心人物关系

约翰霍普金斯的校友网络

  • 陈玉(投资人)——约翰霍普金斯计算机系研究生
  • 李志飞(出门问问创始人)——陈玉的同班同学,后来都在Google
  • 叶一(MiniMax联创)——陈玉的师弟
  • Simon(叶一的下属,后创立VAST做3D)——同为师弟
  • 至少还有一位合伙人出自该校

陈玉与叶一的关系始于叶一大四毕业回商汤工作时期——"在他真正创业前五六七年前,我们其实就已经成为了好朋友"。他亲眼目睹了叶一在商汤的成长。

叶一创业的两个前提条件

陈玉
叶一早在18、19年其实就已经有创业的想法了。但我觉得他一直没有付诸行动,可能原因有几个:一个是说他没有找到合适的团队,第二个就是可能没有一个足够大的方向。因为叶一已经在商汤做的非常成功了,如果他要出来创业的话,他做的事情肯定要比商汤本身在做的事情要更大,他才愿意出来。

七、与颜俊杰的三次会面:从方向到下注

2021年初,叶一终于找到了他的创业伙伴和方向。陈玉还原了投资MiniMax的决策过程。

第一次见面:上海某餐厅

叶一告诉陈玉他准备出来创业,方向是用基础模型解决AI问题,最终实现通用人工智能——"做中国的OpenAI"。陈玉表示要把创业伙伴介绍给他认识。

第二次见面:认识颜俊杰(IO)

陈玉认识了颜俊杰。团队内部叫他IO——"计算机里面就是input output,最常见的一个缩写"。

第三次及后续:深入讨论Foundation Model

讨论了多个落地方向:智慧城市、智慧文旅、类Talkie社交、超写实数字人等。

为什么陈玉对颜俊杰有"好感度"

两个与众不同之处

  • 第一:颜俊杰是第一个与陈玉"这么深入的去聊Foundation Model"的人。当时主流还是BERT及其变种,几乎所有AI项目都说"我是用了BERT"
  • 第二:他想解决一个"特别特别大"的问题——通用人工智能。"如果你没有足够的野心,然后对自己没有足够多的自信,是很难去想到要做这么个创业的"

投资决策的坦诚

陈玉坦言:"其实当时是没有判断的。"在2021年初,OpenAI还没有像今天这样火爆。他的下注更多基于对创始人的信任和对方向的认同,而非清晰的商业逻辑——这恰恰是天使投资的本质。

八、商汤的局限与MiniMax的超越逻辑

MiniMax的核心团队来自商汤,理解商汤的局限性是理解MiniMax选择的钥匙。

从投资人视角看商汤的两个结构性问题

问题一:项目制低人效

  • 做大量2B项目
  • "不是像产品一样可以低成本scale up"
  • 必须一个个项目地做
  • 人效比较低的商业模式

问题二:CV算法无壁垒

  • 任何人通过论文和开源代码即可实现
  • "到后面很多时候算法都是免费送的"
  • 帮手机做方案、做安防项目时壁垒极低

大模型与CV的壁垒差异

核心对比

大模型的壁垒不在算法,在算力

与CV不同,大模型的"难点不是在算法,难点是你能不能够买到这么多的算力,然后怎么去用好这些算力"。融不到十亿美元以上,"你就上不了牌桌"。这意味着大模型竞争从公司数目上远小于当年CV公司——壁垒从算法转移到了资本和工程。

颜俊杰的管理风格

九、产品演进:从超写实数字人到GLOW到Toki

MiniMax的产品线经历了一条清晰的演进路径,从技术验证到商业闭环。

早期:超写实数字人

办公室里有巨大的单反摄像机阵列,通过多角度数据采集完成精确3D建模。当时全球只有MiniMax和Meta拥有类似技术。同时发展了声音和文字基础模型——"一开始就开始做多模态"。

2022年末:GLOW

"半玩票性质"推出,界面粗糙但模型强大。迅速获得数百万注册用户,风靡小红书。很多人怀疑背后是真人回答——"说明这个模型做得蛮好的"。本质上是图灵测试。后因网信办监管要求下架。

2023年:海螺AI、Toki

张前川(原今日头条用户产品负责人)加入,由高瓴牵线。Toki面向海外市场,日活百万级,注册用户千万级,年收入达千万美元级,预计全年可达数千万美元。

MiniMax 产品演进与商业化路径

张前川加入的故事

从独立创业到加入平台

  • 张前川本想独立创业,被投资人(高瓴)说服加入MiniMax
  • 背景:百度(搜索) → 字节(今日头条用户产品负责人) → MiniMax
  • 没有在美国生活过,却打造了风靡美国的产品——"靠产品直觉和数据分析"

GLOW的战略意义远超产品本身

GLOW看似"半玩票",实则是MiniMax进行的一次大规模图灵测试。它验证了文字基础模型的质量,积累了真实用户交互数据,并为后续Toki的社交AI产品路线奠定了基础。下架并非失败——"真正MiniMax想做的是后面Toki的那款产品"。

十、融资内幕:高度保密的一把手项目

MiniMax的融资过程充满了戏剧性,揭示了顶级AI创业项目的融资生态。

时间节点的精心安排

配合商汤上市的节奏

  • 商汤在2021年11-12月上市
  • 颜俊杰作为核心高管,"不能在这么重要的节点里面过早退出公司"
  • 利用等待期"好好想清楚要做什么"
  • 最终选择国庆前陆续见投资人
  • Simon(叶一下属)提前在年中出来注册公司,做前期筹备工作

投资人阵容与决策层级

机构时间决策特点
云起资本(陈玉)最早接触天使投资人,基于多年友谊和技术认同
高瓴国庆前张磊和李良亲自谈,不涉及下面团队
米哈游国庆前第一批投资人
IDG11月插入周全"听到信息后亲自来谈",不在第一批
陈玉
基本上说MiniMax就是一个一把手的高度保密的项目。因为毕竟俊杰在商汤的位置非常重要——商汤最大的一个业务就是智慧城市,智慧城市的技术主要就是俊杰在负责。

后续融资轮次

连续加注

  • MiniMax共完成约五轮融资(含小轮)
  • 云起资本"基本上每一轮都在加"
  • 唯一一轮没加的原因:"那一轮只有一个投资人"——即红杉单独领投的那一轮,所有老股东均未参与
  • 估值已到二三十亿美元量级

十一、大模型降价潮:创业公司的生死考验

2024年国内大模型掀起了惨烈的降价潮,字节跳动甚至降了两个数量级。陈玉对此有清醒的判断。

降价对创业公司的影响

核心逻辑

大厂的"云+模型"交叉补贴模型

字节、阿里等大厂背后有庞大的云计算生意。"我可以模型只收你一个非常低廉的价钱,但是我可以在云计算上面去收你更多的费用。"这笔账对大厂算得过来,但创业公司"你就被卷入了价格战,可能是亏本的,但又没办法从其他地方把亏本的钱赚回来"。

MiniMax的应对策略:模型质量第一

陈玉
大家是愿意为最好的模型付出溢价的。你可能很难相信,在中国大模型API市场里面,GPT-4的占有率还是超过80%。大家是愿意为质量付费的。所以MiniMax采取的策略就是不断做好模型,在市场上占有率上面肯定有一席之地,不需要和大家去做价格战。

降价潮的正面效应

陈玉也承认降价潮有积极一面——"会加快大模型应用的普及,因为用模型的成本低了以后,更多人会去尝试"。

大模型竞争格局:大厂 vs 创业公司的筹码对比

十二、大模型的资本扑克牌:玩家分类与筹码逻辑

陈玉用"扑克牌"的比喻(呼应张小珺此前写的文章),清晰地分类了大模型赛道的各类玩家。

第一类:大厂——筹码最多的大户

两大优势

  • 资源充分:雄厚的经济实力
  • 业务协同:云计算与大模型之间的交叉补贴
  • 对大厂而言,投资创业公司"只是个看牌"——"投一点点获取信息,either后面巨额加注,或有助于自身业务发展"

第二类:头部创业公司——不同的战略路径

月之暗面(Moonshot)路线

  • 更注重品牌知名度
  • 产品做得不错,用户获客投入大
  • 但模型质量"并不是在第一梯队"
  • 要补的课是模型质量

MiniMax路线

  • 非常注重模型质量,"模型质量就是一切"
  • 不做过多PR,"在PR上相对比较少"
  • Toki作为差异化产品
  • "产品和商业模式相对比较领先"

第三类:中后部创业公司

智谱百川零一万物等——"最要解决的问题就是融资的问题,只有足够多的钱才能在牌桌上继续生存下去"。

Club Deal现象

为什么俱乐部交易在大模型融资中如此突出

  • 腾讯、红杉、顺为等投了好几家创业公司
  • 原因:"大家都还看不清楚,如果有个clear winner,所有钱都会投到那家上面去"
  • 有没有可能都没有机会?"这也是有可能的——到最后可能大厂收割所有人"
  • "哪怕已经跑了一年多了,这个答案还是不清晰的"
陈玉
你各融了十亿美元,但十亿美元就是大厂利润的一小小部分啊。

十三、创业公司的生态位危机与生存策略

这是本期访谈最核心的战略讨论——大模型创业公司到底有没有存在的必然性?

生态位问题的尖锐性

陈玉
现在所有大模型创业公司就不应该有任何幻想。没有商业模式到最后你都是不可持续的。

陈玉引用了李志飞在播客中提到的曾鸣教授观点——大模型创业公司"没有生态位"

竞争的两个结构性劣势

差异化程度不够大
切换成本(兼容OpenAI API)

创业公司的生存入围线

维度最低要求
模型质量不能比领先的开源模型差——"如果连这个都达不到,基本上没有存在的意义"
功能完整度多模态功能今年必须出来
商业模式无论2C产品还是2B收入,"必须要挣钱,不能永远亏损下去"

MiniMax的差异化优势

Toki是关键护城河

在所有大模型创业公司中,MiniMax是唯一拥有海外2C收费产品(Toki)的公司。"别人家没有这个产品,而且这个产品是能收得上来钱的。"这使得MiniMax不需要纯粹依赖API价格战或2B项目存活。

被收购的可能性

陈玉的判断

  • 可能性不大——估值放在那,"中国历史上没有出现过这么大的并购案"
  • 唯一的对标案例:饿了么被阿里以约90亿美金收购
  • 团队本身也不一定有意愿被收购

时间窗口的残酷真相

陈玉
现在留给创业公司的时间窗口,我觉得现在其实也是没有时间窗口的。他们现在就是在同台竞争。创业公司没有在任何方面去领先于大厂。

十四、Google文化遗产与人才密度的启示

陈玉在Google纽约工作五年的经历,深刻影响了他对AI创业公司组织能力的判断。

为什么选择纽约

陈玉
我面试完是晚上8点半,想出来找个餐馆吃饭,发现硅谷就没有什么好的餐馆那个时候还开门。就觉得说我还是需要生活的,所以就毫不犹豫选择了纽约。

早期Google的三个启示

启示一:文化驱动的组织

  • 招的都是市面上最好的人,自驱力强,有技术理想主义
  • 面试时专门有一个打分项——"这个候选人是否符合Google文化"
  • "要做一个理想驱动的公司,这样才能最大程度调动员工积极性"

启示二:基础设施的力量

  • Google是少有的能服务全球数十亿用户的公司
  • GFS、Bigtable、Spanner等论文让开源世界得以复刻——"大家都有了这套武器"
  • 这与OpenAI从开放到保守的轨迹如出一辙

启示三:人才扩散的长期效应

  • 黄峥(拼多多)、宿华(快手)、阳萌(安克)、李志飞(出门问问)均出自同期Google
  • "当年Google毫不夸张的说,就是和现在的OpenAI一样——最好的工程师的第一选择"

从Google到OpenAI的开放性悖论

Google早期慷慨发表论文(GFS、Bigtable、Spanner),让开源世界复刻了其基础设施,削弱了自身优势。OpenAI也经历了相同的轨迹——早期技术报告相对详细,后来"变得越来越保守",被讽刺为"CloseAI"。这个悖论说明:开放加速了生态繁荣,也加速了自身壁垒的瓦解

十五、关键数据汇总

数据项具体内容
美国AI工程师起薪初级工程师$20-30万/年
GPT-4在中国API市场份额超过80%
大模型API成本下降两年降1-2个数量级
GPT-4参数量1.8T
L2+方案成本元戎启行降至~$2000软硬件一体
多模态延迟改善从3-5秒 → 300毫秒
MiniMax融资轮次约5轮(含小轮)
MiniMax估值量级二三十亿美元
牌桌门槛融资$10亿+,否则无法保持竞争优势
牌桌上剩余玩家不到6家(陈玉判断)
Toki日活百万级
Toki注册用户千万级
Toki年收入千万美元级,全年预计数千万美元
GLOW用户规模数百万注册用户
MiniMax合伙人数约5人
早期Google员工数全球约4000人,2000名工程师
陈玉研究生毕业时间9个月
陈玉与叶一认识年限创业前5-7年

启示与延伸思考

1. 大模型竞争的壁垒从算法迁移到了资本和工程

CV时代算法无壁垒、免费送;大模型时代壁垒在于"能不能买到这么多算力,怎么用好这些算力"。这意味着融资能力本身成为竞争力的核心组成部分——融不到十亿美元就上不了牌桌。这是一个与互联网时代完全不同的竞争范式:不再是"车库里两个天才"能颠覆行业的时代。

2. "没有时间窗口"是最残酷也最清醒的判断

陈玉作为MiniMax的天使投资人,对创业公司的处境给出了极其坦诚的判断——"现在没有时间窗口,创业公司没有在任何方面领先于大厂"。这种来自利益相关方的清醒认知,比外部分析师的乐观或悲观更有说服力。它意味着创业公司的生存不能依赖"先发优势"或"时间差",只能依赖持续的差异化能力。

3. Toki的战略价值不仅是收入,更是"不可替代性"的证明

在所有大模型创业公司中,MiniMax是唯一拥有海外2C收费产品且收入达千万美元级的公司。Toki的存在使MiniMax不完全依赖API价格战,也不完全依赖2B项目制——它证明了模型能力可以转化为消费者愿意付费的产品体验。这是MiniMax在"没有生态位"的困境中挖出的一个生态位。

4. Club Deal现象暴露了AI投资的深层不确定性

腾讯、红杉、顺为等同时投资多家大模型公司,本质上是一种对冲策略——"大家都看不清楚"。这与互联网时代风投"押注单一赢家"的模式截然不同。陈玉甚至提出了一个极端可能:大厂收割所有人,所有创业公司都没有机会。在这种不确定性下,投资的心态从"发现赢家"变成了"避免错过任何可能的赢家"。

5. 大厂的"云+模型"交叉补贴是创业公司的结构性死敌

字节和阿里可以把模型API降到两个数量级的低价,因为"钱从云计算方面去挣"。创业公司没有这个腾挪空间——"你就被卷入价格战,亏本但没办法从其他地方赚回来"。这不是战术层面的价格战,而是商业模式层面的结构性碾压。MiniMax选择"模型质量第一"来回避价格战,但长期看这条路也需要持续的资本支撑。

6. "CEO亲自做模型"vs "CEO亲自做PR"——两种截然不同的公司哲学

陈玉对比了MiniMax和月之暗面的路线差异:颜俊杰"所有精力都在带模型团队",而月之暗面更注重品牌知名度和用户获客。这反映了两种对大模型竞争本质的不同理解——前者认为"模型质量就是一切",后者认为用户心智和分发效率更重要。最终哪条路线胜出,将定义中国大模型竞争的范式。

7. 约翰霍普金斯→商汤→MiniMax的人才流动链揭示了AI创业的根本规律

顶级学术机构培养的NLP人才流向Google/商汤等大平台获得工程化能力和行业认知,再出来创业做更大的事情。陈玉与叶一的七年友谊、李志飞的同学关系、多位师弟的加入——这个故事说明AI领域的天使投资不是"看项目",而是"看人脉网络中的信号积累"。最早的判断往往不是基于商业计划书,而是基于对人的长期观察。

延伸阅读