深度研究 — #68 和MiniMax天使投资人聊，MiniMax幕后故事和大模型资本扑克牌

← 返回张小珺主页

🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

嘉宾画像：从约翰霍普金斯到云起资本
GenAI大会见闻：硅谷的热闹与中美资本博弈
中美AI投资的四个关键差异
AI十年三波浪潮：从CV到自动驾驶到大模型
技术演进的启示：Corner Cases与成本铁律
MiniMax创业起源：约翰霍普金斯的NLP人脉网
与颜俊杰的三次会面：从方向到下注
商汤的局限与MiniMax的超越逻辑
产品演进：从超写实数字人到GLOW到Toki
融资内幕：高度保密的一把手项目
大模型降价潮：创业公司的生死考验
大模型的资本扑克牌：玩家分类与筹码逻辑
创业公司的生态位危机与生存策略
Google文化遗产与人才密度的启示
关键数据汇总

一、嘉宾画像：从约翰霍普金斯到云起资本

本期嘉宾陈玉是MiniMax的天使投资人，也是其第一位投资人，来自云起资本。他的履历横跨学术、工程、商学和投资四个领域，这种复合背景深刻影响了他对AI创业的判断方式。

约翰霍普金斯大学计算机系

9个月修完研究生课程毕业。与出门问问李志飞是同班同学，在信息提取与处理课程中是唯一拿到A+的学生。

Google纽约软件工程师（约5年）

参与个性化搜索、展示广告等工作。当时Google全球仅约4000人，其中2000名工程师。同期同事包括黄峥（拼多多）、宿华（快手）、阳萌（安克）等。

芝加哥大学商学院（2010-2012）

攻读MBA学位，完成从工程师到投资人的认知转型。

2014年加入云起资本

作为第一个投资人加入，负责AI、大数据、云计算、机器人、自动驾驶方向投资。投资策略：invest in global Chinese——投资全球华人创业者。

约翰霍普金斯的NLP人才网络

陈玉反复提及约翰霍普金斯是NLP领域创业者的摇篮。李志飞（出门问问）、MiniMax联创叶一、另一位合伙人均出自该校。这种校友网络直接促成了他与MiniMax的早期连接——叶一在商汤工作期间就已是陈玉的朋友，"在他真正创业前五六七年我们其实就已经成为了好朋友"。

二、GenAI大会见闻：硅谷的热闹与中美资本博弈

2024年5月下旬，一个名为GPTDAO的Web3组织在旧金山举办了为期三天的GenAI大会。陈玉分享了他在现场的观察。

大会的真实面貌

"草台班子"式的组织

第一天早上排队一两个小时才能进入会场
日程"直到最后一刻都还在不断的变化"
很多之前宣传的大牌演讲"到最后一刻也没有兑现"
但邀请到了NVIDIA巨神智能研究科学家、贾扬清等重量级嘉宾

陈玉坦言，绝大多数参会者的真实目的并非听会——而是趁此机会在硅谷见人。"很多人在国内想约，约不到，谁知道就是在三藩见面了。"在场的中国投资人包括红点刘岚、朱啸虎等。

陈玉

会议组织上还是有些问题的，不过能够把这么多人聚在一起，也是个不错的一个结果了。

三、中美AI投资的四个关键差异

陈玉通过与Goodwater等美国基金同学的交流，总结了中美AI投资环境的四个核心差异点。

$20-30万

美国AI初级工程师年薪

80%+

GPT-4在中国API市场占有率

$10亿+

大模型创业的牌桌门槛

#	维度	具体情况
1	对中国创始人的态度	美国VC不排斥中国创始人参与，只要商业运作在美国。开发团队在中国也可接受
2	AI估值水平	AI领域估值相对较高，其他方向"都不太行"。客观原因是AI工程师薪资昂贵，融资额必须大
3	不投中国的真实原因	不是中美纷争，而是退出环境恶劣——"配置中国企业到时会遇到有些退出的问题"
4	中国VC投美国项目	目前没有法案阻止，做好申报即可。但双币基金（管理过政府基金的）会被额外审视

中美投资条款的关键差异

回购权之争

美国VC惯例：协议中没有回购——因为回购条款会在税收上产生影响
中国VC惯例："总是需要有回购作为保护"
这只是众多条款差异中的一个，"中国VC得在实战中去慢慢学习"

"纯市场化"是关键分界线

陈玉明确指出：如果基金是纯市场化的，问题不大，"和国籍没什么关系"。但如果美元基金和中国政府关系紧密（如帮政府管理基金），在美国"大家是会比较担心的"。这意味着双币基金在美国AI投资中面临结构性劣势。

四、AI十年三波浪潮：从CV到自动驾驶到大模型

陈玉在AI投资领域深耕十年，他从技术和投资双重视角梳理了三波AI浪潮的演进逻辑。

AI十年三波浪潮时间线

浪潮	时间	技术驱动	代表公司/产品	结局/现状
计算机视觉	2014年前后	CNN卷积网络	AI四小龙（商汤等）	算法无壁垒，"很多时候算法都是免费送的"
自动驾驶	2016年起	端到端/L4路线	Waymo、百度、元戎启行	L4规模不经济，退而求其次走L2+
大模型	2022.11起	Transformer scale up	OpenAI、MiniMax、月之暗面	竞争惨烈，尚未分出胜负

技术路线的关键转折

2012年深度学习兴起

CNN、DNN、RNN等技术出现，迸发第一波AI应用。

2016-2017年 Transformer与BERT分叉

Google提出Transformer，随后选择了BERT路线。2017-2021年间BERT占据主导位置。

2021-2022年 Transformer逆袭

大家发现Transformer在scale up时"表现非常非常好，出乎大家的意料"。此后所有大模型都基于Transformer。

2023年下半年 MOE架构

Scale up遇到困难、推理成本高昂，诞生了MoE（混合专家模型）架构。

2024年多模态时代

Sora（视频生成）、GPT-4o（多模态融合）出现，实现任意模态输入输出，延迟从3-5秒降到300毫秒。

核心判断

大模型对前两波浪潮的吞噬效应

计算机视觉：多模态模型可以直接处理图像和视频，"基本上可以把CV赛道给吞噬掉"。自动驾驶：则不会被吞噬——"无图加端到端的L3方案已经非常好了，不需要这么大参数量，是个更加经济有效的方法"。

五、技术演进的启示：Corner Cases与成本铁律

陈玉从前两波AI浪潮中提炼了三条对大模型至关重要的启示。

启示一：完美不可能，但逼近有价值

陈玉

你能不能期望说大模型完全没有幻觉？答案肯定是否定的。能做到的只是说无限的去逼近这个理想的状态，但是永远是不可能做到100%准确的。其实就是和人是一样的，人自己也会犯错。

启示二：成本是商业模式成立的铁律

从自动驾驶到大模型的成本逻辑

自动驾驶L4难落地，除了Corner Cases外，"更大的原因还是成本问题——当AI比人力贵，AI肯定很难普及"
大模型成本两年内下降了一到两个数量级，"这个还是令人欣喜的"
元戎启行将软硬件方案成本降到2000美元，终端消费者加价2-3万人民币——远比特斯拉FSD的99美元/月方案划算

启示三：算力和能源成为新瓶颈

算力瓶颈

GPT-4参数量已达1.8T
多模态和GPT-5参数量将进一步提升
受限于台积电产能（但"始终会被解决"）

能源瓶颈

"更难解决的问题"
美国大厂开始减少本土数据中心投资
可能转向北欧等电费便宜的地区
中国有核电优势

六、MiniMax创业起源：约翰霍普金斯的NLP人脉网

MiniMax的创业故事与约翰霍普金斯大学的NLP学术圈密不可分。陈玉从第一视角还原了这个故事的起点。

核心人物关系

约翰霍普金斯的校友网络

陈玉（投资人）——约翰霍普金斯计算机系研究生
李志飞（出门问问创始人）——陈玉的同班同学，后来都在Google
叶一（MiniMax联创）——陈玉的师弟
Simon（叶一的下属，后创立VAST做3D）——同为师弟
至少还有一位合伙人出自该校

陈玉与叶一的关系始于叶一大四毕业回商汤工作时期——"在他真正创业前五六七年前，我们其实就已经成为了好朋友"。他亲眼目睹了叶一在商汤的成长。

叶一创业的两个前提条件

陈玉

叶一早在18、19年其实就已经有创业的想法了。但我觉得他一直没有付诸行动，可能原因有几个：一个是说他没有找到合适的团队，第二个就是可能没有一个足够大的方向。因为叶一已经在商汤做的非常成功了，如果他要出来创业的话，他做的事情肯定要比商汤本身在做的事情要更大，他才愿意出来。

七、与颜俊杰的三次会面：从方向到下注

2021年初，叶一终于找到了他的创业伙伴和方向。陈玉还原了投资MiniMax的决策过程。

第一次见面：上海某餐厅

叶一告诉陈玉他准备出来创业，方向是用基础模型解决AI问题，最终实现通用人工智能——"做中国的OpenAI"。陈玉表示要把创业伙伴介绍给他认识。

第二次见面：认识颜俊杰（IO）

陈玉认识了颜俊杰。团队内部叫他IO——"计算机里面就是input output，最常见的一个缩写"。

第三次及后续：深入讨论Foundation Model

讨论了多个落地方向：智慧城市、智慧文旅、类Talkie社交、超写实数字人等。

为什么陈玉对颜俊杰有"好感度"

两个与众不同之处

第一：颜俊杰是第一个与陈玉"这么深入的去聊Foundation Model"的人。当时主流还是BERT及其变种，几乎所有AI项目都说"我是用了BERT"
第二：他想解决一个"特别特别大"的问题——通用人工智能。"如果你没有足够的野心，然后对自己没有足够多的自信，是很难去想到要做这么个创业的"

投资决策的坦诚

陈玉坦言："其实当时是没有判断的。"在2021年初，OpenAI还没有像今天这样火爆。他的下注更多基于对创始人的信任和对方向的认同，而非清晰的商业逻辑——这恰恰是天使投资的本质。

八、商汤的局限与MiniMax的超越逻辑

MiniMax的核心团队来自商汤，理解商汤的局限性是理解MiniMax选择的钥匙。

从投资人视角看商汤的两个结构性问题

问题一：项目制低人效

做大量2B项目
"不是像产品一样可以低成本scale up"
必须一个个项目地做
人效比较低的商业模式

问题二：CV算法无壁垒

任何人通过论文和开源代码即可实现
"到后面很多时候算法都是免费送的"
帮手机做方案、做安防项目时壁垒极低

大模型与CV的壁垒差异

核心对比

大模型的壁垒不在算法，在算力

与CV不同，大模型的"难点不是在算法，难点是你能不能够买到这么多的算力，然后怎么去用好这些算力"。融不到十亿美元以上，"你就上不了牌桌"。这意味着大模型竞争从公司数目上远小于当年CV公司——壁垒从算法转移到了资本和工程。

颜俊杰的管理风格

特别理性——做事有自己的逻辑和方法论，有严密的推理
技术+商业双重敏感——"不单止从技术上考虑问题，也会从商业上考虑"
模型质量至上——"所有精力都在带模型团队"，CEO亲自一线做模型
不搞小团体——创始人只有颜俊杰和叶一，其他人统一叫"合伙人"（共约5人）
人才不限来源——虽然商汤和字节占比较高，但"只要有能力都愿意招"

九、产品演进：从超写实数字人到GLOW到Toki

MiniMax的产品线经历了一条清晰的演进路径，从技术验证到商业闭环。

早期：超写实数字人

办公室里有巨大的单反摄像机阵列，通过多角度数据采集完成精确3D建模。当时全球只有MiniMax和Meta拥有类似技术。同时发展了声音和文字基础模型——"一开始就开始做多模态"。

2022年末：GLOW

"半玩票性质"推出，界面粗糙但模型强大。迅速获得数百万注册用户，风靡小红书。很多人怀疑背后是真人回答——"说明这个模型做得蛮好的"。本质上是图灵测试。后因网信办监管要求下架。

2023年：海螺AI、Toki

张前川（原今日头条用户产品负责人）加入，由高瓴牵线。Toki面向海外市场，日活百万级，注册用户千万级，年收入达千万美元级，预计全年可达数千万美元。

MiniMax 产品演进与商业化路径

张前川加入的故事

从独立创业到加入平台

张前川本想独立创业，被投资人（高瓴）说服加入MiniMax
背景：百度（搜索） → 字节（今日头条用户产品负责人） → MiniMax
没有在美国生活过，却打造了风靡美国的产品——"靠产品直觉和数据分析"

GLOW的战略意义远超产品本身

GLOW看似"半玩票"，实则是MiniMax进行的一次大规模图灵测试。它验证了文字基础模型的质量，积累了真实用户交互数据，并为后续Toki的社交AI产品路线奠定了基础。下架并非失败——"真正MiniMax想做的是后面Toki的那款产品"。

十、融资内幕：高度保密的一把手项目

MiniMax的融资过程充满了戏剧性，揭示了顶级AI创业项目的融资生态。

时间节点的精心安排

配合商汤上市的节奏

商汤在2021年11-12月上市
颜俊杰作为核心高管，"不能在这么重要的节点里面过早退出公司"
利用等待期"好好想清楚要做什么"
最终选择国庆前陆续见投资人
Simon（叶一下属）提前在年中出来注册公司，做前期筹备工作

投资人阵容与决策层级

机构	时间	决策特点
云起资本（陈玉）	最早接触	天使投资人，基于多年友谊和技术认同
高瓴	国庆前	张磊和李良亲自谈，不涉及下面团队
米哈游	国庆前	第一批投资人
IDG	11月插入	周全"听到信息后亲自来谈"，不在第一批

陈玉

基本上说MiniMax就是一个一把手的高度保密的项目。因为毕竟俊杰在商汤的位置非常重要——商汤最大的一个业务就是智慧城市，智慧城市的技术主要就是俊杰在负责。

后续融资轮次

连续加注

MiniMax共完成约五轮融资（含小轮）
云起资本"基本上每一轮都在加"
唯一一轮没加的原因："那一轮只有一个投资人"——即红杉单独领投的那一轮，所有老股东均未参与
估值已到二三十亿美元量级

十一、大模型降价潮：创业公司的生死考验

2024年国内大模型掀起了惨烈的降价潮，字节跳动甚至降了两个数量级。陈玉对此有清醒的判断。

降价对创业公司的影响

核心逻辑

大厂的"云+模型"交叉补贴模型

字节、阿里等大厂背后有庞大的云计算生意。"我可以模型只收你一个非常低廉的价钱，但是我可以在云计算上面去收你更多的费用。"这笔账对大厂算得过来，但创业公司"你就被卷入了价格战，可能是亏本的，但又没办法从其他地方把亏本的钱赚回来"。

MiniMax的应对策略：模型质量第一

陈玉

大家是愿意为最好的模型付出溢价的。你可能很难相信，在中国大模型API市场里面，GPT-4的占有率还是超过80%。大家是愿意为质量付费的。所以MiniMax采取的策略就是不断做好模型，在市场上占有率上面肯定有一席之地，不需要和大家去做价格战。

降价潮的正面效应

陈玉也承认降价潮有积极一面——"会加快大模型应用的普及，因为用模型的成本低了以后，更多人会去尝试"。

大模型竞争格局：大厂 vs 创业公司的筹码对比

十二、大模型的资本扑克牌：玩家分类与筹码逻辑

陈玉用"扑克牌"的比喻（呼应张小珺此前写的文章），清晰地分类了大模型赛道的各类玩家。

第一类：大厂——筹码最多的大户

两大优势

资源充分：雄厚的经济实力
业务协同：云计算与大模型之间的交叉补贴
对大厂而言，投资创业公司"只是个看牌"——"投一点点获取信息，either后面巨额加注，或有助于自身业务发展"

第二类：头部创业公司——不同的战略路径

月之暗面（Moonshot）路线

更注重品牌知名度
产品做得不错，用户获客投入大
但模型质量"并不是在第一梯队"
要补的课是模型质量

MiniMax路线

非常注重模型质量，"模型质量就是一切"
不做过多PR，"在PR上相对比较少"
有Toki作为差异化产品
"产品和商业模式相对比较领先"

第三类：中后部创业公司

智谱、百川、零一万物等——"最要解决的问题就是融资的问题，只有足够多的钱才能在牌桌上继续生存下去"。

Club Deal现象

为什么俱乐部交易在大模型融资中如此突出

腾讯、红杉、顺为等投了好几家创业公司
原因："大家都还看不清楚，如果有个clear winner，所有钱都会投到那家上面去"
有没有可能都没有机会？"这也是有可能的——到最后可能大厂收割所有人"
"哪怕已经跑了一年多了，这个答案还是不清晰的"

陈玉

你各融了十亿美元，但十亿美元就是大厂利润的一小小部分啊。

十三、创业公司的生态位危机与生存策略

这是本期访谈最核心的战略讨论——大模型创业公司到底有没有存在的必然性？

生态位问题的尖锐性

陈玉

现在所有大模型创业公司就不应该有任何幻想。没有商业模式到最后你都是不可持续的。

陈玉引用了李志飞在播客中提到的曾鸣教授观点——大模型创业公司"没有生态位"。

竞争的两个结构性劣势

低

差异化程度不够大

低

切换成本（兼容OpenAI API）

创业公司的生存入围线

维度	最低要求
模型质量	不能比领先的开源模型差——"如果连这个都达不到，基本上没有存在的意义"
功能完整度	多模态功能今年必须出来
商业模式	无论2C产品还是2B收入，"必须要挣钱，不能永远亏损下去"

MiniMax的差异化优势

Toki是关键护城河

在所有大模型创业公司中，MiniMax是唯一拥有海外2C收费产品（Toki）的公司。"别人家没有这个产品，而且这个产品是能收得上来钱的。"这使得MiniMax不需要纯粹依赖API价格战或2B项目存活。

被收购的可能性

陈玉的判断

可能性不大——估值放在那，"中国历史上没有出现过这么大的并购案"
唯一的对标案例：饿了么被阿里以约90亿美金收购
团队本身也不一定有意愿被收购

时间窗口的残酷真相

陈玉

现在留给创业公司的时间窗口，我觉得现在其实也是没有时间窗口的。他们现在就是在同台竞争。创业公司没有在任何方面去领先于大厂。

十四、Google文化遗产与人才密度的启示

陈玉在Google纽约工作五年的经历，深刻影响了他对AI创业公司组织能力的判断。

为什么选择纽约

陈玉

我面试完是晚上8点半，想出来找个餐馆吃饭，发现硅谷就没有什么好的餐馆那个时候还开门。就觉得说我还是需要生活的，所以就毫不犹豫选择了纽约。

早期Google的三个启示

启示一：文化驱动的组织

招的都是市面上最好的人，自驱力强，有技术理想主义
面试时专门有一个打分项——"这个候选人是否符合Google文化"
"要做一个理想驱动的公司，这样才能最大程度调动员工积极性"

启示二：基础设施的力量

Google是少有的能服务全球数十亿用户的公司
GFS、Bigtable、Spanner等论文让开源世界得以复刻——"大家都有了这套武器"
这与OpenAI从开放到保守的轨迹如出一辙

启示三：人才扩散的长期效应

黄峥（拼多多）、宿华（快手）、阳萌（安克）、李志飞（出门问问）均出自同期Google
"当年Google毫不夸张的说，就是和现在的OpenAI一样——最好的工程师的第一选择"

从Google到OpenAI的开放性悖论

Google早期慷慨发表论文（GFS、Bigtable、Spanner），让开源世界复刻了其基础设施，削弱了自身优势。OpenAI也经历了相同的轨迹——早期技术报告相对详细，后来"变得越来越保守"，被讽刺为"CloseAI"。这个悖论说明：开放加速了生态繁荣，也加速了自身壁垒的瓦解。

十五、关键数据汇总

数据项	具体内容
美国AI工程师起薪	初级工程师$20-30万/年
GPT-4在中国API市场份额	超过80%
大模型API成本下降	两年降1-2个数量级
GPT-4参数量	1.8T
L2+方案成本	元戎启行降至~$2000软硬件一体
多模态延迟改善	从3-5秒 → 300毫秒
MiniMax融资轮次	约5轮（含小轮）
MiniMax估值量级	二三十亿美元
牌桌门槛	融资$10亿+，否则无法保持竞争优势
牌桌上剩余玩家	不到6家（陈玉判断）
Toki日活	百万级
Toki注册用户	千万级
Toki年收入	千万美元级，全年预计数千万美元
GLOW用户规模	数百万注册用户
MiniMax合伙人数	约5人
早期Google员工数	全球约4000人，2000名工程师
陈玉研究生毕业时间	9个月
陈玉与叶一认识年限	创业前5-7年

启示与延伸思考

1. 大模型竞争的壁垒从算法迁移到了资本和工程

CV时代算法无壁垒、免费送；大模型时代壁垒在于"能不能买到这么多算力，怎么用好这些算力"。这意味着融资能力本身成为竞争力的核心组成部分——融不到十亿美元就上不了牌桌。这是一个与互联网时代完全不同的竞争范式：不再是"车库里两个天才"能颠覆行业的时代。

2. "没有时间窗口"是最残酷也最清醒的判断

陈玉作为MiniMax的天使投资人，对创业公司的处境给出了极其坦诚的判断——"现在没有时间窗口，创业公司没有在任何方面领先于大厂"。这种来自利益相关方的清醒认知，比外部分析师的乐观或悲观更有说服力。它意味着创业公司的生存不能依赖"先发优势"或"时间差"，只能依赖持续的差异化能力。

3. Toki的战略价值不仅是收入，更是"不可替代性"的证明

在所有大模型创业公司中，MiniMax是唯一拥有海外2C收费产品且收入达千万美元级的公司。Toki的存在使MiniMax不完全依赖API价格战，也不完全依赖2B项目制——它证明了模型能力可以转化为消费者愿意付费的产品体验。这是MiniMax在"没有生态位"的困境中挖出的一个生态位。

4. Club Deal现象暴露了AI投资的深层不确定性

腾讯、红杉、顺为等同时投资多家大模型公司，本质上是一种对冲策略——"大家都看不清楚"。这与互联网时代风投"押注单一赢家"的模式截然不同。陈玉甚至提出了一个极端可能：大厂收割所有人，所有创业公司都没有机会。在这种不确定性下，投资的心态从"发现赢家"变成了"避免错过任何可能的赢家"。

5. 大厂的"云+模型"交叉补贴是创业公司的结构性死敌

字节和阿里可以把模型API降到两个数量级的低价，因为"钱从云计算方面去挣"。创业公司没有这个腾挪空间——"你就被卷入价格战，亏本但没办法从其他地方赚回来"。这不是战术层面的价格战，而是商业模式层面的结构性碾压。MiniMax选择"模型质量第一"来回避价格战，但长期看这条路也需要持续的资本支撑。

6. "CEO亲自做模型"vs "CEO亲自做PR"——两种截然不同的公司哲学

陈玉对比了MiniMax和月之暗面的路线差异：颜俊杰"所有精力都在带模型团队"，而月之暗面更注重品牌知名度和用户获客。这反映了两种对大模型竞争本质的不同理解——前者认为"模型质量就是一切"，后者认为用户心智和分发效率更重要。最终哪条路线胜出，将定义中国大模型竞争的范式。

7. 约翰霍普金斯→商汤→MiniMax的人才流动链揭示了AI创业的根本规律

顶级学术机构培养的NLP人才流向Google/商汤等大平台获得工程化能力和行业认知，再出来创业做更大的事情。陈玉与叶一的七年友谊、李志飞的同学关系、多位师弟的加入——这个故事说明AI领域的天使投资不是"看项目"，而是"看人脉网络中的信号积累"。最早的判断往往不是基于商业计划书，而是基于对人的长期观察。

MiniMax幕后故事和大模型资本扑克牌

目录