本期嘉宾陈玉是MiniMax的天使投资人,也是其第一位投资人,来自云起资本。他的履历横跨学术、工程、商学和投资四个领域,这种复合背景深刻影响了他对AI创业的判断方式。
9个月修完研究生课程毕业。与出门问问李志飞是同班同学,在信息提取与处理课程中是唯一拿到A+的学生。
参与个性化搜索、展示广告等工作。当时Google全球仅约4000人,其中2000名工程师。同期同事包括黄峥(拼多多)、宿华(快手)、阳萌(安克)等。
攻读MBA学位,完成从工程师到投资人的认知转型。
作为第一个投资人加入,负责AI、大数据、云计算、机器人、自动驾驶方向投资。投资策略:invest in global Chinese——投资全球华人创业者。
陈玉反复提及约翰霍普金斯是NLP领域创业者的摇篮。李志飞(出门问问)、MiniMax联创叶一、另一位合伙人均出自该校。这种校友网络直接促成了他与MiniMax的早期连接——叶一在商汤工作期间就已是陈玉的朋友,"在他真正创业前五六七年我们其实就已经成为了好朋友"。
2024年5月下旬,一个名为GPTDAO的Web3组织在旧金山举办了为期三天的GenAI大会。陈玉分享了他在现场的观察。
陈玉坦言,绝大多数参会者的真实目的并非听会——而是趁此机会在硅谷见人。"很多人在国内想约,约不到,谁知道就是在三藩见面了。"在场的中国投资人包括红点刘岚、朱啸虎等。
陈玉通过与Goodwater等美国基金同学的交流,总结了中美AI投资环境的四个核心差异点。
| # | 维度 | 具体情况 |
|---|---|---|
| 1 | 对中国创始人的态度 | 美国VC不排斥中国创始人参与,只要商业运作在美国。开发团队在中国也可接受 |
| 2 | AI估值水平 | AI领域估值相对较高,其他方向"都不太行"。客观原因是AI工程师薪资昂贵,融资额必须大 |
| 3 | 不投中国的真实原因 | 不是中美纷争,而是退出环境恶劣——"配置中国企业到时会遇到有些退出的问题" |
| 4 | 中国VC投美国项目 | 目前没有法案阻止,做好申报即可。但双币基金(管理过政府基金的)会被额外审视 |
陈玉明确指出:如果基金是纯市场化的,问题不大,"和国籍没什么关系"。但如果美元基金和中国政府关系紧密(如帮政府管理基金),在美国"大家是会比较担心的"。这意味着双币基金在美国AI投资中面临结构性劣势。
陈玉在AI投资领域深耕十年,他从技术和投资双重视角梳理了三波AI浪潮的演进逻辑。
| 浪潮 | 时间 | 技术驱动 | 代表公司/产品 | 结局/现状 |
|---|---|---|---|---|
| 计算机视觉 | 2014年前后 | CNN卷积网络 | AI四小龙(商汤等) | 算法无壁垒,"很多时候算法都是免费送的" |
| 自动驾驶 | 2016年起 | 端到端/L4路线 | Waymo、百度、元戎启行 | L4规模不经济,退而求其次走L2+ |
| 大模型 | 2022.11起 | Transformer scale up | OpenAI、MiniMax、月之暗面 | 竞争惨烈,尚未分出胜负 |
CNN、DNN、RNN等技术出现,迸发第一波AI应用。
Google提出Transformer,随后选择了BERT路线。2017-2021年间BERT占据主导位置。
大家发现Transformer在scale up时"表现非常非常好,出乎大家的意料"。此后所有大模型都基于Transformer。
Scale up遇到困难、推理成本高昂,诞生了MoE(混合专家模型)架构。
Sora(视频生成)、GPT-4o(多模态融合)出现,实现任意模态输入输出,延迟从3-5秒降到300毫秒。
计算机视觉:多模态模型可以直接处理图像和视频,"基本上可以把CV赛道给吞噬掉"。自动驾驶:则不会被吞噬——"无图加端到端的L3方案已经非常好了,不需要这么大参数量,是个更加经济有效的方法"。
陈玉从前两波AI浪潮中提炼了三条对大模型至关重要的启示。
MiniMax的创业故事与约翰霍普金斯大学的NLP学术圈密不可分。陈玉从第一视角还原了这个故事的起点。
陈玉与叶一的关系始于叶一大四毕业回商汤工作时期——"在他真正创业前五六七年前,我们其实就已经成为了好朋友"。他亲眼目睹了叶一在商汤的成长。
2021年初,叶一终于找到了他的创业伙伴和方向。陈玉还原了投资MiniMax的决策过程。
叶一告诉陈玉他准备出来创业,方向是用基础模型解决AI问题,最终实现通用人工智能——"做中国的OpenAI"。陈玉表示要把创业伙伴介绍给他认识。
陈玉认识了颜俊杰。团队内部叫他IO——"计算机里面就是input output,最常见的一个缩写"。
讨论了多个落地方向:智慧城市、智慧文旅、类Talkie社交、超写实数字人等。
陈玉坦言:"其实当时是没有判断的。"在2021年初,OpenAI还没有像今天这样火爆。他的下注更多基于对创始人的信任和对方向的认同,而非清晰的商业逻辑——这恰恰是天使投资的本质。
MiniMax的核心团队来自商汤,理解商汤的局限性是理解MiniMax选择的钥匙。
与CV不同,大模型的"难点不是在算法,难点是你能不能够买到这么多的算力,然后怎么去用好这些算力"。融不到十亿美元以上,"你就上不了牌桌"。这意味着大模型竞争从公司数目上远小于当年CV公司——壁垒从算法转移到了资本和工程。
MiniMax的产品线经历了一条清晰的演进路径,从技术验证到商业闭环。
办公室里有巨大的单反摄像机阵列,通过多角度数据采集完成精确3D建模。当时全球只有MiniMax和Meta拥有类似技术。同时发展了声音和文字基础模型——"一开始就开始做多模态"。
"半玩票性质"推出,界面粗糙但模型强大。迅速获得数百万注册用户,风靡小红书。很多人怀疑背后是真人回答——"说明这个模型做得蛮好的"。本质上是图灵测试。后因网信办监管要求下架。
张前川(原今日头条用户产品负责人)加入,由高瓴牵线。Toki面向海外市场,日活百万级,注册用户千万级,年收入达千万美元级,预计全年可达数千万美元。
GLOW看似"半玩票",实则是MiniMax进行的一次大规模图灵测试。它验证了文字基础模型的质量,积累了真实用户交互数据,并为后续Toki的社交AI产品路线奠定了基础。下架并非失败——"真正MiniMax想做的是后面Toki的那款产品"。
MiniMax的融资过程充满了戏剧性,揭示了顶级AI创业项目的融资生态。
| 机构 | 时间 | 决策特点 |
|---|---|---|
| 云起资本(陈玉) | 最早接触 | 天使投资人,基于多年友谊和技术认同 |
| 高瓴 | 国庆前 | 张磊和李良亲自谈,不涉及下面团队 |
| 米哈游 | 国庆前 | 第一批投资人 |
| IDG | 11月插入 | 周全"听到信息后亲自来谈",不在第一批 |
2024年国内大模型掀起了惨烈的降价潮,字节跳动甚至降了两个数量级。陈玉对此有清醒的判断。
字节、阿里等大厂背后有庞大的云计算生意。"我可以模型只收你一个非常低廉的价钱,但是我可以在云计算上面去收你更多的费用。"这笔账对大厂算得过来,但创业公司"你就被卷入了价格战,可能是亏本的,但又没办法从其他地方把亏本的钱赚回来"。
陈玉也承认降价潮有积极一面——"会加快大模型应用的普及,因为用模型的成本低了以后,更多人会去尝试"。
陈玉用"扑克牌"的比喻(呼应张小珺此前写的文章),清晰地分类了大模型赛道的各类玩家。
智谱、百川、零一万物等——"最要解决的问题就是融资的问题,只有足够多的钱才能在牌桌上继续生存下去"。
这是本期访谈最核心的战略讨论——大模型创业公司到底有没有存在的必然性?
陈玉引用了李志飞在播客中提到的曾鸣教授观点——大模型创业公司"没有生态位"。
| 维度 | 最低要求 |
|---|---|
| 模型质量 | 不能比领先的开源模型差——"如果连这个都达不到,基本上没有存在的意义" |
| 功能完整度 | 多模态功能今年必须出来 |
| 商业模式 | 无论2C产品还是2B收入,"必须要挣钱,不能永远亏损下去" |
在所有大模型创业公司中,MiniMax是唯一拥有海外2C收费产品(Toki)的公司。"别人家没有这个产品,而且这个产品是能收得上来钱的。"这使得MiniMax不需要纯粹依赖API价格战或2B项目存活。
陈玉在Google纽约工作五年的经历,深刻影响了他对AI创业公司组织能力的判断。
Google早期慷慨发表论文(GFS、Bigtable、Spanner),让开源世界复刻了其基础设施,削弱了自身优势。OpenAI也经历了相同的轨迹——早期技术报告相对详细,后来"变得越来越保守",被讽刺为"CloseAI"。这个悖论说明:开放加速了生态繁荣,也加速了自身壁垒的瓦解。
| 数据项 | 具体内容 |
|---|---|
| 美国AI工程师起薪 | 初级工程师$20-30万/年 |
| GPT-4在中国API市场份额 | 超过80% |
| 大模型API成本下降 | 两年降1-2个数量级 |
| GPT-4参数量 | 1.8T |
| L2+方案成本 | 元戎启行降至~$2000软硬件一体 |
| 多模态延迟改善 | 从3-5秒 → 300毫秒 |
| MiniMax融资轮次 | 约5轮(含小轮) |
| MiniMax估值量级 | 二三十亿美元 |
| 牌桌门槛 | 融资$10亿+,否则无法保持竞争优势 |
| 牌桌上剩余玩家 | 不到6家(陈玉判断) |
| Toki日活 | 百万级 |
| Toki注册用户 | 千万级 |
| Toki年收入 | 千万美元级,全年预计数千万美元 |
| GLOW用户规模 | 数百万注册用户 |
| MiniMax合伙人数 | 约5人 |
| 早期Google员工数 | 全球约4000人,2000名工程师 |
| 陈玉研究生毕业时间 | 9个月 |
| 陈玉与叶一认识年限 | 创业前5-7年 |
CV时代算法无壁垒、免费送;大模型时代壁垒在于"能不能买到这么多算力,怎么用好这些算力"。这意味着融资能力本身成为竞争力的核心组成部分——融不到十亿美元就上不了牌桌。这是一个与互联网时代完全不同的竞争范式:不再是"车库里两个天才"能颠覆行业的时代。
陈玉作为MiniMax的天使投资人,对创业公司的处境给出了极其坦诚的判断——"现在没有时间窗口,创业公司没有在任何方面领先于大厂"。这种来自利益相关方的清醒认知,比外部分析师的乐观或悲观更有说服力。它意味着创业公司的生存不能依赖"先发优势"或"时间差",只能依赖持续的差异化能力。
在所有大模型创业公司中,MiniMax是唯一拥有海外2C收费产品且收入达千万美元级的公司。Toki的存在使MiniMax不完全依赖API价格战,也不完全依赖2B项目制——它证明了模型能力可以转化为消费者愿意付费的产品体验。这是MiniMax在"没有生态位"的困境中挖出的一个生态位。
腾讯、红杉、顺为等同时投资多家大模型公司,本质上是一种对冲策略——"大家都看不清楚"。这与互联网时代风投"押注单一赢家"的模式截然不同。陈玉甚至提出了一个极端可能:大厂收割所有人,所有创业公司都没有机会。在这种不确定性下,投资的心态从"发现赢家"变成了"避免错过任何可能的赢家"。
字节和阿里可以把模型API降到两个数量级的低价,因为"钱从云计算方面去挣"。创业公司没有这个腾挪空间——"你就被卷入价格战,亏本但没办法从其他地方赚回来"。这不是战术层面的价格战,而是商业模式层面的结构性碾压。MiniMax选择"模型质量第一"来回避价格战,但长期看这条路也需要持续的资本支撑。
陈玉对比了MiniMax和月之暗面的路线差异:颜俊杰"所有精力都在带模型团队",而月之暗面更注重品牌知名度和用户获客。这反映了两种对大模型竞争本质的不同理解——前者认为"模型质量就是一切",后者认为用户心智和分发效率更重要。最终哪条路线胜出,将定义中国大模型竞争的范式。
顶级学术机构培养的NLP人才流向Google/商汤等大平台获得工程化能力和行业认知,再出来创业做更大的事情。陈玉与叶一的七年友谊、李志飞的同学关系、多位师弟的加入——这个故事说明AI领域的天使投资不是"看项目",而是"看人脉网络中的信号积累"。最早的判断往往不是基于商业计划书,而是基于对人的长期观察。