本期嘉宾李志飞,出门问问(Mobvoi)创始人兼CEO,前Google科学家。出门问问于2024年作为"AIGC第一股"在港交所完成上市,是中国AI领域历经12年创业磨砺后登陆资本市场的代表性案例。
对话发生在GPT-4o和Google I/O密集发布的同一周,李志飞既是AI技术的深度观察者,又是12年前沿科技创业的亲历者。他在节目中极其坦诚地分享了创业中的"狂妄与痛苦",包括几次濒临死亡的真实经历。
李志飞对IPO过程的描述与公众想象截然不同。他用"度日如年"来形容敲钟当天的感受。
李志飞表示敲钟当天反而没有太多感触——因为前一天晚上一切已确定,敲钟只是一个形式。真正的煎熬在于此前每一天"有可能过不去或者会延迟"的不确定性。
不是成就感或放松,而是不再需要做大量合规性工作。"上市前要做很多不太具备什么挑战或者创新的活,上市以后这些活可以少很多。"
李志飞分析了AI公司在港股上市面临的系统性困难。
李志飞提出了前沿科技创业的"漏斗模型"——一个解释为什么大量前沿科技公司最终沦为项目制的底层框架。
100个前沿科技中,大部分都无法通过漏斗检验。检验标准是:能否从技术包装成产品,能否形成商业模式,技术投入与商业价值能否匹配。但这不意味着技术没用——"10年以后环境变了、技术成熟了、需求成熟了,又可以重新经历漏斗检验。"
李志飞以2013年Google Glass为例说明前沿科技的循环特征——"当时大家都说'我们看到了未来',literally就是看到了未来。但是很快这个产品就没有发展起来。现在看到GPT-4o的眼镜,你觉得又看到了未来,就回来了。"
李志飞提出了一个极度压缩的生存公式:(1)你有一个先发优势;(2)你能利用这个先发优势建立壁垒,或找到巨头看不到的模式。"在竞争比较激烈的赛道里边,这可能是唯一能够生存下去的可能性。"再加上资本的不确定性——"就算你这个东西一看就是没希望,但有一个投资者就是要给你十亿美金"——可以续命。
李志飞对GPT-4o的技术突破给出了极其细致的分析,既有肯定也有独立判断。
李志飞对两场发布会做了直接对比,措辞相当犀利。
李志飞在技术层面的判断出人意料地直接:"我看不出来有什么本质性的差别。高度的同质化。"但他承认Google在应用形态上更加强大——"从TPU到操作系统到边缘计算再到各种应用的结合,全部都有。"
"多模态的交互一定会让广告的形式变得更加丰富、更加精准。"因此他认为AI与搜索的结合对Google来说不是威胁而是升级换代。但这只是"直觉,没有很强的判断"。
李志飞对Ilya Sutskever的评价极高,将其定位为OpenAI真正的"大赌大赢"推动者。
李志飞强调Ilya作为首席科学家"不一定要自己提出选择,甚至都不需要去做选哪一个"——他只要做出一个决策说OK就是巨大价值。"大部分决策者会说'我们再讨论一下'或'你们两个都做做实验给我看一看'。"
李志飞认为OpenAI作为一个"不是普通的公司",需要"很强的反共识能力"和"很强的赌博能力"。"那些东西新的CEO、别的那些人,我觉得肯定是没这种能力的。因为他不懂。"
这可能是整期节目中最具争议性的部分。李志飞对Sam Altman的评价用词极其直接。
李志飞将Sam Altman和Elon Musk归为同一类人——"宏大叙事,有限交付"。"先给你搞一个宏大叙事,让大家知道你就是来自未来的人。但他们跟骗子不太一样,因为绝大部分骗子是不做交付的。他们做有限的交付,只是交付跟前面说的一定差距很大。"
但李志飞也承认这种模式"对科技来说挺可贵的"——"可能对普通大众来说,只有他们这种才能够让大众认同、理解科技、给予更多关注,有了关注他才能拿到更多资源。"
在Sam和Musk之间,李志飞偏向Musk——"不管怎么样,做电动车这个事情是非常难的,他能够这么坚持做下去。虽然是宏大叙事,但我也觉得他应该还是在一线要干很多事情的。"言外之意:Sam是否在一线?"我不知道,我没看到。"
李志飞对中国几大巨头的AI策略做了简洁的判断框架——"每个公司都是基于自己的状态,对自己的认知,做出了一个惯性的选择。"
| 公司 | 策略 | 李志飞的判断 |
|---|---|---|
| 腾讯 | 佛系,不急 | "有微信怕啥?晚三个月跟早三个月有什么区别?"应该花更多时间思考大模型给用户带来的价值 |
| 阿里 | 激进绑定阿里云 | 一直都是流量焦虑。大模型对云来说可能是最重要的能力,"可以不靠大模型赚钱,大模型是引流,最好卖算力卖云服务" |
| 字节 | 大降价 | "窮的只剩下钱,没有什么想象力。"2B弱,只能重来一遍。API价格趋近于零是"必然的" |
| 百度 | 一把手工程 | "大模型跟搜索的结合是未来趋势,你不升级别人会升级" |
李志飞认为这不是新鲜事——AI 1.0时代语音识别TTS调用就出现过,巨头搞2B一进来就免费或"一元中标"。"只不过过去这几年因为经济不好消停了。字节2B很弱,进来能有什么招呢?不就是又重来一遍。"
李志飞提出了一个清晰的AI生态分层框架。
| 类别 | 定义 | 数量 | 特征 |
|---|---|---|---|
| 第一类 | 自研基础大模型,带领人类往前走 | 全球不超过十几个,中国三四个 | 消耗非常厉害,"一年亏十几亿美金二十亿美金",只有巨头能坚持 |
| 第二类 | 利用开源模型+自有模型能力,产模一体 | 中国四五十个 | 低功耗做模型,同时做产品。"绝大部分AI创业公司应该属于这一类" |
| 第三类 | 调用API或定制服务 | 大量应用方 | "折腾一阵子一定会发现不靠谱,自己花一千万没搞定,给第二类公司一百万搞得好好的" |
李志飞在湖畔大学将出门问问作为案例分析,提出的问题是:"在AIGC时代,三五年后AI工具还有没有生态位?"曾鸣教授的回答极其直接。
曾鸣的回答是:一定没有。但他说"你已经做得最好了"——因为你至少在浮冰上,不在水下。然后给出了生存姿态:
"如果你这个问题已经有答案,就不是个真问题了。因为它已经变成答案了,你应该问下一个问题。"——既然"没有生态位"是答案,那真正的问题应该变成:"在AIGC时代,你能够找到的生态位是什么?"逼迫创业者放弃幻想,往下思考。
李志飞用极其坦诚的方式回顾了出门问问从高峰到谷底的完整过程。
从Google回国创业,利用"Google科学家身份"获得了"不应该存在的优势"。
Google战略投资,"不是因为你有多牛,而是因为人家想干一个什么事情"。
使命驱动——"定义下一代人机交互"。做手表、耳机、音箱、车载设备。公司扩至千余人,项目"多如牛毛"。"用战术的勤奋掩盖战略的懒惰。"
"如果他晚给4个月可能也挂了,只是我不知道而已。"
只剩3-4亿人民币,但工资一年就要3亿多,还有4亿库存、20个线下门店。裁员25%,写信说"换挡加速"。
本以为2019年触底反弹,结果"底还有那么深"。账上只剩约2亿。从1000多人裁至不到300人。李志飞自认"都抑郁了"。
做配音工具,找到产品化的方向。"在配音的小圈子里面有知名度,但没人知道是我们公司干的——不知道是一个AI公司干的。"
AIGC第一股,但李志飞的感受是"对不起过去的努力"。
李志飞分享了他对"创业者幻觉"的深刻反思,以及2020年至暗时刻的具体操作。
"我跟一个CEO聊天,他跟我说这个巨头也看我们要投我们,我们的业务怎么样,接下来有什么规划。当时我就'哇真棒'。结果明天你看新闻说他们公司一半裁员。我遇到过很多这样的情况。"
李志飞认为创业者的幻觉不是性格问题——"某种程度上你不幻觉真的坚持不下去。"
李志飞总结了大量科技公司的共同命运:高点在融资那一刻。融资之后经历漫长的痛苦——"没有方向感,在竞争中那种无力感,对用户需求的无奈"。为了再融资又搞一些"莫名其妙的事情",窟窿越补越大。"第一天就进入了负循环。"
李志飞坦言自己以前"特别不喜欢讲战略",但在湖畔学习和与传统行业CEO交流后,总结出了一套框架。
李志飞反思:"以前想的很多东西的时候,可能就是密集掉其中一个很重要的因素。"出门问问做智能手表时"只有第一个要素(Vision),用户价值定位、生态位、目标、路径、节奏都没有想"。
节目尾声,李志飞道出了他在上市当晚真正的内心感受。
李志飞给出了一个具体标准:至少要有18个月的现金流。"如果没有18个月,我觉得就基本上就很难了。"而且要看的是毛利和营销成本,不是营收数字。
| 判断/数据 | 具体内容 |
|---|---|
| 创业历程 | 12年(2012-2024),经历语音助手、智能硬件、AIGC工具三个阶段 |
| 融资历程 | Google 4000万美元(2014)+ 大众1.8亿美元(2017),"如果各晚4个月可能就挂了" |
| 高峰人数 | 1000+人(2018),后裁至不到300人(2020) |
| IPO中介数量 | 四五十个(vs 私募融资三四个) |
| API价格趋势 | "趋近于零,无限接近于零",这是必然的 |
| 第一类公司数量 | 全球不超过十几个,中国三四个 |
| 第二类公司数量 | 中国约四五十个 |
| 现金流红线 | 至少18个月 |
| 多模态 vs GPT-5 | 多模态做好更重要,"没有多模态应用空间很难打开" |
| Agent判断 | "现在转Agent没有意义——空中楼阁" |
| 自回归 vs Diffusion | 信仰自回归统一所有模态,SORA走了另一个分支 |
| 对Sam Altman | "非常不喜欢,从来没获得任何认知,全部都是废话" |
| 对Ilya | "大势大德大赌大赢" |
| Sam与Musk分类 | 同一类人——"宏大叙事,有限交付" |
| 曾鸣的判断 | AI工具的生态位"一定没有",但"你已经做得最好了" |
| 战略六要素 | Vision、用户价值定位、生态位定位、短期目标、路径、节奏 |
| 创业者幻觉 | "某种程度上你不幻觉真的坚持不下去" |
| 出门问问定位 | Professional Consumer的AIGC工具,会员制,不做API/2B定制/2C订阅 |
| 中国复制GPT-4o难度 | 只加声音不难,加图片视频不好说。"中国绝大部分模型公司还在转语言模型,根本没有多模态能力" |
曾鸣给出的判断残酷但真实:当前AI工具的生态位"一定没有"。但生存策略也很清晰——低功耗运转,保持敏锐,练各种功夫,一旦AI Native的机会出现就纵身跳跃。李志飞将此延伸为第二类公司的具体操作:利用开源模型低功耗做模型能力,同时打磨产品,等待坚冰出现。
李志飞总结的模式——融资即高点,之后进入痛苦循环——并非个案,而是前沿科技创业的结构性特征。根源在于:技术不成熟+需求不清晰=必然定制化=规模不经济=依赖再融资=循环加深。出门问问用12年走完了这个完整循环,给出的教训极其具体。
这可能是本期最有实操价值的一句话。李志飞用自身失败案例说明:战略六要素中只有Vision(定义下一代人机交互)而缺少其他五个要素,导致了多年的盲目扩张和资源浪费。对当前大模型创业者的启示是:光说"AI改变世界"没有意义,关键是你的用户价值定位、生态位、目标、路径和节奏是什么。
李志飞给出了极其明确的技术路径排序:多模态稳定可用 > 视频生成统一 > 具身智能 > 推理提升 > Agent。他对当时Agent热潮的判断是"空中楼阁"。从2024年中至2026年的发展来看,这个判断在一定程度上得到了验证——Agent的大规模落地确实慢于预期,而多模态(GPT-4o、Gemini等)成为了应用突破的关键。
"宏大叙事,有限交付"的评价虽然犀利,但触及了一个根本问题:在前沿科技领域,宏大叙事到底是必要的融资策略还是对技术尊严的消解?李志飞自己承认"对科技来说挺可贵的",但作为技术出身的创业者,他本能地不信任这种模式。这种张力在整个AI行业普遍存在。
李志飞的观点发人深省——"某种程度上你不幻觉真的坚持不下去"。这意味着创业者的过度乐观不是认知缺陷,而是一种心理防御机制。问题不在于有没有幻觉,而在于能否在幻觉之外保持一个冷静的分析自我。出门问问的教训是:这个冷静的分析自我来得太晚了(2020年才开始做P&L核算)。
李志飞用一个画面说明了一切——"两个月以来第一次看到太阳降落"。他每天从早到晚开会,项目多如牛毛,但"唯一少想的就是竞争是啥、定位是啥"。1.8亿美元的融资买来的是"用战术的勤奋掩盖战略的懒惰"。这个教训对所有拿到大额融资的AI创业者都是警钟:钱越多,越容易跳过战略直接进入执行。