本期对话发生在一个极为特殊的背景下。主持人张小珺在2024年初撰写了《2024 AI 三部曲》系列深度报道,分别对话三位代表性人物,形成了中国AI大模型创业的三极叙事框架:
《对话月之暗面杨植麟:向延绵而未知的雪山前进》——代表技术信仰派,相信基础模型能力决定一切,坚定追赶Scaling Law。
《朱啸虎讲了一个中国现实主义AIGC故事》——代表市场信仰派,质疑中国创业公司做大模型的合理性,主张务实变现。朱啸虎在文中三次点名王小川和百川智能。
《王小川想提出中国AGI第三种可能性》——被朱啸虎三次点名后,王小川接受访谈,试图阐释一条既不是纯技术信仰、也不是纯市场务实的中间路线。
这不仅是三篇访谈,而是折射了2024年初中国AI大模型创业最核心的路线之争:技术信仰者认为应该不计代价追赶OpenAI、Scaling Law就是一切;市场务实派认为中国公司没有资格和条件做基座模型,应该基于开源做应用;王小川试图在两者之间找到第三条路——"理想上慢一步,落地上快三步"。
2024年初,中国大模型创业已进入"200多家混战"的红海阶段。三位代表人物的分歧,本质上是对三个核心问题的不同回答:
| 核心问题 | 杨植麟(技术派) | 朱啸虎(市场派) | 王小川(第三种) |
|---|---|---|---|
| 中国能做出基座大模型吗? | 必须做,且能做到 | 不必做,跟在后面 | 要做,但路径不同 |
| Scaling Law是否是唯一路径? | 是,模型越大能力越强 | 无关,应用场景才重要 | 需结合行业Know-how |
| 创业公司 vs 大厂的机会? | 创业公司有先发优势 | 大厂会碾压创业公司 | 垂直场景是差异化壁垒 |
王小川提出的中国AGI第三种可能,既不是杨植麟式的"不计代价追赶前沿",也不是朱啸虎式的"放弃基座做应用",而是一种有选择的理想主义:承认与OpenAI有差距,但不放弃自主模型能力;同时比纯技术派更快地推动落地,用落地反哺技术迭代。
王小川反驳朱啸虎"跟在后面花的钱少一个数量级"的观点。他的核心逻辑是:如果只做应用层,你永远受制于底层模型能力,无法构建真正的差异化。搜索引擎的历史教训表明——"你不掌握核心技术,你就只是个二道贩子"。
王小川在本次访谈中正式提出TPF概念,与创业界广泛使用的PMF(Product-Market Fit,产品市场契合)形成对照。他的核心观点是:在AGI时代,先找到技术与行业现存问题的契合点,比先做产品再找市场更重要。
王小川以医疗作为TPF最典型的例子。他认为医疗是大模型"皇冠上的明珠"——因为医疗场景天然需要对知识的深度理解、推理和个性化,这恰好是大模型最核心的技术能力所对应的问题域。
TPF在当时看起来是一个精巧的理论框架,但后续发展表明这个概念面临严峻考验。百川智能在2025年"大刹车"——基础模型停训、医疗ToB业务裁撤——某种程度上说明TPF理论的落地远比提出它更难。技术与问题的"契合",在真正执行层面可能需要比王小川预想的更长时间和更大投入。
这是王小川在本次访谈中最具哲学色彩的表达。他将AGI的终极目标定义为"对生命做建模"——不是简单地做一个聊天机器人或写作助手,而是创造一种能够理解、推理、甚至共情的类人存在。
当前绝大多数AI应用停留在这一层——回答问题、写代码、生成图片。这只是"机器",不是"人"。
能够理解上下文、记住偏好、主动建议。这已经接近"数字助理",但仍缺乏自主性和真正的理解。
王小川追求的终极形态——具备自主推理能力,能够对复杂问题形成独立判断,在医疗、情感等领域真正"替代"人类专家的部分能力。
王小川在搜狗做了20年搜索引擎,本质是"帮人找信息"。大模型时代,他认为应该从"帮人找信息"升级到"替人做判断"。搜索是把已有知识检索出来,大模型是把知识理解、融合、推理后给出新的答案——这就是从"工具"到"类人"的跃迁。
这一宏大叙事在吸引人才和投资人方面有感召力,但也被部分听众和评论者认为"过于哲学化、不够落地"。多位播客评论者指出,王小川的表达"第三条路的定义不够清晰",与杨植麟的技术路线图相比,缺乏具体的里程碑和可验证指标。
2023年4月,王小川正式创办百川智能。这距离他1999年加入搜狐、2003年开始做搜狗搜索引擎,已经过去了整整20年。他在本次访谈中回溯了再创业的心路历程:
王小川透露了一个细节:当时很多人在淘宝买ChatGPT账号,但他坚持用自己的IP去访问,不愿意走灰色渠道。这个看似不起眼的细节,折射出他对技术合规性的坚持——也是他后来把数据隐私作为百川差异化优势的思维基础。
王小川将百川的业务愿景比喻为"三座模型大楼"——三个他认为大模型能够产生颠覆性价值的垂直世界:
王小川在访谈时的优先级是:医疗 > 娱乐 > 创造。他认为医疗场景的数据壁垒和合规要求,天然构成创业公司对抗大厂的护城河——大厂在医疗领域的投入意愿和能力反而受限于合规风险。
从后续发展来看,百川智能的三座楼经历了剧烈调整:医疗ToB在2025年被列为裁撤对象(定制成本高、医院数据无法互通),娱乐方向的百小应转向了C端综合助手,创造方向几乎未展开。王小川在2024年中做出"All in医疗大模型"的决策,被内部知情人士认为是"一意孤行",导致基础技术研发被落下。这为理解本期访谈中的乐观预期提供了一个反思维度。
这是本次访谈中火药味最浓的部分。王小川在1:06:15时段集中回应了朱啸虎在此前访谈中的多条质疑:
王小川提到,他和朱啸虎在深创投活动上有过面对面交流。他用了一个耐人寻味的描述:"聊天很愉快,但我们对世界的看法确实不一样。"
朱啸虎的投资方法论是"快进快出"——看到清晰的PMF和变现路径才投。王小川的路线需要更长的验证周期和更大的耐心资本。这不仅是技术路线之争,也是资本逻辑之争。朱啸虎后来对DeepSeek的态度转变(2025年初表示"快让我相信AGI了")某种程度上验证了王小川"不能只看当下"的判断,但同时百川自身的困境也说明"理想"需要更强的执行力来支撑。
王小川在访谈中罕见地回顾了搜狗的创业历史,用来类比百川智能面对大厂竞争时的处境:
张小珺追问:做了20年搜索,这个经验在大模型时代是资产还是包袱?王小川的回答是——两者皆是,但资产大于包袱。
王小川在访谈中揭示了一个被广泛忽视的洞察——搜索引擎的核心技术与大模型有着惊人的同构性。
搜索引擎的排序算法,本质上是在预测"用户最可能想看的下一个内容"——这与大模型的自回归生成(预测下一个token)在底层逻辑上高度同构。搜狗输入法同理——预测用户接下来要输入的字词。王小川认为,搜狗20年来一直在做的事情,就是大模型最核心的能力。
百川智能的初始团队中有大量搜狗背景的工程师。王小川在访谈时提到团队240多人。百川之所以能在成立仅半年内就发布多个版本的开源模型(baichuan-7B、baichuan-13B等),很大程度上得益于搜狗团队在NLP和大规模分布式系统方面的经验积累。
王小川在访谈中坦诚地分享了融资过程中遇到的困难——这在创业者公开访谈中极为少见。
张小珺在访谈中提到了另一位引人注目的AI创业者——王慧文(美团联合创始人),创办了光年之外。王小川对外界将两人做比较的反应:
投资人对百川的犹豫,某种程度上也影响了百川的技术路线。资金压力迫使王小川在"自研基座模型"和"快速商业化"之间不断平衡。后续百川的战略摇摆(先开源、再医疗、再ToB、再回C端),可能与融资环境的变化有直接关联。
王小川在访谈中解释了百川为什么要同时推进To B和To C两条线——这在当时引发了不少质疑,因为"双线作战"通常意味着资源分散。
访谈中一个极具戏剧性的细节——王小川透露,百川的技术同事曾提议跟进OpenAI的Sora(文生视频模型),但被他否决了。
王小川透露,2024年春节前后经历了一次重要的心态转变——放下焦虑,摆脱一味跟随GPT的惯性。
拒绝做Sora这个决策,体现了王小川在"什么都想做"和"聚焦核心"之间选择了后者。但历史的吊诡在于——他选择的"核心"(医疗大模型)后来也遇到了巨大困难。这提示我们:创业者的战略取舍不仅取决于"选对方向",更取决于"在选定方向上的执行深度"。
王小川在访谈的后半段,对2024-2025年的技术发展做出了几项重要预判:
| 预判内容 | 当时的判断 | 后续验证 |
|---|---|---|
| Scaling Law是否会触顶 | 会遇到瓶颈,但不是完全失效 | 部分正确——GPT-5推迟,DeepSeek证明效率路线可行 |
| 中国大模型格局 | 最终会剩下少数几家 | 正在验证——六小虎陆续出现困难 |
| 医疗AI落地时间 | 2-3年内有标志性突破 | 待验证——百川自身的医疗业务反而收缩了 |
| 开源 vs 闭源 | 两条路都有价值,百川两手都做 | DeepSeek开源冲击了闭源模式的商业价值 |
| 应用层爆发 | 需要等"iPhone 3时刻" | Manus等Agent产品初步验证了C端可能性 |
在访谈的1:00:55处,王小川罕见地谈到了一段个人层面的困境——在搜狐/搜狗期间被边缘化的经历。
这段经历也解释了为什么王小川在被朱啸虎点名质疑时,能够保持相对从容的态度——"被边缘化过的人,对外界的质疑有更高的免疫力"。
王小川在搜狐/搜狗的身份始终是"职业经理人+技术创始人"——搜狗是搜狐的子公司。2021年搜狗被腾讯收购后,王小川第一次真正成为一家完全独立公司的创始人。百川智能是他"从零开始"的第一次。
在访谈中能感受到,王小川对百川智能倾注了超越商业层面的情感——这不仅是一次创业,更是一次自我实现。"对生命做建模"的宏大叙事,某种程度上也是他对自己人生意义的重新定义。他在搜狗做了20年"别人框架下的事",现在终于可以做"自己相信的事"。
| 维度 | 具体内容 |
|---|---|
| 访谈时间 | 2024年3月,百川成立约11个月 |
| 百川团队规模 | 240人以上 |
| 访谈时长 | 92分钟 |
| 播放量 | 31,749次(截至2026年) |
| 核心主张 | "理想上慢一步,落地上快三步" |
| 原创概念 | TPF(Technology-Problem Fit) |
| 三座大楼 | 娱乐、医疗、创造 |
| 核心赌注 | 医疗大模型 |
| 拒绝做的事 | Sora(文生视频) |
| 搜狗生涯 | 20年(1999-2021),搜狗被腾讯以约35亿美元收购 |
| 百川开源模型 | baichuan-7B、baichuan-13B等(成立半年内发布) |
| 与朱啸虎分歧 | 基座模型自研 vs 开源微调 |
王小川决定全力转向医疗大模型,大幅缩减通用模型团队,关闭金融等多条行业线。
百川AI健康顾问在世界人工智能大会首秀,展示医疗垂直能力。
预训练团队几乎全部流失,退掉了预训练算力卡。基础模型研发近乎暂停。
DeepSeek开源模型爆火,王小川判断"半年之内追不上DeepSeek",进一步放缓基础研发。
联合创始人离职、医疗ToB裁撤、商业服务部门解散。百川进入战略调整期,转向C端探索。账上资金约30余亿元。
王小川试图在技术信仰和市场务实之间走出第三条路,这需要极大的战略定力。但后续发展表明,"第三种可能"的风险恰恰在于——你既不能获得纯技术派的全部注意力(投资人和人才可能更倾向于月之暗面这样的"全力追前沿"的叙事),也不能获得市场派的认可(朱啸虎仍然不看好)。中间路线的脆弱性在于:它需要在两个维度上同时取得足够好的结果,而任何一个维度的失败都会让路线叙事崩塌。
Technology-Problem Fit作为一个分析框架,比PMF更适合描述AI时代的创业逻辑——先确认技术能解决什么真实问题,再围绕问题构建产品和市场。但百川自身的遭遇说明:找到TPF容易,执行TPF极难。医疗场景的数据获取、合规要求、商业模式验证,每一个环节的难度都远超王小川在本次访谈中的乐观预期。
王小川将搜索引擎类比为"预测下一个token",这个类比技术上成立,但可能隐含了一种认知陷阱——搜索的成功经验可能让团队过度自信"我们天然懂大模型"。实际上,大模型的训练方法论(预训练、微调、RLHF)与搜索引擎的排序算法有本质区别。百川后来预训练团队的流失,可能部分源于搜索背景团队与纯AI研究背景人才之间的方法论冲突。
朱啸虎质疑创业公司做大模型的合理性,在商业层面有其道理——确实有大量创业公司难以为继。但他主张的"跟在后面做应用"路线,在DeepSeek出现后也面临挑战——DeepSeek证明了中国公司可以用更少资源做出强模型,颠覆了"中国做不了基座模型"的判断。有趣的是,朱啸虎后来也承认"DeepSeek快让我相信AGI了",某种程度上验证了王小川"不能放弃基座模型"的坚持。
王小川"对生命做建模"的宏大叙事,在吸引理想主义者和技术人才方面有独特的感召力,但在资本市场和商业执行层面可能过于抽象。多位播客评论者指出"第三条路的定义不够清晰"——这不仅是传播问题,也可能是战略问题。一个无法被清晰验证的叙事,在面临困难时容易动摇团队和投资人的信心。
本期访谈发生在"AI六小虎"概念最火热的时期。百川、月之暗面、智谱、MiniMax、零一万物、阶跃星辰——六家公司代表了中国大模型创业的最高期望。但到2025-2026年,分化已经非常明显:百川大幅收缩,零一万物资金紧张不断拆分,而DeepSeek这匹"黑马"后来居上。这证实了王小川在本次访谈中的一个判断:"最终会剩下少数几家"。
回听这期播客,最让人感慨的是王小川身上的矛盾性:他既有搜狗20年的深厚积累,又面临大模型时代的全新规则;他既有"造人"的宏大理想,又受制于融资、竞争、组织等现实约束;他既拒绝做Sora的随波逐流,又无法完全按照自己的节奏推进医疗赛道。这种矛盾不是王小川个人的问题,而是所有试图在AI大变局中"走自己路"的创业者共同面临的困境——时代的洪流不等人,但如果只是随波逐流,又失去了创业的意义。