本期节目录制于2023年5月初,距上一次对谈过去约两个月。王怀南(Alan)用"又热又冷"概括这段时间行业情绪的剧变:从最初被ChatGPT 3.5震惊、到疯狂拥抱4.0,再到企业家和创始人开始冷酷地分析自己能做什么、不能做什么。
王怀南观察到,周围关于大模型的讨论频率在下降,但质量在大幅上升。"从广泛的、事无巨细的、模糊的激动的聊,到了落地的、严肃的、认真的、真的把自己放在里面的聊。"他认为频率下降、质量大增的组合,实际产出的"可能性的成绩"反而大于此前的狂热期。
王怀南引述了与陆奇博士的交流。陆奇表示,他人生中只有两个时间点感受到这种"无法应接的信息爆炸"——一次是1998年互联网浏览器与网景出现的时候,另一次就是现在。
王怀南提出了一个"特别有趣的判断"——大模型的机会出现了明确的两极分化。底层的大语言模型属于年轻的数学家和创新者,而上层的行业应用(Vertical Copilot,垂直副驾驶)属于创业老兵。
王怀南描述了自己两个月内的三步认知演变:
互联网时代被认为是年轻人的天下,排除35岁以上的人。但这一轮AI创业中,最积极的参与者几乎全是35岁以上的老兵——从周鸿祎到王小川到王慧文。王怀南认为原因在于:AI应用层的机会是"复杂的机会",需要行业阅历、手感和驾驭复杂局面的能力,这恰恰是年轻创业者handle不了的。
王怀南在对谈中透露了一个当时尚未正式公开的消息:OpenAI将走向开源。他明确表示"基本上是一个消息了",而非猜测。
王怀南直言:OpenAI开源将对所有想做大语言模型的人构成"毁灭性的攻击"——"就是不需要了,你做出来干什么呢?"开源+开放的组合意味着OpenAI选择了做底层平台的角色,同时彻底封死了追赶者的路径。唯一的变数是中国市场的政治和政策因素。
关于GPT-5的问题,王怀南态度明确:"Sam说没有5,我绝对不相信。"他认为GPT的迭代方法论——用上一个版本的智力训练下一个版本——决定了进化不会停止。"他一定进化到了我们可怕的程度。"
王怀南带来了另一条独家信息:亚马逊将在2023年5月底发布两个模型——一个大语言模型和一个小语言模型。这个战略选择本身就是一个重要信号。
亚马逊的双模型策略暗含了一个关键预判:大语言模型的船票可能抢不到,但垂直领域的小语言模型才是实际可行的方向。公司内部有几十个团队在同步运营,大部分做大模型,但也有"非常强悍的人"在做小模型——团队中还有中国人。
王怀南在对谈中自嘲"编了一个词"叫小语言模型,但他指出这个概念其实已经存在。他犀利地观察到:中国很多公司做的其实都是小语言模型,"但是他们非得叫自己叫大语言模型"。这个判断在后来被行业发展所验证——垂直领域的专用模型确实成为了更务实的方向。
这是本期对谈中最尖锐的判断之一。两个月前王怀南还认为中美可能"划江而治"、出现两个巨头,但到了本期录制时,他的态度已经彻底转变。
| 层面 | 王怀南的判断 |
|---|---|
| 技术层 | 底层大模型的竞争"基本结束了"——只有一个上帝,不可能有多个上帝 |
| 数据层 | GPT灌入了世界上所有的英文知识,中文文本仅占不到1%,靠翻译即可解决中文问题 |
| 政治层 | OpenAI不受制于美国政府,且"后门已经在敞开着"——应用端会"网开一面" |
在彻底否定中国做大语言模型的可能性之后,王怀南提出了一个替代路径:中国最终可能做的是"若干个小语言模型的叠加和合并",形成一个类似大语言模型的效果。这需要时间和精力去开发,但至少是一条可走的路。
如果底层大模型的机会已经关闭,那么垂直领域的Copilot(副驾驶)就是剩余的战场。但王怀南指出,这个战场的难度远超大多数人的想象,需要同时跨越三道关卡。
如何做好垂直领域的小模型?比如法律AI——"怎么就代替律师了?"需要重新创业创新,需要大量行业专家参与训练。你跟一百个律师合作能培养出律师AI,别人找两百个律师就能做出更好的。
"工具是永远可被替代的,只有社区才能不可替代。"如何从一个工具迅速上升到社区——让用户之间产生交流和连接——是生死存亡的关键。B站在数据和社交上都成功了,但在商业模式上失败了。
底层API按数据收费,成本不便宜。传统的广告模式在AI Copilot的世界里可能不成立。"不像20年前,一帮无知无畏的人走进互联网,不考虑商业模式。今天没有可能那个事情出现了。"
王怀南强调,这三个层次不是可以分阶段慢慢解决的,而是需要"从第一时间差不多有个感觉,然后敏锐地在每个阶段升级自己的想法"——工具、社区、商业模式必须一气呵成。这正是为什么创业老兵比年轻人更有优势:他们经历过类似的复杂局面。
王怀南指出一个有趣的矛盾:Sam Altman一直教导创业者"产品要有分享力(viral)",但ChatGPT本身"没有任何分享力,不viral,没有毒性,没有药性"——它纯粹靠产品质量取胜。这意味着普通创业者无法复制这条路径。
王怀南用"非常非常非常复杂"来形容中国AI创业的融资环境。在排除了所有不可行的路径之后,几乎只剩下一条路。
| 融资路径 | 现状 | 结论 |
|---|---|---|
| 美国基金投中国公司 | 不敢投,也不一定能投 | 基本关闭 |
| 在华美元基金投中国公司 | 不太敢投 | 高度受限 |
| 中国资本投美国公司 | 不一定被允许 | 基本关闭 |
| 人民币基金投中国公司 | 唯一的路径 | 但人民币基金背后全是政府 |
王怀南列举了中国AI创业者面临的全维度挑战:自身的技术和产品问题,全球政治博弈问题,融资环境问题,三分之二的机会被ChatGPT自己占据的问题。他预判"这件事情会在半年到一年之后看到,第一把投进去的人草草收场、惨不忍睹"——而真正好的项目可能要到2024年夏天才会涌现。
王怀南判断,大模型的商业化冲击波将按照搜索-电商-娱乐的顺序依次展开。每一个战场都将带来行业格局的根本性改变。
ChatGPT对搜索的颠覆是根本性的:用户不再需要看10个链接,而是直接获得答案。百度虽然有shortcuts功能做了一些智能化,但本质上仍然需要"点击第二次"。ChatGPT"干掉了所有的自己还要去点击第二次"的环节。
王怀南引用了陆奇的一个核心判断:"当一个行业的某些成本成为了固定成本之后,这个行业就做起来了。"创作优秀内容的成本正在从变动成本变为固定成本(趋近于零),这将彻底血洗娱乐行业。记录、回顾、分享——这些曾经"只属于有钱的人、有能力的人、历史上的战胜者"的特权,将属于每个人。
王怀南将微软在AI时代的姿态描述为一种"垄断的局势"——这与微软在互联网时代的失败形成了鲜明对比。
王怀南特别点出了微软战略的可怕之处:主营业务不是搜索,却可以干掉搜索的商业模式。"你就想——我的主营业务不是搜索的时候,我干掉了你,无所谓。我把你商业模式干掉了,我没亏损。"这种"降维打击"让百度和谷歌都无力还手。
在大模型时代,传统的算法壁垒和算力壁垒都不够牢固。王怀南认为,真正的壁垒在于数据-社区-商业模式的三层叠加。
王怀南构建了一个清晰的壁垒模型,每一层都比上一层更难复制:
王怀南建议将中国前100个流量最大的平台和企业逐一列出,分析AI冲击是否有效。他重点分析了几个具体案例。
| 行业/公司 | 紧迫原因 | 王怀南判断 |
|---|---|---|
| 百度 | 后花园被端掉 | 走得急——搜索被直接替代 |
| 科大讯飞 | 本来就在AI行业里 | 走得急——但中文优势是幻觉 |
| 电商平台 | 搜索场景被重构 | 马上要出自己的牌 |
| 娱乐平台 | 创作成本归零 | 肯定睡不着觉 |
| 教育 | 张邦鑫的数学GPT | 肯定要被颠覆 |
| 健康医疗 | 垂直场景天然适配 | 肯定要被颠覆 |
王怀南透露,张一鸣"应该是亲自在看论文,然后也在找人交流",但字节整体对AI保持了"非常少的交流"和"比较隐蔽"的态度。王怀南的评价:"越没听到声音越可怕。"与百度高调宣传文心一言形成鲜明对比——百度是"不这么做不行",而字节是在暗中蓄力。
对谈期间恰逢AI教父Geoffrey Hinton从谷歌离职引发全球讨论。王怀南提出了一个深层视角:文化和翻译的鸿沟让我们对这些事件的理解可能存在根本偏差。
王怀南在讨论AI危险论时提出了一个哲学层面的反思:"我越想越不觉得人是一个独立自主的东西,我越来越觉得它是别人操纵的一台机器,如此之不完美。"AI迫使人类在有生之年遇到"比我们集体的智慧都要聪明"的存在——"它知道比你多,然后它也有逻辑的reason的能力。"这不是恐惧,而是一个深刻的哲学挑战。
这是本期对谈中最具洞察力的判断之一:AI时代的应用层创业,属于那些经历过互联网大潮、有深厚行业经验的创业老兵。
| 人物 | 背景 | 优势 |
|---|---|---|
| 王慧文 | 与王兴联合创立美团 | 把没有商业模式的东西做出了商业模式 |
| 王小川 | 搜狗创始人 | 在搜索战场找到了老三的生存模式 |
| 周鸿祎 | 3721/360创始人 | 骨子里是做搜索的人,最理解ChatGPT对搜索的颠覆 |
| 王怀南 | 宝宝树创始人 | 连续创业经验,正在筹备AI项目 |
王怀南给出了一个"规律":在AI应用层创业中,年轻人的判断"可能错误率非常高"。原因不是年轻人不聪明,而是这一轮创业需要的能力组合——行业认知、用户心态把握、交互模式设计、商业模式构建、复杂局面驾驭——恰恰是需要时间沉淀的。"一个技术流的、初出茅庐的、第一次创业的年轻人是handle不了的。"
王怀南不仅否定了年轻创业者的机会,也否定了大厂的可能性。阿里、百度这些企业"肯定关注AI的,但是没有做到涌现"——谷歌自己都没做到。"各种各样的官僚的机制,加上算法的保守,或者说作为一家上市公司必要的保守"使得彻底的涌现只能在体制外发生。但涌现"只能涌现一次"——之后就是老大通吃。
王怀南对大模型的技术本质做了一个深入浅出的阐释,核心观点是:GPT不是在做翻译或检索,而是在做理解和涌现。
王怀南用一个精准的类比区分了搜索引擎和大模型的根本不同:谷歌是"整理者"——收集、索引、呈现给用户;GPT是"涌现者"——不仅收集和整理,还在理解的基础上产生新的综合判断。这不是一个程度的差异,而是一个范式的差异。
王怀南反复强调一个被忽视的问题:不在ChatGPT产生的文化土壤里,我们的讨论"有些东西聊的不够深"。他以巴菲特年度股东大会为例——大部分中国人去了只是"朝圣和玩",真正听下来的人对细节的理解和翻译出来的文字"很不一样"。他特别推崇陆奇,认为他是"最接近源头真理的人"——"跟他交流会对这件事产生不一样的想法。"
在对谈尾声,王怀南透露了自己的行动计划——他将个人入局AI创业。
王怀南计划两个月内去美国,"好好地坐在那,想一想"。他曾在硅谷做了多年、以前创业时两个月去一次,但疫情三年彻底切断了这条联系。他认为做AI创业必须"多去朝朝圣、多去拜拜佛",感受产生OpenAI的环境——"逻辑上相同"和"体感上相同"两点都不可或缺。
亚马逊发布大小双模型;OpenAI持续进化并走向开源;更多老兵入局
"第一把投进去的人草草收场、惨不忍睹";有数据的公司被并购潮涌现
"突然涌现出20个项目,改变了我们对一些垂直领域的想法"
| 判断 | 具体内容 |
|---|---|
| 底层大模型竞争 | "基本结束了"——只有一个上帝 |
| OpenAI开源 | "基本上是一个消息了"——对追赶者构成毁灭性攻击 |
| 中国做大模型 | 已从"可能划江而治"转为"不可能" |
| 亚马逊 | 将发布大/小双模型,预判了垂直方向 |
| GPT-5 | "绝对不相信没有5"——进化不会停止 |
| YC项目被干掉比例 | 60%-70%的创业项目被ChatGPT自己取代 |
| 行业机会分布 | 2/3的垂直行业被ChatGPT占据,剩余30%属于深耕者 |
| 涌现提前量 | 比Sam Altman自己预期早5-8年 |
| 中文文本在GPT-4中的占比 | 不到1% |
| 融资格局 | 仅剩"人民币基金投中国公司"一条路 |
| 创业者画像 | 35岁以上老兵 > 年轻技术创业者 |
| 涌现本质 | 从Search Engine到Result Engine的范式转换 |
| 壁垒排序 | 数据 > 社区 > 商业模式 >> 算法/算力 |
| 三大战场 | 搜索(第一枪)→ 电商(第二枪)→ 娱乐(第三枪) |
| 字节跳动 | "越没听到声音越可怕"——张一鸣亲自看论文 |
| 阿里的隐藏优势 | 中国最牛的照片图像存储和分析公司,可能是中国版Midjourney |
| 第一波投资结局 | 半年到一年后"草草收场、惨不忍睹" |
| 好项目涌现时间 | 2024年夏天——"突然涌现出20个项目" |
对谈发生在ChatGPT引爆中国市场约两个月后,行业正经历从狂热到冷静的关键转折。王怀南的"像现实落而非绝望落"精准捕捉了这个转折的性质——不是幻灭,而是认知升级。回看这期内容,部分判断已被验证(如小语言模型/垂直模型的兴起、第一波投资的高死亡率),部分判断过于悲观(如中国大模型"不可能"——后来百川、Kimi、DeepSeek等证明了差异化路径的可行性)。
王怀南的"三步认知法"——底层没机会、垂直有机会但三分之二被平台方拿走、剩下的属于深耕者——在此后两年多的发展中被反复验证。从OpenAI的GPTs、微软的Copilot到各大平台的AI功能内置,大量曾被认为是创业机会的领域确实被平台方自己覆盖了。
中美脱钩导致的融资通道收窄问题,在三年后的2026年依然存在甚至加深。人民币基金主导的投资格局确实成为了中国AI创业生态的基本面。王怀南当时"门刚打开就被关上"的描述,成为了一种持续性的结构困境。
王怀南的"数据-社区-商业模式"三层壁垒模型,本质上预见了后来的一个核心趋势:在大模型底层能力趋同的情况下,拥有独特数据资产的公司(如阿里的商品图片、字节的短视频、医疗机构的病历数据)成为了AI应用竞争中最关键的变量。
王怀南断言底层大模型"只有一个上帝"、后来者无法追赶。但此后Google的Gemini、Meta的Llama、以及中国的DeepSeek都证明,虽然OpenAI获得了先发优势,但"涌现"并非不可复制。多极竞争的格局最终形成,开源模型(恰恰是王怀南预测的OpenAI开源方向的对立面——Meta主导了开源)成为了均衡力量。
王怀南本人就是"创业老兵",他对老兵优势的强调带有明显的身份认同色彩。事实上,此后最成功的AI创业案例中,年轻团队(如月之暗面的杨植麟等)同样表现出色。AI创业的复杂性确实需要经验,但年轻人的技术直觉和对新范式的天然亲和力同样是不可替代的优势。
王怀南关于"文化和翻译的鸿沟"的反复强调,可能是本期最被忽视但最有价值的洞察。他指出中国AI从业者对Hinton离职、对Altman的言论、对整个AI叙事的理解,都可能隔着巨大的文化屏障。"在场和看文字很不一样,大量的信息丧失掉。"这个判断在今天依然成立——中国AI行业对海外动态的理解,常常是经过多层翻译和诠释后的变形版本。