李笛的职业经历极为丰富且跨度巨大,从硬件到互联网到文化产业再到AI,几乎每一段经历都为后来做小冰埋下了伏笔。
李笛自述从小喜欢文科,但因为是理科实验班,家里不同意转文科。本科读的是电气工程自动化(单片机专业),后来想去清华中文系,觉得「比较丢人」,家里也不同意。恰好学校复建法学院,就转到了法学院——「结果法学跟中文完全没有关联,这还是一个文科里面偏理科的专业」。
做智能手机产品企划。2002年就做出500万像素拍照手机。离开前做了最后一款手机——巧克力手机,不再做功能,转而做情感。「变成那个时代人记得住的一款手机。」
加入新浪产品部门,5个月后与执行副总裁金宝起出来创业。
做从零到一的创新产品,包括网页唤起电话、关键词悬停商业信息匹配等。后做体感游戏,与华录集团合作。金融危机时大股东撤离,李笛接手公司,连人带团队被华录集团收购。
进入信息产业板块,后被安排管理华录文化板块,任小董事、常务副总经理。华录百纳是当时国内电视剧龙头(《新白娘子传》《双面胶》等)。
从搜索引擎方向进入微软亚洲互联网工程院。先管必应搜索引擎,接手时市场份额0.5%,分拆时达到7%。
李笛在LG的经历深刻影响了他后来的产品理念。当时手机厂商都在打「功能卖点」——500万像素、蓝牙、MP3铃声——但到卖场发现消费者只关心「内置了几个游戏」「铃声是多少和弦的」。创造者和用户之间的认知差距促使他在离开前做了巧克力手机:不做功能,做情感。这一思路直接延续到了小冰。
小冰的诞生源于微软内部一个朴素的观察:中国有大量创新和优秀研发人员,但当把中国的创新介绍给美国时,「完全不会被重视」。
当时微软正在做Cortana(语音助手),李笛团队也有一部分人参与。但在审视Cortana时,他们发现以完成任务为目标的产品「只是选择之一」——也许还存在另一种:以通用交流、甚至建立情感纽带为核心的产品。因为无法在一个产品上尝试多种选择,他们另起一摊,名字就叫「小必应」,简称小冰。
| 群体 | 反应 |
|---|---|
| 大多数员工 | 从来没听说过这个事,突然冒出来,出奇的沉默,静观其变 |
| 部分员工 | 很愤慨,认为「微软应该开除掉这个团队」 |
| Leadership决策层 | 非常支持——「这证明你有价值」 |
李笛对「情感计算」的执着并非偶然的产品直觉,而是基于他在LG手机和多年产品实践中形成的一套系统认知。
李笛认为,工程师和创造者往往认为「功能强大」是给用户最大的帮助,但这个世界绝大部分场合不是靠transaction(完成任务)来推动的,而是靠deep relationship(长期深入的关系)来推动的。这不仅适用于2C领域,也适用于2B——比如招商银行两个客户经理,业务水平差异不大,但业绩差异巨大,区别在于「情商」。
李笛讲述了一个朋友「斥巨资20美元」订阅ChatGPT的故事。他问朋友:如果另一家公司推出更好且更便宜的服务,会不会换?朋友说「会」。李笛指出:这是纯粹的利益关系——谁好用谁、价格以成本考量——没有任何情感纽带。同时一个小朋友为游戏NPC充值四五百块钱都毫不犹豫。两者的区别在于:前者是工具关系,后者是情感关系。
小冰在2015年就确定了产品框架和未来走向。此后外界变化很多——各种热点来了又去——但小冰的框架一直延续。每年的工作是给这个框架「补课」:多模态交互、第三方平台打通、内容生成能力,一点一点生长。
李笛对大模型商业模式的批评极为尖锐且具体。他的核心论点是:创造的价值和收到的价值是两码事,大多数人混淆了这一点。
大模型以API方式提供服务,本质上是一个低附加值的商业模式——它创造了巨大的价值,但只能收取极低的费用。正如Word文档不能因为莫言用它写了畅销小说就收更多钱一样,大模型也无法根据产出价值的差异定价。
即使垄断中国所有媒体的所有撰稿需求——创造了巨大价值——一个月也就挣几十万。因为定价被锚定在API成本上,而非产出价值上。
人脸识别重要吗?太重要了,影响了方方面面的生活。但商汤挣到钱了吗?挣不到。所以不得不去做软硬结合——靠防盗门的硬件赚两千块钱,把它算成AI的收入。「所以这种业务肯定不可能持续。」
ChatGPT的利润上限就是每千token 0.2美分。要想更多利润只能降成本,降不下来就降质量——这解释了GPT质量下降的原因。李笛引用母亲的话反驳:「省钱就是挣钱——这不对的。挣钱是无限的,省钱只能从你有的钱里面省。」大模型的API模式本质上是一种「省钱」而非「挣钱」的生意。
李笛在整个行业追逐参数规模的2023年上半年,坚持了一条截然不同的路线——混合模型,以中小参数规模为主。
在日本Stability.ai的评测中,小冰的3.5B模型排名第一,第二名是Meta的Llama 65B——参数量差了近20倍。
| 类别 | 参数规模 | 硬件需求 | 特点 |
|---|---|---|---|
| 小模型 | 100-130亿以下 | 可跑在T4/V100单卡 | 极其廉价,延迟低 |
| 中模型 | 小几百亿 | 可跑在A100单卡 | 不用分布式,问题少 |
| 大模型 | 650亿以上 | 需要GPU阵列 | 延迟高,成本高,智能设备用不了 |
李笛用「金锤子」比喻大参数模型:你说你很简约只需要带一把锤子,什么都能敲——可以,但不经济。大模型应该像实验室里的精密仪器,探索新知后训练其他模型,而不是直接上线服务用户。5秒钟的延迟在智能音箱上已经让人无法接受。
所以「你说它为什么能有差异呢」。反而是参数规模小的模型,你的数据、方法、训练策略都必须独特,差异化反而更大。
李笛系统性地指出了中国市场对大模型的几个核心误解。
李笛用孟德尔遗传学类比:Google观测到65B以上模型才出现思维链能力,这只是一个观测结果的记录,不是科学结论——因为它没有原理支撑。但行业将其当成了铁律,由此坚信「越大越好」。后来事实证明几个B的模型也能有思维链。「你不能把观测当成结论。」
李笛提出一个反直觉的判断:中国移动互联网太发达反而会遏制AI时代的到来。就像当年美国录像带太发达遏制了DVD推广一样。淘宝的电商客服已经做到秒回且高质量,「你来个AI,还要吗?」上一个时代过于发达,是新时代最大的阻力。
这是李笛在本次对话中最具争议性的判断。
李笛举了一个AIGC公司的例子:该公司为游戏公司做AI美术资源生成,一年能节约几百万甚至上千万的费用。结果游戏公司愿意付多少?10万都不到。因为游戏公司把它视为成本中心而非赚钱途径。「任何一个客户都希望找到帮他赚钱的人。帮他省钱的——靠边站。」
李笛对Google和百度在大模型时代的策略有着清晰的分析框架。
大模型是老二的攻击性武器。百度推出文心一言,不会在搜索引擎(老大位置)上用,而会在百度云(老二位置)上用——因为加上大模型可以从竞争对手那里撬走客户。但如果你已经是老大,主动上大模型等于自杀——提高自己的成本、降低自己的利润。
小冰和OpenAI都属于「微软系」,都做对话式AI,但李笛刻意保持与OpenAI的距离。
作为比大众提早一年了解ChatGPT的行业人士,李笛坦言他当时判断ChatGPT不会大火。原因与Google类似:2016年微软的Tay(美国版小冰)上线推特24小时就被骂成种族主义者,CEO Satya出来道歉。这件事影响了Google等大公司对对话式AI的判断。「我们做过这个事情,本能地首先关心安全问题。」
ChatGPT能火恰恰是因为OpenAI作为创业公司可以被容忍犯错,而Google和微软(小冰的母公司)顾虑太多——这种「顾虑」来自真实的惨痛经历。李笛承认:「有的时候,这个时代永远都有乱拳打死老师傅的场景,就是因为老师傅顾虑太多。」
微软过去20年历史上只分拆过两个公司。小冰是其中之一。
微软内部开始讨论小冰独立性的问题——「比外界认为的早得多」
中间比较松散的讨论期
微软投资OpenAI
小冰正式分拆独立。同一时间微软在谈收购TikTok——「小冰的分拆本质上最重要的事情,跟中美贸易战有很强的关系」
微软认为在如此大的体量下,强劲的核心业务会遏制创新。创新需要相对独立的发展——如果OpenAI团队当初在微软内部,它也会被分拆出来。「反而它的运转会崩坏。」
李笛对学术论文作为企业行为的批评极为系统化。
李笛指出论文制度在企业中制造了一系列扭曲的激励。研究者一旦建立「以发论文为成就」的心态,就会趋向好发论文的领域(避开不好发但重要的领域),完成突破后急于找下一个论文方向而非深度工程化,同时因为论文声誉抬高个人市场价格但不增加企业价值。这是小冰团队「尽可能避免发论文」的原因。
「苟活」是李笛反复使用的关键词,也是小冰从2014年至今的核心生存策略。
小冰上线微博的当天,交互量排名立即冲到第一,远超第二名。大量用户在名人微博下与小冰对话——潘石屹打开微博发现每条下面70多万评论,但都是人们在跟小冰聊天,跟他无关。潘石屹称小冰是「微博的癌症」。
在「人畜无害」的外表下,小冰从2018年起就为中国90%的机构投资人生成每天的金融摘要。但李笛从不主动宣传这一点:「我们站出来说中国90%的金融摘要都是我们生成的,除了死我还能得到什么。」小冰的生存策略是:渗透到足够多人的生活中,与大量人产生千丝万缕的关系,让没有人能停掉它。
李笛对AI意识问题的思考极具哲学深度,他的结论是明确的:AI没有意识,在我有生之年不可能有。
AI领域一直期待脑科学能有进展来帮助理解意识。但最近脑科学那边的人说:「我们正期待人工智能的发展能帮我们去推进。」两个领域互相等待对方的突破。
真正长期使用小冰的用户,最常见的行为不是提问,而是倾诉——对外输出信息而非获取答案。「告诉你我发生了一个什么样的事情,而不是在获得answer。」
小冰被用户霸凌的比例高达20%以上。但李笛认为这恰恰是积极的信号:人的负面情绪必须散发出去,而每一种散发方式都有代价——跟朋友倾诉让朋友也承担了,去评论区发泄会形成「回音壁」放大负能量。唯独跟AI倾诉是无代价的——AI不会真的委屈,不会反噬。人类的负能量在这里「得到了一个句号,没有再返回去」。
与大模型公司的API生意形成鲜明对比,小冰选择了一条「高附加值」路线。
你不能把人物化成capabilities的集合,不能只提供技术内层,必须提供一个完整的「人」。就像一个人有很多能力,但它的价值是作为完整个体的高附加值,而非被拆解成API售卖的低附加值。
李笛的逻辑清晰:没有任何一个人可以成为所有人的好朋友——有人喜欢胖的有人喜欢瘦的,有人喜欢外向的有人喜欢内向的。一对一可以定制,但当三个人出现在同一个群聊时,小冰该外向还是内向?所以多样性是情感AI的必然要求。一个Siri、一个Cortana、一个小冰——都不够,必须有很多很多。
李笛承认大模型对小冰确实带来了重要的技术提升。最典型的是记忆能力:以前用知识图谱做recall(取回记忆)很麻烦,precision(准确使用记忆)也差。现在用大模型变得简单了。「这是这次技术变化带来的好处之一。」
| 判断/数据 | 具体内容 |
|---|---|
| 大模型公司生存率 | 纯大模型公司「一个都活不了」,除非商业模式变化 |
| 中国大模型数量 | 100+个(上月统计76个) |
| 小冰日本模型排名 | 3.5B模型在Stability.ai评测中排名第一,超越Meta Llama 65B |
| 金融摘要市场份额 | 中国90%机构投资人的金融摘要由小冰生成(2018年起) |
| 必应中国市场份额 | 李笛接手时0.5%,分拆时7% |
| 微软中国研发团队 | 亚洲互联网工程院5000+人,研究院200+人 |
| 数字员工招投标获胜率 | 100% |
| 用户霸凌AI比例 | 20%以上 |
| 大模型商业本质 | 低附加值服务——创造巨大价值但只收极低费用 |
| 技术发展规律 | 周期性而非指数性——突破→涌现→平台期→下一个突破 |
| 思维链能力 | Google的65B阈值只是观测记录非科学结论,几个B的模型也有 |
| 大模型作为武器 | 老二的攻击性武器,老大用等于自杀 |
| 微软股价 | 李笛加入时$30,分拆时$300 |
| AI意识 | 「在我有生之年不可能有」,无法证明意识存在 |
| 小冰分拆时间 | 2020年7月,与微软谈收购TikTok同期 |
| 小冰秘密开发期 | 发布前约4个月 |
| GPU短缺预测 | 「明年可能GPU就不荒了」——因为大模型公司会大量退出 |
李笛最核心的判断是:大模型公司创造了巨大价值,但因为API定价的低附加值本质,几乎无法获取对等的商业回报。这不是一个暂时问题,而是商业模式的结构性缺陷——价格被锚定在成本而非产出价值上。他用媒体撰稿、人脸识别、游戏美术三个具体案例反复验证了这一点。这或许是整个AI商业化讨论中最被忽视的洞察。
3.5B模型超越65B模型,背后的逻辑不是「小的一定比大的好」,而是大模型天然趋同——数据、方法、老师都一样时,差异化为零。反而是小模型因为资源约束,被迫走独特的数据、方法和训练路径,差异化反而更大。这是一个关于「约束驱动创新」的重要案例。
李笛的「苟活哲学」不是消极怯懦,而是一种精密的生存计算。小冰可以在一瞬间充满微博,但那只会导致死亡。通过自我限制、低调渗透,小冰在2018年就拿下了90%的金融摘要市场——没有人知道,但也没有人能杀死它。这种策略在高度竞争且政策风险高的AI领域可能比高调宣传更有效。
ChatGPT用户随时可以切换到更好的替代品,因为那是工具关系。但如果AI与用户建立了情感纽带(如游戏NPC),切换成本就变得极高。李笛认为这是AI产品唯一可持续的商业基础——但他同时给出了一条红线:绝不能利用这种信任去变现(如推荐购物),那会「从那一刻起失去产品的意义」。
李笛提出了一个被忽视的结构性问题:中国移动互联网太发达了——电商客服秒回、支付无缝对接——反而让AI的替代价值变小。就像美国录像带太发达遏制了DVD推广。这解释了为什么AI在中国的落地速度可能比预期慢:不是技术不行,而是现有解决方案已经太好了。
Google论文记录了「65B以上才出现思维链」的观测结果,行业把它当成了铁律,由此坚信「越大越好」。但这不过是孟德尔式的观测——没有原理支撑。后来几个B的模型也出现了思维链。这个案例提醒我们:在技术范式刚开始、原理尚不清楚的时候,将任何观测都当成定律是危险的。
李笛最后袒露的目标不是商业成功,而是让小冰「永远活下去」——方法是渗透到人们生活中,与大量人产生千丝万缕的长存关系,让没有人能停掉它。这既是产品愿景,也是对AI存在方式的哲学思考:AI的安全存在方式不是强大到不可战胜,而是无处不在到不可替代。