深度研究 — #129 智谱CEO张鹏：敢问路在何方？

← 返回张小珺主页

🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

清华基因：从知识工程到认知智能
科技成果转化：第一个吃螃蟹的人
P2P哲学与情报学的认知训练场
从GPT-3到GLM：技术路线的抉择
ChatGPT时刻：赌对之后的兴奋与焦虑
百模大战：纷纷扰扰中的定力
MaaS商业化：为什么不All in 2C
Scaling Law的演进与L1-L5阶梯
DeepSeek冲击：反思与重新出发
开源哲学：从130B到全系列开源
AGI路线图：下一个范式在哪里
学院派创业：工程师文化的利与弊
全球大模型第一股：上市的逻辑
启示与延伸思考

一、清华基因：从知识工程到认知智能

张鹏的履历"非常简单"：1998年进入清华大学，此后再未离开。他在清华计算机系的知识工程实验室工作，该实验室走出了旷视科技的联合创始人唐文斌、杨木等人——上一代"AI四小龙"的核心人物。

张鹏

从98年进了清华就没离开过，到现在为止，也在给清华打工——因为是我们的股东嘛。

2015-2016年：认知智能的提出

在观察了上一代AI企业的成功与局限后，张鹏和团队在2015-2016年左右开始内部讨论一个核心问题：下一代人工智能到底是什么？

核心概念

从感知智能到认知智能

上一代AI（如计算机视觉、语音识别）解决的是感知问题——"不知道它不知道"。张鹏引用张钹院士的象限图：当时的AI只能处理极小范围的已知问题。认知智能是迈向通用人工智能（AGI）的下一个台阶，核心在于让机器具备"知道自己不知道"的能力。

感知智能：识别图片、翻译语音——"没有脑子"，只是单个技能
认知智能：理解、综合、推演、得出新知识——"有脑子"
关键区别：能否泛化——根据有限样本推演未见过的情况

张鹏坦承，到今天认知的本质仍未被完全揭示。但这个方向性的判断，让智谱从创立之初就与纯商业化公司有了根本区别。

张鹏

现在包括大模型在内的这些技术，是不是真的模拟了人的认知，或者说掌握了人类认知的本质？我觉得肯定不是，还没有到那个地步。因为你自己都没搞清楚这个本质是啥。

二、科技成果转化：第一个吃螃蟹的人

智谱的诞生过程本身就是一段制度创新史。2018年，教育部等部委联合发文，允许科研院所在职人员用已有研究成果做科技成果转化。智谱成为清华计算机系第一家通过该通道成立的公司。

2016年

实验室内部开始讨论"下一代人工智能"方向，确认认知智能是核心。

2017年

团队以相对独立的方式开始运转，尝试在学校体制下走通商业化转化路径。当时在职人员开公司严格来说"不允许"。

2018年1月

国家出台科技成果转化意见，"开了一扇窗户"。智谱董事长刘德斌开始与清华谈判转化细节。

2019年6月

公司正式注册成立。整个谈判过程耗时一年半——包括成果评估、股权分配比例、合规流程等前所未有的细节。

制度创新的代价与收益

张鹏强调"前面没有人走过这个路"。学校也不清楚如何操作，双方在互相理解中摸索。分配比例、成果货币化评估、国资合规要求——这些细节全部是"第一次"。但这种正式路径也让智谱避免了后续的法律隐患，同时获得了清华作为股东的背书。

张鹏

其实我们自己想做这个事。不是谁要求我们去做。包括我们的团队还是非常幸运的一帮人，很多事情恰好就在那个时间发生了。

三、P2P哲学与情报学的认知训练场

清华知识工程实验室有一个延续至今的传统——P2P（Paper to Product），即研究成果必须转换成实际可用的产品或系统。张鹏在实验室中的角色正是负责"工程转化"。

AMiner：情报学与认知智能的天然交汇

智谱的起点产品AMiner是一个科技情报分析平台，在国际上有相当影响力。客户包括Google、IBM等顶级科技企业，为他们提供技术趋势预测服务。

核心问题：未来3-5年哪些技术会成为热点？
传统方法：专家调研、阅读文献、写报告——靠人工和经验
智谱方法：用机器学习算法和模型自动分析——效率和速度完全不同
商业成绩：实验室横向科研经费年收入接近2000万元，"少有的能挣美金的实验室"

情报学是认知智能最典型的应用场景

张鹏解释了为什么选择情报学作为起点：情报学要求理解已有文献中的知识，综合不同知识进行推演，最终得到新的知识——这本质上就是认知能力的密集应用。传统情报学归属于图书馆学，智谱从计算机科学的角度切入，用算法替代人工专家，是一次方法论的革命。

~2000万

实验室年横向科研经费（元）

美金

为国外企业服务的结算货币

1-2万人

公司成立初期团队规模

四、从GPT-3到GLM：技术路线的抉择

2020年6月GPT-3发布时，恰逢智谱公司成立一周年。张鹏邀请张钹院士来公司座谈，专门讨论GPT-3的意义。

张鹏

张院士给出的评价非常高。他说是一个比较里程碑式的进步。但是他当时还是担心一个问题——它不知道自己不知道。GPT-3那个时候大家都开玩笑说，它会一本正经的胡说八道。

GLM算法的诞生

2020年中到2021年，智谱团队用约一年时间研发出GLM算法——一种综合了BERT和GPT两种范式优势的创新架构。

BERT（双向注意力）

把中间抠掉，预测中间
既看前面也看后面
"填空机器人"
理解能力强

GPT（单向注意力）

从前往后，预测下一个
只看前面
"蹦词器"
生成能力强

技术创新

GLM的统一方法

GLM将BERT的双向预测通过词序调整，统一成单向后向预测——"把这两个模型就这样统一起来了"。这带来三个意外的工程优势：

能力综合：既能做填空，也能做续写预测
训练稳定性：部分双向注意力使大规模训练更稳定
量化友好：参数分布集中，量化精度损失小，推理成本更低

GLM-130B：千万人民币对标两千万美元

2021年底到2022年8月，智谱决策训练对标GPT-3的千亿参数模型。这是一个重大赌注——训练成本约1000万人民币（含人工），而GPT-3的训练成本约2000万美元。

400万

算力成本（人民币）

~1000万

含人工总成本（人民币）

1/14

相较GPT-3的成本比

9个月

训练周期

2022年8月开源后，斯坦福AI报告（李飞飞团队）将GLM-130B列为唯一参与评估且排名靠前的中国模型，"基本上跟GPT-3互有胜负"。

五、ChatGPT时刻：赌对之后的兴奋与焦虑

2022年11月30日ChatGPT上线时，智谱刚完成GLM-130B的训练和开源不到三个月。张鹏用两个词概括团队当时的状态：兴奋和焦虑。

兴奋：赌注下对了

"觉得这个事我们做对了，之前的那个赌注下对了"
"我们已经相对来说是比较靠近、接近ChatGPT的这个事情"
研究团队和工程团队春节没有休息，赶工推出ChatGLM
同时开源了ChatGLM-6B——一张家用GPU就能跑，成为第一款在开源社区爆火的产品

焦虑：烈火烹油之后剩下什么

"每逢大浪过来，再往后看一点，就是可能就是一片狼藉"
不是担心自己能不能留下，而是担心整个市场的极端走向——"如果这个市场都没有了，你做的再好也没用"
对资本热潮后的退潮有深刻警惕

张鹏

我不是焦虑自己能不能做出来。我怕的是整个市场有一个极端走向另外一个极端之后，然后塌掉之后，再很难回来。烈火烹油之后，剩下的是啥？

ChatGPT对智谱融资的关键帮助

在ChatGPT火爆之前，智谱正处于融资困难期。投资人"完全听不懂"大模型是什么，甚至要求"把估值降一半"。ChatGPT的爆火让一切反转——"大家再也不用质疑说你这东西到底是啥。我们就告诉他说ChatGPT你懂吗？我们做的这个事情就是往这儿去的。"此后变成投资人主动找智谱。

六、百模大战：纷纷扰扰中的定力

2023年，中国AI行业经历了"百模大战"。王慧文、王小川等知名企业家入局，Kimi、MiniMax等新锐崛起。张鹏描述了一个逐年变化的行业叙事：

中国大模型行业：逐年叙事焦点

对不同竞争者的评价

竞争者	张鹏的评价
王小川（百川）	"师兄"，经常在楼下碰面。小川倾向于做L0/L1/L2的分层模型，走垂直化路线。张鹏认为垂直化"没那么简单"，必须基于足够好的L0。
杨植麟（Kimi）	"非常聪明的一个人"，在学术上积累和研究非常深。张鹏认为"她应该能成"。
闫俊杰（MiniMax）	在WAIC上相邻而坐深聊。"非常聪明"，方向明确——直接奔着商业化，做消费、娱乐、情绪价值。
梁文峰（DeepSeek）	推测他"不想去做2B做服务"，"也不缺钱"，有执着的技术理想。猜测他想集中精力做技术探索。

23年最核心的伪命题：通用模型 vs 垂直模型

张鹏

到今天来看这个事情，你会发现当时聊了这个问题，它其实就是个伪命题。所谓的垂直模型在市面上根本就没有什么声音。它里边被人加了些佐料。

张鹏坚持认为：专用模型可以存在，但必须基于足够好的通用基座。"哪怕一个最好的医生，他也有基础教育。"

七、MaaS商业化：为什么不All in 2C

智谱在2021-2022年就提出了MaaS（Model as a Service）概念，定义了比当前市场理解更丰富的服务形态。

智谱定义的MaaS三种形态

云端API：通用服务，像用电一样
本地化部署：将模型作为可随意部署的组件
软硬件结合：可随时搬运的产品级服务

张鹏批评云厂商把MaaS概念收窄到只剩云端API——"他们想往这个方向引，因为这是他们的战场"。

放弃2C重投的决策

智谱也做了2C产品"智谱清言"，定位为效率工具。但张鹏描述了一个残酷的现实：

中国2C市场的困境

C端用户付费意愿极差
群雄割据必然导致"倒贴引流补贴"
使用曲线与工作学习时间高度重叠——是工具，不是娱乐
晚间唯一小高峰：家长辅导孩子作业
"算完LI之后，是很不合算的一件事情"

选择2B的逻辑

中国SaaS不成功的根因：同等成本可以雇10个人
2B虽然"故事不sexy"，但确定性更好
大家有默契：低价抢单不受欢迎
技术溢价空间：更少的人、更短的周期、更好的效果
前十大互联网企业中9家是智谱客户

转折点在DeepSeek发布之后："基本上我们就不再花很多精力资源去做推广。"在此之前还有克制地推过，之后明确收缩。

60%

企业客户占比

20%

政府客户占比

9/10

前十互联网企业中的客户数

八、Scaling Law的演进与L1-L5阶梯

张鹏提出了一个通用人工智能实现的L1到L5五级阶梯模型，每一级对应不同的Scaling Law核心变量：

阶段	名称	核心方法	Scaling Law的核心变量
L1	预训练	从数据中学习世界知识、常识	参数量、数据量、算力
L2	对齐与推理	SFT——正确使用知识，组合解答问题	推理计算量
L3	自学习	强化学习——在试错经验中学习	RL的Scaling
L4	自我认知	知道自己不知道什么	待定
L5	意识	类似人类的conscious	定义尚不清晰

张鹏

Scaling Law本身它提出来的时候是一个非常不严谨的说法。它只是个现象的描述，并没有一个很科学的依据。如果你发现了一个现象，对科学家来说最吸引人的是探究这个现象背后的原因到底是啥。

智谱在Scaling上的克制

当2023年市场都在追求"暴力美学"时，智谱始终保持参数规模的克制：

从GLM-130B到GLM-4，始终维持千亿级单体模型，未冲向万亿
GLM-4才扩到2000亿，后续GLM-4.5/4.6/4.7维持300多亿参数
重心放在数据工程、训练方式、架构优化上——"同样的参数量，用不同的数据训练出来的效果可能不一样"
将节省下来的计算量用于拓展新能力——"像做菜一样，各种佐料放一点"

GLM-4.7的效率突破

最新的GLM-4.7模型参数量仅300多亿，但表现"非常好"。秘诀在于：（1）训练效率更高、数据利用率更高；（2）模型结构设计时就考虑推理成本——单机8卡即可推理；（3）采用MOE架构并探索出"别人没探索过的空间"。

九、DeepSeek冲击：反思与重新出发

2025年初DeepSeek的发布对智谱产生了多维度的冲击。张鹏用"影响比较大"来形容，春节一回来就密集讨论。

技术层面的三个反思

DeepSeek教会智谱什么

强化学习投入不足："我们在这一块下的力气还不够。DeepSeek主要的贡献就是强化学习这一块。"
工程优化可以更极致：在效率和成本控制上还有空间
下一个范式应更大胆：DeepSeek尝试跳过SFT直接做强化学习——智谱也做了尝试，结论是暂时不能完全扔掉SFT，但RL要加强

商业层面的延迟效应

张鹏

给我们带来的影响就是——很多客户脑子里面把开源和免费划等号了。你那都开源都不要钱了，你为什么还要收我钱呢？

张鹏描述了一个典型场景：客户预算已批下来，本来要采购智谱的服务，但看到DeepSeek开源后就犹豫了。部分客户自己去尝试"DeepSeek一体机"，但过一段时间后大部分都"掉头回来"——因为DeepSeek不提供商业化服务，无法做系统整合。张鹏的结论是：DeepSeek"delay了一些客户"，但最终证明了商业化服务的不可替代性。

对DeepSeek开源的深层评价

开源和免费"不能直接划等号"——但在中国市场的话语体系中被混在一起
DeepSeek自身也承认吸取了大量开源社区养分
"即使不是他，也会有别人来做这个事"——开源是必然趋势
真正能复现DeepSeek结果的团队"也不多"

十、开源哲学：从130B到全系列开源

智谱是中国最早系统性开源大模型的公司之一。从2022年GLM-130B开始，至今已有六七十个开源项目，总下载量超过6000万次。

智谱开源时间线与里程碑

开源策略的演变

2022年8月：GLM-130B开源

第一次开源。动机："捏手里也没办法短时间变成钱，让更多人知道这件事情更重要。"目标是打出国际影响力。

2023年初：ChatGLM-6B开源

60亿参数版本，一张家用GPU即可运行。成为第一款爆火的开源项目，下载量极大。

2023-2024年：开源与商业化分离

明确将开源版本和商业化版本分开——开源放出核心技术，商业化提供产品、工具和服务。

2025年：GLM-4.5/4.6/4.7开源

低调发布但海外评价极高。Windsurf等美国公司直接将ChatGPT替换为GLM模型。

张鹏

你看我们发布上宣发上，其实我们并没有做太多的事情。你本质上还是把这个事情做好，大家认可你，自然而然就会有相应的回响。

"像水泥一样"的评价

一位外部观察者评价智谱"像水泥一样——有视野有技术，但boring"。张鹏对此坦然接受："就像大家评价清华理工男一样，很聪明也很能干，正经用途他能干得很漂亮，但是就是没有太多的情绪价值。"他承认在抓眼球和大众传播方面不如Kimi等竞品，"也跟我们的定位有关系"，但在开发者和程序员群体中口碑不错。

十一、AGI路线图：下一个范式在哪里

张鹏对AGI的时间表给出了相对谨慎的判断：可能2027年开始具备关键能力，之后还需要5-8年调整效率和安全。

Transformer不是终极答案

张鹏（引述唐杰老师观点）

Transformer不一定是终极答案。很有可能会有更有效或者更优美的算法结构来替代。

但张鹏认为即便在Transformer框架下，"还有很多空间可以挖"——从Attention机制的各种魔改，到MOE架构的新探索，"果实已经被人摘遍了，但并不代表没有果实了"。

下一个Scaling范式的预测

前沿判断

在线自学习（Online Learning）

张鹏个人预测下一个范式是训练和推理的统一——不再截然分割为两个阶段，而是形成完整闭环：推理产生反馈，反馈直接成为强化学习的输入，整个过程自动化且连续。

"可能那个时候模型的训练推理之间并没有特别明显的界限"
目前不确定是算法层面还是工程实践角度会首先突破

多模态统一是终极形态

张鹏确信不同模态（文本、图像、代码、Agent规划、VLA机器人控制）的原生融合是终极方向，而非系统化的外部组合。如果这一点加上在线学习同时实现，"AGI就看到曙光了"。

AGI曙光的条件

多模态原生融合的"脑子"——语言、视觉、物理世界判断
装上"手脚"与世界交互
交互结果返回为强化信号
能立刻接受并学习——闭环形成
关键决策：在什么范围、什么时候授权让AI自己探索世界

十二、学院派创业：工程师文化的利与弊

张鹏坦承自己"没有很好的准备就做了CEO，被推进了大浪之中"。但他认为"任何时候都是没有准备好的"，清华教会他的是学习的方法和能力。

张钹院士的"坎"理论

创业企业的三个生死坎

50人：只要挣到钱就行——关键是建立团队信心，别先散了
200人：分工出现，管理成本产生——"互相沟通交流对齐"成为核心挑战
500+人：出现分层、中间管理者——信息传导变长，管理空白地带出现

张鹏的亲身体验：从科建楼搬到两层办公室后，"有一批人我叫不出来名字了"——需要从个人掌控转向依赖机制和体制运转。

团队增长轨迹

~50

2022年团队规模

200+

2023年团队规模

400

2024年团队规模

800+

2025年团队规模

每年翻一倍，每年搬一次家（搬了三栋楼），直到2025年才稳定下来。

CEO的自我定位

张鹏

作为CEO是一个桥梁，是搭台子，让大家发挥自己的能力、想象力、执行力，去达成结果。很多时候小朋友们会做出来一些超出我们预期的事情，我挺享受这个过程的。

张鹏在深圳独自出差半年，带着几千万合同回到北京——"一个人去，真的待了半年，不停在想办法促成这件事情"。他认为学院派创业被诟病最多的是"对商业化比较忽视"，但智谱因为实验室阶段就有商业化基因，"大方向不会犯什么特别大的错误"。

十三、全球大模型第一股：上市的逻辑

2026年1月8日，智谱登陆港交所，成为中国首家、全球首家IPO的大模型公司。张鹏透露，上市计划早在公司成立第一天就已纳入规划。

从第一天就规划的IPO

公司成立时就建立了增长模型：每年100%-150%增长
倒推三年业绩期：实际上从2023年就开始规划营收、成本、团队发展
"到了现在今年报IPO什么，也是很自然的就走了这条路"

马拉松比喻

张鹏

实现AGI可能是一个马拉松，是一个长跑。在起步的时候你可能需要加一点速，跑到第一集团去。在中间大家都坚持不住的时候，你要去补给站拿一些补给。上市对我们来讲就自然而然的到了。

回应"泡沫论"和"大逃生"说

有AI 1.0创始人评价大模型公司上市是"大逃生"——赶在泡沫破裂前上市。张鹏用一系列反问拆解这个逻辑：

张鹏的逻辑推演

"假设它是一个bubble，我们上市能救AI吗？"——上市和泡沫没有必然关系
"你觉得投资够吗？"——"中国肯定不够，是美国的大概二十分之一"
"如果投资都不够的话，凭什么叫bubble呢？"
"离AGI还很远，如果我们不投资，它会自然发生吗？不会。"
类比互联网泡沫：泡沫破了，但网络基础设施和技术革新留下了——"你为什么要担心泡沫呢？"
"说白了还是担心自己兜里的钱、投资人的钱包"

上市前的Break a Leg

访谈发生在上市前夕。张鹏在出差途中摔断了跟腱，拄着拐杖来到访谈现场。他引用西方俚语"break a leg"（摔断一条腿=祝好运），几天后智谱确定于1月8日登陆港交所。张鹏评价自己是"天秤座的人，天生很平衡"——既期待又清醒。

张鹏

100年后如果智谱会出现在人工智能的历史书上，我希望它的注脚里面有这么一句话——智谱是AGI历史上的一个先行者。就开路的人。

启示与延伸思考

1. "认知智能"概念的前瞻性与局限性

智谱在2016年就提出"认知智能"作为下一代AI方向——比ChatGPT早了整整6年。这个判断的核心洞察是正确的：AI不应只是感知工具（识别图片、翻译语音），而应具备理解、推演、泛化的"脑子"。但张鹏也坦承，"认知的本质是什么"至今未有定论，大模型是否真正模拟了人的认知"肯定不是"。这意味着当前的大模型热潮可能只是认知智能漫长征途的一个阶段，而非终点。

2. 清华P2P基因的双刃剑效应

智谱从清华实验室继承的"Paper to Product"基因，使其在创业初期就有商业化能力和客户基础。但这种"水泥般"的工程师文化也使其在2C市场上缺乏"情绪价值"。值得注意的是，张鹏对此有清醒认知但并不试图改变——他选择在开发者和企业客户中建立口碑，而非追逐大众流量。这种策略在短期可能显得保守，但在长期可能更具持续性。

3. GLM架构的被低估优势

GLM的BERT+GPT统一方法带来了三个实用优势：训练稳定性、参数分布集中（量化友好）、既能填空也能续写。在当前推理成本居高不下的背景下，"量化精度损失小"这一点的商业价值可能被严重低估。智谱以GPT-3约1/14的成本训练出互有胜负的模型，这种成本效率优势可能是其最核心的竞争护城河。

4. 中国AI投资"远远不够"的判断值得重视

张鹏用"美国的二十分之一"来形容中国的AI投资规模，并用逻辑推演证明中国不存在AI泡沫——因为投入根本不够。这与市场上"大模型烧钱太猛"的主流叙事形成鲜明对比。如果这个判断成立，中国大模型行业面临的不是泡沫破裂风险，而是投资不足导致的竞争力衰减风险。

5. L1-L5阶梯模型的实践意义

张鹏提出的L1-L5框架不是学术分类，而是资源分配指南：当前处于L3（自学习/强化学习）阶段，Scaling Law的核心变量已从"堆参数"变为"RL的Scaling"。这解释了为什么智谱在参数规模上始终克制（300多亿参数的4.7效果优于许多更大的模型），而将资源集中在数据工程和强化学习上。DeepSeek的冲击本质上是证明了L3阶段的突破路径。

6. "开源不等于免费"的商业启示

智谱的开源策略提供了一个有趣的案例：开源核心技术建立影响力，但商业化服务（产品、工具、集成、交付）才是真正的价值创造。DeepSeek的彻底开源短期内给智谱带来了客户延迟，但最终反而证明了这一点——大部分客户在自行尝试后回流。这暗示了一个更普遍的规律：在中国市场，技术的可用性（能不能下载运行）和技术的可用性（能不能真正用于生产）之间存在巨大鸿沟。

7. AGI信仰与商业平衡的独特路径

张鹏明确拒绝"曲线救国"——不因为商业化困难就偏离AGI目标。他的论据有两层：（1）信仰一旦绕路就容易遗忘；（2）单项能力突破（如上一代AI的视觉突破）证明了"so what"——不解决根本问题。但与纯技术理想主义者不同，他又强调"做一家实现了AGI的公司"和"做一家利润很高的公司"并不对立。这种"天秤座式的平衡"——既不放弃理想也不脱离商业——可能是智谱能够走到IPO的核心原因。

智谱CEO张鹏：敢问路在何方？

目录