← 返回张小珺主页
深度研究 Deep Dive

智谱CEO张鹏:敢问路在何方?

#129 全球大模型第一股的上市访谈
2026.1.8 · 02:26:39 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 清华基因:从知识工程到认知智能
  2. 科技成果转化:第一个吃螃蟹的人
  3. P2P哲学与情报学的认知训练场
  4. 从GPT-3到GLM:技术路线的抉择
  5. ChatGPT时刻:赌对之后的兴奋与焦虑
  6. 百模大战:纷纷扰扰中的定力
  7. MaaS商业化:为什么不All in 2C
  8. Scaling Law的演进与L1-L5阶梯
  9. DeepSeek冲击:反思与重新出发
  10. 开源哲学:从130B到全系列开源
  11. AGI路线图:下一个范式在哪里
  12. 学院派创业:工程师文化的利与弊
  13. 全球大模型第一股:上市的逻辑
  14. 启示与延伸思考

一、清华基因:从知识工程到认知智能

张鹏的履历"非常简单":1998年进入清华大学,此后再未离开。他在清华计算机系的知识工程实验室工作,该实验室走出了旷视科技的联合创始人唐文斌、杨木等人——上一代"AI四小龙"的核心人物。

张鹏
从98年进了清华就没离开过,到现在为止,也在给清华打工——因为是我们的股东嘛。

2015-2016年:认知智能的提出

在观察了上一代AI企业的成功与局限后,张鹏和团队在2015-2016年左右开始内部讨论一个核心问题:下一代人工智能到底是什么?

核心概念

从感知智能到认知智能

上一代AI(如计算机视觉、语音识别)解决的是感知问题——"不知道它不知道"。张鹏引用张钹院士的象限图:当时的AI只能处理极小范围的已知问题。认知智能是迈向通用人工智能(AGI)的下一个台阶,核心在于让机器具备"知道自己不知道"的能力。

  • 感知智能:识别图片、翻译语音——"没有脑子",只是单个技能
  • 认知智能:理解、综合、推演、得出新知识——"有脑子"
  • 关键区别:能否泛化——根据有限样本推演未见过的情况

张鹏坦承,到今天认知的本质仍未被完全揭示。但这个方向性的判断,让智谱从创立之初就与纯商业化公司有了根本区别。

张鹏
现在包括大模型在内的这些技术,是不是真的模拟了人的认知,或者说掌握了人类认知的本质?我觉得肯定不是,还没有到那个地步。因为你自己都没搞清楚这个本质是啥。

二、科技成果转化:第一个吃螃蟹的人

智谱的诞生过程本身就是一段制度创新史。2018年,教育部等部委联合发文,允许科研院所在职人员用已有研究成果做科技成果转化。智谱成为清华计算机系第一家通过该通道成立的公司。

2016年

实验室内部开始讨论"下一代人工智能"方向,确认认知智能是核心。

2017年

团队以相对独立的方式开始运转,尝试在学校体制下走通商业化转化路径。当时在职人员开公司严格来说"不允许"。

2018年1月

国家出台科技成果转化意见,"开了一扇窗户"。智谱董事长刘德斌开始与清华谈判转化细节。

2019年6月

公司正式注册成立。整个谈判过程耗时一年半——包括成果评估、股权分配比例、合规流程等前所未有的细节。

制度创新的代价与收益

张鹏强调"前面没有人走过这个路"。学校也不清楚如何操作,双方在互相理解中摸索。分配比例、成果货币化评估、国资合规要求——这些细节全部是"第一次"。但这种正式路径也让智谱避免了后续的法律隐患,同时获得了清华作为股东的背书。

张鹏
其实我们自己想做这个事。不是谁要求我们去做。包括我们的团队还是非常幸运的一帮人,很多事情恰好就在那个时间发生了。

三、P2P哲学与情报学的认知训练场

清华知识工程实验室有一个延续至今的传统——P2P(Paper to Product),即研究成果必须转换成实际可用的产品或系统。张鹏在实验室中的角色正是负责"工程转化"。

AMiner:情报学与认知智能的天然交汇

智谱的起点产品AMiner是一个科技情报分析平台,在国际上有相当影响力。客户包括Google、IBM等顶级科技企业,为他们提供技术趋势预测服务。

  • 核心问题:未来3-5年哪些技术会成为热点?
  • 传统方法:专家调研、阅读文献、写报告——靠人工和经验
  • 智谱方法:用机器学习算法和模型自动分析——效率和速度完全不同
  • 商业成绩:实验室横向科研经费年收入接近2000万元,"少有的能挣美金的实验室"

情报学是认知智能最典型的应用场景

张鹏解释了为什么选择情报学作为起点:情报学要求理解已有文献中的知识,综合不同知识进行推演,最终得到新的知识——这本质上就是认知能力的密集应用。传统情报学归属于图书馆学,智谱从计算机科学的角度切入,用算法替代人工专家,是一次方法论的革命。

~2000万
实验室年横向科研经费(元)
美金
为国外企业服务的结算货币
1-2万人
公司成立初期团队规模

四、从GPT-3到GLM:技术路线的抉择

2020年6月GPT-3发布时,恰逢智谱公司成立一周年。张鹏邀请张钹院士来公司座谈,专门讨论GPT-3的意义。

张鹏
张院士给出的评价非常高。他说是一个比较里程碑式的进步。但是他当时还是担心一个问题——它不知道自己不知道。GPT-3那个时候大家都开玩笑说,它会一本正经的胡说八道。

GLM算法的诞生

2020年中到2021年,智谱团队用约一年时间研发出GLM算法——一种综合了BERT和GPT两种范式优势的创新架构。

BERT(双向注意力)

  • 把中间抠掉,预测中间
  • 既看前面也看后面
  • "填空机器人"
  • 理解能力强

GPT(单向注意力)

  • 从前往后,预测下一个
  • 只看前面
  • "蹦词器"
  • 生成能力强
技术创新

GLM的统一方法

GLM将BERT的双向预测通过词序调整,统一成单向后向预测——"把这两个模型就这样统一起来了"。这带来三个意外的工程优势:

  • 能力综合:既能做填空,也能做续写预测
  • 训练稳定性:部分双向注意力使大规模训练更稳定
  • 量化友好:参数分布集中,量化精度损失小,推理成本更低

GLM-130B:千万人民币对标两千万美元

2021年底到2022年8月,智谱决策训练对标GPT-3的千亿参数模型。这是一个重大赌注——训练成本约1000万人民币(含人工),而GPT-3的训练成本约2000万美元

400万
算力成本(人民币)
~1000万
含人工总成本(人民币)
1/14
相较GPT-3的成本比
9个月
训练周期

2022年8月开源后,斯坦福AI报告(李飞飞团队)将GLM-130B列为唯一参与评估且排名靠前的中国模型,"基本上跟GPT-3互有胜负"。

五、ChatGPT时刻:赌对之后的兴奋与焦虑

2022年11月30日ChatGPT上线时,智谱刚完成GLM-130B的训练和开源不到三个月。张鹏用两个词概括团队当时的状态:兴奋焦虑

兴奋:赌注下对了

  • "觉得这个事我们做对了,之前的那个赌注下对了"
  • "我们已经相对来说是比较靠近、接近ChatGPT的这个事情"
  • 研究团队和工程团队春节没有休息,赶工推出ChatGLM
  • 同时开源了ChatGLM-6B——一张家用GPU就能跑,成为第一款在开源社区爆火的产品

焦虑:烈火烹油之后剩下什么

  • "每逢大浪过来,再往后看一点,就是可能就是一片狼藉"
  • 不是担心自己能不能留下,而是担心整个市场的极端走向——"如果这个市场都没有了,你做的再好也没用"
  • 对资本热潮后的退潮有深刻警惕
张鹏
我不是焦虑自己能不能做出来。我怕的是整个市场有一个极端走向另外一个极端之后,然后塌掉之后,再很难回来。烈火烹油之后,剩下的是啥?

ChatGPT对智谱融资的关键帮助

在ChatGPT火爆之前,智谱正处于融资困难期。投资人"完全听不懂"大模型是什么,甚至要求"把估值降一半"。ChatGPT的爆火让一切反转——"大家再也不用质疑说你这东西到底是啥。我们就告诉他说ChatGPT你懂吗?我们做的这个事情就是往这儿去的。"此后变成投资人主动找智谱。

六、百模大战:纷纷扰扰中的定力

2023年,中国AI行业经历了"百模大战"。王慧文、王小川等知名企业家入局,KimiMiniMax等新锐崛起。张鹏描述了一个逐年变化的行业叙事:

中国大模型行业:逐年叙事焦点

对不同竞争者的评价

竞争者张鹏的评价
王小川(百川"师兄",经常在楼下碰面。小川倾向于做L0/L1/L2的分层模型,走垂直化路线。张鹏认为垂直化"没那么简单",必须基于足够好的L0。
杨植麟(Kimi)"非常聪明的一个人",在学术上积累和研究非常深。张鹏认为"她应该能成"。
闫俊杰(MiniMax)在WAIC上相邻而坐深聊。"非常聪明",方向明确——直接奔着商业化,做消费、娱乐、情绪价值。
梁文峰(DeepSeek推测他"不想去做2B做服务","也不缺钱",有执着的技术理想。猜测他想集中精力做技术探索。

23年最核心的伪命题:通用模型 vs 垂直模型

张鹏
到今天来看这个事情,你会发现当时聊了这个问题,它其实就是个伪命题。所谓的垂直模型在市面上根本就没有什么声音。它里边被人加了些佐料。

张鹏坚持认为:专用模型可以存在,但必须基于足够好的通用基座。"哪怕一个最好的医生,他也有基础教育。"

七、MaaS商业化:为什么不All in 2C

智谱在2021-2022年就提出了MaaS(Model as a Service)概念,定义了比当前市场理解更丰富的服务形态。

智谱定义的MaaS三种形态

  • 云端API:通用服务,像用电一样
  • 本地化部署:将模型作为可随意部署的组件
  • 软硬件结合:可随时搬运的产品级服务

张鹏批评云厂商把MaaS概念收窄到只剩云端API——"他们想往这个方向引,因为这是他们的战场"。

放弃2C重投的决策

智谱也做了2C产品"智谱清言",定位为效率工具。但张鹏描述了一个残酷的现实:

中国2C市场的困境

  • C端用户付费意愿极差
  • 群雄割据必然导致"倒贴引流补贴"
  • 使用曲线与工作学习时间高度重叠——是工具,不是娱乐
  • 晚间唯一小高峰:家长辅导孩子作业
  • "算完LI之后,是很不合算的一件事情"

选择2B的逻辑

  • 中国SaaS不成功的根因:同等成本可以雇10个人
  • 2B虽然"故事不sexy",但确定性更好
  • 大家有默契:低价抢单不受欢迎
  • 技术溢价空间:更少的人、更短的周期、更好的效果
  • 前十大互联网企业中9家是智谱客户

转折点在DeepSeek发布之后:"基本上我们就不再花很多精力资源去做推广。"在此之前还有克制地推过,之后明确收缩。

60%
企业客户占比
20%
政府客户占比
9/10
前十互联网企业中的客户数

八、Scaling Law的演进与L1-L5阶梯

张鹏提出了一个通用人工智能实现的L1到L5五级阶梯模型,每一级对应不同的Scaling Law核心变量:

阶段名称核心方法Scaling Law的核心变量
L1预训练从数据中学习世界知识、常识参数量、数据量、算力
L2对齐与推理SFT——正确使用知识,组合解答问题推理计算量
L3自学习强化学习——在试错经验中学习RL的Scaling
L4自我认知知道自己不知道什么待定
L5意识类似人类的conscious定义尚不清晰
张鹏
Scaling Law本身它提出来的时候是一个非常不严谨的说法。它只是个现象的描述,并没有一个很科学的依据。如果你发现了一个现象,对科学家来说最吸引人的是探究这个现象背后的原因到底是啥。

智谱在Scaling上的克制

当2023年市场都在追求"暴力美学"时,智谱始终保持参数规模的克制:

GLM-4.7的效率突破

最新的GLM-4.7模型参数量仅300多亿,但表现"非常好"。秘诀在于:(1)训练效率更高、数据利用率更高;(2)模型结构设计时就考虑推理成本——单机8卡即可推理;(3)采用MOE架构并探索出"别人没探索过的空间"。

九、DeepSeek冲击:反思与重新出发

2025年初DeepSeek的发布对智谱产生了多维度的冲击。张鹏用"影响比较大"来形容,春节一回来就密集讨论。

技术层面的三个反思

DeepSeek教会智谱什么

  • 强化学习投入不足:"我们在这一块下的力气还不够。DeepSeek主要的贡献就是强化学习这一块。"
  • 工程优化可以更极致:在效率和成本控制上还有空间
  • 下一个范式应更大胆:DeepSeek尝试跳过SFT直接做强化学习——智谱也做了尝试,结论是暂时不能完全扔掉SFT,但RL要加强

商业层面的延迟效应

张鹏
给我们带来的影响就是——很多客户脑子里面把开源和免费划等号了。你那都开源都不要钱了,你为什么还要收我钱呢?

张鹏描述了一个典型场景:客户预算已批下来,本来要采购智谱的服务,但看到DeepSeek开源后就犹豫了。部分客户自己去尝试"DeepSeek一体机",但过一段时间后大部分都"掉头回来"——因为DeepSeek不提供商业化服务,无法做系统整合。张鹏的结论是:DeepSeek"delay了一些客户",但最终证明了商业化服务的不可替代性。

对DeepSeek开源的深层评价

十、开源哲学:从130B到全系列开源

智谱是中国最早系统性开源大模型的公司之一。从2022年GLM-130B开始,至今已有六七十个开源项目,总下载量超过6000万次

智谱开源时间线与里程碑

开源策略的演变

2022年8月:GLM-130B开源

第一次开源。动机:"捏手里也没办法短时间变成钱,让更多人知道这件事情更重要。"目标是打出国际影响力。

2023年初:ChatGLM-6B开源

60亿参数版本,一张家用GPU即可运行。成为第一款爆火的开源项目,下载量极大。

2023-2024年:开源与商业化分离

明确将开源版本和商业化版本分开——开源放出核心技术,商业化提供产品、工具和服务。

2025年:GLM-4.5/4.6/4.7开源

低调发布但海外评价极高。Windsurf等美国公司直接将ChatGPT替换为GLM模型。

张鹏
你看我们发布上宣发上,其实我们并没有做太多的事情。你本质上还是把这个事情做好,大家认可你,自然而然就会有相应的回响。

"像水泥一样"的评价

一位外部观察者评价智谱"像水泥一样——有视野有技术,但boring"。张鹏对此坦然接受:"就像大家评价清华理工男一样,很聪明也很能干,正经用途他能干得很漂亮,但是就是没有太多的情绪价值。"他承认在抓眼球和大众传播方面不如Kimi等竞品,"也跟我们的定位有关系",但在开发者和程序员群体中口碑不错。

十一、AGI路线图:下一个范式在哪里

张鹏对AGI的时间表给出了相对谨慎的判断:可能2027年开始具备关键能力,之后还需要5-8年调整效率和安全。

Transformer不是终极答案

张鹏(引述唐杰老师观点)
Transformer不一定是终极答案。很有可能会有更有效或者更优美的算法结构来替代。

但张鹏认为即便在Transformer框架下,"还有很多空间可以挖"——从Attention机制的各种魔改,到MOE架构的新探索,"果实已经被人摘遍了,但并不代表没有果实了"。

下一个Scaling范式的预测

前沿判断

在线自学习(Online Learning)

张鹏个人预测下一个范式是训练和推理的统一——不再截然分割为两个阶段,而是形成完整闭环:推理产生反馈,反馈直接成为强化学习的输入,整个过程自动化且连续。

  • "可能那个时候模型的训练推理之间并没有特别明显的界限"
  • 目前不确定是算法层面还是工程实践角度会首先突破

多模态统一是终极形态

张鹏确信不同模态(文本、图像、代码、Agent规划、VLA机器人控制)的原生融合是终极方向,而非系统化的外部组合。如果这一点加上在线学习同时实现,"AGI就看到曙光了"。

AGI曙光的条件

  • 多模态原生融合的"脑子"——语言、视觉、物理世界判断
  • 装上"手脚"与世界交互
  • 交互结果返回为强化信号
  • 能立刻接受并学习——闭环形成
  • 关键决策:在什么范围、什么时候授权让AI自己探索世界

十二、学院派创业:工程师文化的利与弊

张鹏坦承自己"没有很好的准备就做了CEO,被推进了大浪之中"。但他认为"任何时候都是没有准备好的",清华教会他的是学习的方法和能力

张钹院士的"坎"理论

创业企业的三个生死坎

  • 50人:只要挣到钱就行——关键是建立团队信心,别先散了
  • 200人:分工出现,管理成本产生——"互相沟通交流对齐"成为核心挑战
  • 500+人:出现分层、中间管理者——信息传导变长,管理空白地带出现

张鹏的亲身体验:从科建楼搬到两层办公室后,"有一批人我叫不出来名字了"——需要从个人掌控转向依赖机制和体制运转。

团队增长轨迹

~50
2022年团队规模
200+
2023年团队规模
400
2024年团队规模
800+
2025年团队规模

每年翻一倍,每年搬一次家(搬了三栋楼),直到2025年才稳定下来。

CEO的自我定位

张鹏
作为CEO是一个桥梁,是搭台子,让大家发挥自己的能力、想象力、执行力,去达成结果。很多时候小朋友们会做出来一些超出我们预期的事情,我挺享受这个过程的。

张鹏在深圳独自出差半年,带着几千万合同回到北京——"一个人去,真的待了半年,不停在想办法促成这件事情"。他认为学院派创业被诟病最多的是"对商业化比较忽视",但智谱因为实验室阶段就有商业化基因,"大方向不会犯什么特别大的错误"。

十三、全球大模型第一股:上市的逻辑

2026年1月8日,智谱登陆港交所,成为中国首家、全球首家IPO的大模型公司。张鹏透露,上市计划早在公司成立第一天就已纳入规划。

从第一天就规划的IPO

  • 公司成立时就建立了增长模型:每年100%-150%增长
  • 倒推三年业绩期:实际上从2023年就开始规划营收、成本、团队发展
  • "到了现在今年报IPO什么,也是很自然的就走了这条路"

马拉松比喻

张鹏
实现AGI可能是一个马拉松,是一个长跑。在起步的时候你可能需要加一点速,跑到第一集团去。在中间大家都坚持不住的时候,你要去补给站拿一些补给。上市对我们来讲就自然而然的到了。

回应"泡沫论"和"大逃生"说

有AI 1.0创始人评价大模型公司上市是"大逃生"——赶在泡沫破裂前上市。张鹏用一系列反问拆解这个逻辑:

张鹏的逻辑推演

  • "假设它是一个bubble,我们上市能救AI吗?"——上市和泡沫没有必然关系
  • "你觉得投资够吗?"——"中国肯定不够,是美国的大概二十分之一"
  • "如果投资都不够的话,凭什么叫bubble呢?"
  • "离AGI还很远,如果我们不投资,它会自然发生吗?不会。"
  • 类比互联网泡沫:泡沫破了,但网络基础设施和技术革新留下了——"你为什么要担心泡沫呢?"
  • "说白了还是担心自己兜里的钱、投资人的钱包"

上市前的Break a Leg

访谈发生在上市前夕。张鹏在出差途中摔断了跟腱,拄着拐杖来到访谈现场。他引用西方俚语"break a leg"(摔断一条腿=祝好运),几天后智谱确定于1月8日登陆港交所。张鹏评价自己是"天秤座的人,天生很平衡"——既期待又清醒。

张鹏
100年后如果智谱会出现在人工智能的历史书上,我希望它的注脚里面有这么一句话——智谱是AGI历史上的一个先行者。就开路的人。

启示与延伸思考

1. "认知智能"概念的前瞻性与局限性

智谱在2016年就提出"认知智能"作为下一代AI方向——比ChatGPT早了整整6年。这个判断的核心洞察是正确的:AI不应只是感知工具(识别图片、翻译语音),而应具备理解、推演、泛化的"脑子"。但张鹏也坦承,"认知的本质是什么"至今未有定论,大模型是否真正模拟了人的认知"肯定不是"。这意味着当前的大模型热潮可能只是认知智能漫长征途的一个阶段,而非终点。

2. 清华P2P基因的双刃剑效应

智谱从清华实验室继承的"Paper to Product"基因,使其在创业初期就有商业化能力和客户基础。但这种"水泥般"的工程师文化也使其在2C市场上缺乏"情绪价值"。值得注意的是,张鹏对此有清醒认知但并不试图改变——他选择在开发者和企业客户中建立口碑,而非追逐大众流量。这种策略在短期可能显得保守,但在长期可能更具持续性。

3. GLM架构的被低估优势

GLM的BERT+GPT统一方法带来了三个实用优势:训练稳定性、参数分布集中(量化友好)、既能填空也能续写。在当前推理成本居高不下的背景下,"量化精度损失小"这一点的商业价值可能被严重低估。智谱以GPT-3约1/14的成本训练出互有胜负的模型,这种成本效率优势可能是其最核心的竞争护城河。

4. 中国AI投资"远远不够"的判断值得重视

张鹏用"美国的二十分之一"来形容中国的AI投资规模,并用逻辑推演证明中国不存在AI泡沫——因为投入根本不够。这与市场上"大模型烧钱太猛"的主流叙事形成鲜明对比。如果这个判断成立,中国大模型行业面临的不是泡沫破裂风险,而是投资不足导致的竞争力衰减风险

5. L1-L5阶梯模型的实践意义

张鹏提出的L1-L5框架不是学术分类,而是资源分配指南:当前处于L3(自学习/强化学习)阶段,Scaling Law的核心变量已从"堆参数"变为"RL的Scaling"。这解释了为什么智谱在参数规模上始终克制(300多亿参数的4.7效果优于许多更大的模型),而将资源集中在数据工程和强化学习上。DeepSeek的冲击本质上是证明了L3阶段的突破路径。

6. "开源不等于免费"的商业启示

智谱的开源策略提供了一个有趣的案例:开源核心技术建立影响力,但商业化服务(产品、工具、集成、交付)才是真正的价值创造。DeepSeek的彻底开源短期内给智谱带来了客户延迟,但最终反而证明了这一点——大部分客户在自行尝试后回流。这暗示了一个更普遍的规律:在中国市场,技术的可用性(能不能下载运行)和技术的可用性(能不能真正用于生产)之间存在巨大鸿沟。

7. AGI信仰与商业平衡的独特路径

张鹏明确拒绝"曲线救国"——不因为商业化困难就偏离AGI目标。他的论据有两层:(1)信仰一旦绕路就容易遗忘;(2)单项能力突破(如上一代AI的视觉突破)证明了"so what"——不解决根本问题。但与纯技术理想主义者不同,他又强调"做一家实现了AGI的公司"和"做一家利润很高的公司"并不对立。这种"天秤座式的平衡"——既不放弃理想也不脱离商业——可能是智谱能够走到IPO的核心原因。

延伸阅读