← 返回张小珺主页
深度研究 Deep Dive

融了近4亿的AI创业者在干嘛?

#84 岂凡超的第一次访谈
2024 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 人物速写:94年INTJ的清华NLP博士
  2. 创业起点:从反向词典到大模型
  3. 融资过山车:从无人问津到资本竞逐
  4. 战略转型:从训模型到做产品
  5. 核心判断:模型公司不会独立存在
  6. 产品哲学:信息 vs 内容的本质区分
  7. 信息分发三代演进
  8. 产品设计:解构内容为最小信息单元
  9. 大模型的不确定性困境
  10. 竞品观察:Cursor、NotebookLM与Perplexity
  11. 创业公司 vs 巨头的竞合关系
  12. 90后CEO的管理哲学
  13. AI公司组织形态的特殊性
  14. 对AGI与行业格局的判断
  15. 关键数据汇总
  16. 启示与延伸思考

一、人物速写:94年INTJ的清华NLP博士

94年
出生年份
INTJ
MBTI类型
12亿
公司估值(人民币)
60+
团队人数

教育与学术背景

2013-2017 清华电子系本科

本科期间接触计算机视觉(CV)研究,参与大众创业万众创新浪潮中的创业社团和创新创业方向双学位。

2017-2022 清华计算机系博士

师从孙茂松教授,研究方向从CV转向NLP。赶上大模型浪潮:2018年BERT出现、2020年GPT-3发布。在智源研究院支持下做了中国最早的大模型探索(智源悟道系列)。

2022年6月 博士毕业,正式创业

未找工作、未做博后,直接创业。创办深研科技(Deepline.ai)。

清华NLP的学术谱系

  • 自然语言处理与社会人文计算实验室:创始人黄昌宁(中国NLP开山鼻祖),孙茂松教授是中国大陆最早发表ACL/CL的作者之一,刘洋、刘知远亦为该实验室老师
  • 知识工程实验室(唐杰):与岂凡超所在实验室有密切合作
  • 该实验室此前已走出密率智能(涂存超)、吉瑞科技(武兵)等创业者
岂凡超
做产品,尤其是做2C的产品,对我的正反馈是前所未有的大。某种意义上,比我多发一篇好的顶会论文带来的正反馈还要强。

二、创业起点:从反向词典到大模型

WantWords反向词典

岂凡超在博士期间(2019-2020年)做了一个小demo叫WantWords反向词典——输入"今天天气很好",返回"风和日丽""天朗气清"等词语。灵感来自Hinton 2016年的一篇论文,论证反向词典是验证语义表示系统的好场景。

核心概念

反向词典(Reverse Dictionary)

正向词典:查词 → 获得定义。反向词典:输入含义描述 → 找到对应词语。支持跨语言(中→英、英→中)。发ACL顶会论文后做成产品,完全野生自然增长,至今已有近1000万用户

3000个APP的产品直觉

岂凡超透露,本科三四年间下载过至少3000多个APP来做探索——"闲暇时间的一个乐趣就是探索新的APP,看它有什么好玩的地方,以及它能够解决什么样的问题。"这种对产品的原生好奇心,是他从研究者转向产品创业者的底层驱动力。

为什么选择NLP而非CV

2016年AlphaGo之后的判断

  • 上一代CV公司技术高度同质化,场景集中在安防
  • 判断NLP"能做的事情会更多"——"代表着更高的人类的智慧"
  • "自然语言处理是人工智能皇冠上的明珠"
  • 2016-17年NLP的成熟度还比较低,能做的事情比较多

三、融资过山车:从无人问津到资本竞逐

2021年5月 决定创业

博士毕业前一年。大模型在当时还是"极强的非共识"——圈子之外的人对大模型"没有概念"。

2022年初 种子轮

获得奇迹创坛、英诺、水木、智源研究院的种子轮融资。"算是一个启动资金",金额不大。

2022年6-8月 碰壁期

参加奇迹创坛路演,200+投资人到场,陆续聊了六七十个——两个月内一张TS都没收到。投资人更多将他们看作SaaS公司而非AI公司。

2022年9-10月 第二轮(红杉)

赶上Generative AI浪潮(红杉美国发布GenAI报告),ChatGPT发布前两个月拿到红杉投资。

2023年 两轮融资

ChatGPT引爆共识后,大模型从"极强非共识"变为"极强共识"。腾讯、好未来等大机构入局。估值达12亿人民币,A+轮。

深研科技融资历程与市场温度
岂凡超
这个事情由原来一个非常强的非共识,在短短的时间内,快速变成了一个极强的共识。

见了100+投资人的教训

资本寒冬中的融资困境

  • 2022年初资本寒冬,AI投资"特别不被看好"——上一代AI多年未实现大规模商业落地
  • 投资人不关心大模型技术,关心"能对标海外什么样的产品"
  • 大家普遍把深研看作SaaS公司——在SaaS框架下,博士毕业直接创业"并不是优势"
  • 核心判断:不能只说"技术很厉害",必须讲清楚"为什么有了技术能做出什么产品,产品对用户有什么价值"

为什么没有融最多的钱

岂凡超
融更多的钱,尤其是超出当前状态和当前需要的钱数的话,它的边际效益会递减,而它的副作用会逐渐凸显出来。你就必须得为了更大的估值去做看起来有更强共识的事情,但有可能这些事情后来并不一定是成功率最大或者说最值得去做的事情。

四、战略转型:从训模型到做产品

深研科技经历了一次关键的战略转向——从训练大模型转向围绕产品需求做技术突破。

2022年上半年

Follow WebGPT做了AI搜索demo,还做了AI Summary、AI Writing等demo。效果没有达到预期——"基础模型的能力还远远不够"。

2023年上半年

拿到更多钱后投入训更大的模型。在内外部评测中拿过第一。尝试了pre-train阶段增加指令遵循能力、长结构化内容生成等差异化方向。

2023年8-9月 战略转折点

判断:(1)训大模型的差异化价值在缩小——"越来越多的大厂、初创、研究机构都在做";(2)原来想到的差异化"别人也看到了或已经在做了";(3)有了更强的基础模型后,产品距离理想状态仍有gap,且这个gap不是靠更强的通用模型就能解决的

2023年下半年至今

全面转向产品驱动:围绕"光靠现成大模型即使不断scale仍解决不好或解决不了的问题",做底层技术突破。

理想汽车类比:增程式混动的产品智慧

岂凡超用理想汽车的案例解释自己的产品逻辑:纯电技术一直在进步(类比大模型能力一直在提升),但理想选择了增程式混动路线——用现有技术部分解决续航焦虑,产品化速度更快,赢得了用户认可。"同样的话,怎么去把现有的技术转换成产品,这是很重要的。"

五、核心判断:模型公司不会独立存在

岂凡超
我认为可能将来是不存在模型即产品,可能也不存在所谓的模型公司。因为模型本身,它是没法直接产生价值的。

对"模型即产品"的反驳

岂凡超的判断框架

  • 模型仍遵循"研究→技术工程落地→产品化→商业化"的基本框架
  • Foundation Model公司最终都会找到自己的产品方向——"就像10年后不会有所谓的互联网公司或移动互联网公司"
  • "沿途下的蛋"说法"既对也不对"——如果心目中的AGI实现了,确实不需要产品形态;但AGI三五年内实现不了,必须考虑现有能力下能做什么
  • ChatGPT的成功不在于产品设计精巧,唯一不同是模型能力的巨大提升

模型视角

  • 模型能力在变好过程中"沿途下蛋"
  • 模型 = 产品(至少短期内)
  • 核心看模型benchmark
  • 南坡/北坡之分

岂凡超的产品视角

  • 产品需要ABCDE五项能力,模型只满足了A和B
  • 模型公司终将变成产品公司
  • 核心看用户需求是否被满足
  • 不是南坡北坡,是"从用户价值出发看技术匹配度"
核心类比

七龙珠模型

做产品就像凑七龙珠——一个产品需要ABC三个能力,原有技术满足了A和B,大模型恰好填上了C。"凑齐了七龙珠",产品就成立了。不是说大模型一个技术就能解决所有问题,而是在产品需求链路上补齐了某个关键环节。类比:打车外卖不是因为有了LBS就够了,LBS只是把链路中某些环节填上了。

六、产品哲学:信息 vs 内容的本质区分

这是岂凡超在整场访谈中阐述最深入的思想——信息和内容的根本区别

核心区分

信息 ≠ 内容

信息是"把你的不确定性降低"的东西。内容是信息的载体。同一条信息(如"OpenAI发了新模型")可以通过文章、视频、音频、朋友圈等各种内容载体呈现。消费不同载体获得的信息是一样的——"你可能都是知道了这件事"。

岂凡超
前面做的所谓的信息分发,归根到底做的都是内容的分发。而内容分发,它最小的颗粒度就是一个文章、一个视频。但实际上对用户来讲,消费一个完整的内容,并不一定是他获取这个信息最高效的方式。

信息获取效率的优化空间

当前的低效之处

  • 从头到尾读一篇论文/看一个视频,不是每一个字、每一个片段对你都有同等价值
  • 用户通过拖进度条、长按加速来跳过低价值片段——"并不是用户友好的处理方式"
  • 在多个内容中切换时,你不知道哪些片段对你有价值,只能边看边判断
  • 推荐引擎以内容为颗粒度分发,导致大量同质化内容(A和B可能承载相同信息)

Steven Pinker的启发

岂凡超引用Steven Pinker的名言:"写作就是把网状的思想,用树状的语法,写成线性的文字。"深研的产品逻辑是反过来:把线性的文字还原成树状的语法,然后将来可能再还原成网状的思想。这决定了产品的"智能大纲"功能——将文章按原文结构层级展开,每一层都可追溯原文。

七、信息分发三代演进

岂凡超完整梳理了从互联网前到AI时代的信息分发演进逻辑。

信息分发三代演进:供给、分发、消费的权力转移
时代供给侧分发方式消费侧话语权重心
互联网前物理媒介(图书、杂志、报刊),创作门槛高出版发行有限,必须在物理空间消费生产者话语权极强
互联网时代门户网站、BBS,创作门槛降低门户分类 + 搜索引擎(主动检索)PC端消费,时间相对集中平台话语权上升
移动互联网人人可创作(UGC),信息再次爆炸推荐引擎(被动推送),颗粒度=完整内容碎片化时间被占满分发平台话语权极强
AI时代(预测)AI可从零创作,供给无限过剩信息级分发(颗粒度=最小信息单元)个性化AI助手为每个人重组内容消费者话语权最强
岂凡超
内容的消费者,他的话语权会更强。将来有可能是每一个消费者自己会有一个专属于自己的内容加工和信息获取的AI助理,来为你去创作内容。

内容产业链重构

创作者角色的变化

  • 内容创作者和信息提供者一定是有价值的——AI无法从零到一产生所有内容,上游需要源头信息
  • 但创作者交付的东西会变化:不再是完整内容,而是AI加工的输送语料
  • 将出现"新一代内容创作者":类比自然语言编程——人不直接创作内容,而是通过Prompt操控AI创作自媒体频道
  • 利益分配方式会发生变化

八、产品设计:解构内容为最小信息单元

产品"语鲸"的核心技术逻辑

三步流程

  • 第一步:解构——遵循语法和语言学原则,将原始内容拆解为"最小信息单元"的片段
  • 第二步:信息级分析——以最小信息单元为研究对象,判断信息间关系、哪些信息重复/一致、哪些对用户有价值
  • 第三步:重组——基于用户感兴趣的信息点,重组成新的个性化内容

跨内容聚合的价值

同一主题可能有五篇文章、三个视频、一个音频。产品会:

Web端(工具属性)

  • 用户上传内容/给链接/PDF
  • 智能大纲:按原文结构层级展开
  • 生成内容与原文一一对应
  • 幻觉极低,不遗漏原文内容
  • 面向泛研究人群

移动端(消费属性)

  • 订阅信息源,自动推送
  • 同主题多源文章自动聚合
  • 每句话可追溯原始片段
  • 结构化内容呈现
  • 更强调被动获取信息
岂凡超
人越被动越好。模型或者说这个产品越主动,人越被动,这是一个更好的方式。

为什么叫"语鲸"

命名逻辑

  • 智商:鲸在所有动物中智商较高,有自己的语言(鲸歌)
  • 容量:鲸是大型生物——希望产品能存储和记忆足够多的东西
  • 将来成为用户的AI信息助手时,必须"帮你记住很多东西,同时能比较聪明地帮你处理"

九、大模型的不确定性困境

岂凡超花了大量篇幅阐述大模型产品化面临的根本困境——不确定性

核心困境

概率模型 + 多样性 = 幻觉

大模型本质是概率模型。我们希望它有更大的多样性、能做更多的事——但多样性的一体两面就是"幻觉"。核心解法:把它发挥错误的概率尽可能降低,把它错误能够影响的面尽可能缩小

不确定性如何影响产品

互联网/移动互联网产品

  • 技术确定性高:边界清晰
  • 做出MVP = 百分之七八十的价值
  • 核心功能从第一版到现在基本没变
  • 通信、数据库等技术是确定性的
  • "做产品很幸福"

大模型产品

  • 模型输出不确定性极高
  • 能不能做、能不能做成、什么时候做成——全不确定
  • 难以判断:是模型能力不够?需求没找对?还是产品设计有问题?
  • 模型能力本身在变化
  • "有些能力可能通过演变又出现了,速度比想象中快很多"

深研的解法:前向+后向控制

把大模型控制在有限空间内

  • 前向操作:通过更确定性的方式缩小模型的发挥空间
  • 后向操作:通过知识库等手段对模型结果做校验
  • 结果:生成内容完全遵循原始内容的结构和顺序,每一句话可追溯回原文
  • "准确率和召回率"——生成的东西又准又全

对RAG的判断

岂凡超
很难完全光靠RAG来解决幻觉问题。RAG能缓解模型内部存储知识可能出错的问题,但缓解不了模型对现有信息进行加工处理过程中还会带来的错误。搜到的结果是A,回答出来仍然有可能是B。

十、竞品观察:Cursor、NotebookLM与Perplexity

产品岂凡超的观察与深研的共性差异点
Cursor细节打磨极致,主动提醒用户(而非等用户指令),符合"让用户更被动"的理念。"一定是自己在深夜里编程遇到很多bug解决很多问题"的一手经验让用户被动获益面向开发者,非信息消费
NotebookLM一年半迭代后因AI生成播客一炮而红。爆点功能吸引用户知道产品,但留存靠基础能力借助AI把原始内容加工成个性化新内容交互形态不同
Perplexity在Google大树下做AI搜索并快速发展,打破了内容边界。最大挑战是"用户不知道怎么问出好问题"从原始内容中找到信息重组成新内容需要用户主动提问(高脑力成本),深研希望更被动

基础功能 vs 爆点功能

NotebookLM的案例给岂凡超最大的启发:相当部分用户因AI播客功能知道了这个产品,但更多人留下是因为基础能力。"这两个能力都得有。"深研之前花了很多时间打磨基础能力,未来要用更快节奏推出爆点功能。

为什么不直接做AI搜索

三个原因

  • 竞争格局:搜索引擎公司有现成的技术、数据、市场、用户,做AI搜索"最适合不过"
  • 国内特殊性:内容和数据分散在多个封闭平台,不像海外搜索数据相对集中
  • 交互门槛:搜索需要用户消耗太多脑力——有主动需求→转变成问题→转变成自然语言→说出来或敲出来——"是一个挺消耗脑力和精力的事情"

十一、创业公司 vs 巨头的竞合关系

这一波与上一波AI创业的不同

上一代AI创业(CV时代)

  • 大厂在AI的储备相对少
  • 初创公司有更长的时间窗口
  • 先发优势可以持续较久

大模型时代

  • 大厂人才储备非常充足
  • 共识达成极快,先发优势很快被抹平
  • "并不是因为你做的早半年一年就能建立巩固优势"
  • 投入资源多,大厂开始渗透原来看起来更小的事
岂凡超
核心还是要去做对于大公司来讲他自己很难去做或者说他自己并不愿意去做的一些事情。当然说现在他不愿意做的事情比之前要少很多。

竞合关系

十二、90后CEO的管理哲学

从研究者到CEO的转变

做研究

  • 在某个点做出一点突破就够了
  • 工种单一的小团队
  • 所有信息在自己脑子里
  • 不需要强目标和边界

做公司

  • 不能有短板,且得有长板
  • 多工种分工的更大团队
  • 信息必须同步给所有人
  • 目标、资源、时间都有约束

管理风格

几个鲜明特征

  • 反信息差:"非常不喜欢"信息差管理——"对于达到目标来讲是一个低效的行为"
  • 坦诚沟通:每月一次公开沟通,任何问题都可以交流,所有信息拉齐
  • 不发脾气:对外从未发过脾气。"发脾气可能并不一定对你的结果是有正向帮助的"
  • 以理性为主:一直是理工科训练出的理性思维方式,不用情绪做管理
  • 基于共识决策:不因CEO角色要求大家听从,而是把信息拉齐后达成一致

INTJ的自嘲

岂凡超
我之前干过一个挺蠢的事情。我是一个非常J的人,就把公司所有人的邮箱名都改成了标准格式——名.姓@deepline.ai。后来发现这个事情的收益没有成本高:大家的切换成本很大,原来注册的账号都受影响。这个世界的熵增是一个必然趋势,你想把熵降低就要付出成本。

90后CEO的代际特征

岂凡超观察到几个90后CEO的共性:(1)互联网原住民,从小离不开电脑和网络;(2)成长于中国综合国力上升期,做产品有更大的全球视野——"创业Day One就需要面向全球";(3)技术型CEO为主,不太用情绪做管理;(4)承认自己"某种意义上还挺幼稚的"——希望用最简单的方式思考问题。

十三、AI公司组织形态的特殊性

岂凡超认为AI公司的组织形态与互联网/移动互联网公司有本质不同,根源在于底层不确定性

组织逻辑

不确定性如何层层影响组织

模型输出的不确定性 → "这个东西能不能做、能不能做成、什么时候做成"全不确定 → 目标怎么定、团队怎么配合、信息怎么拉齐全受影响 → 组织的分工协作难度远高于互联网公司。

两个关键差异

差异一:信息传递效率必须更高

不能只通过确定性接口接收和传出数据。在AI公司里,"这个东西能做成"没有信息量——真正有信息量的是"在什么条件下、在什么数据下,能达到一个什么样的指标"。只有把这种细粒度信息传递到位,决策才能达成一致。

差异二:个体覆盖链路必须更长

如果只知道自己环节的东西,很难理解上下游的不确定性会对自己产生什么影响。每个人需要跨越更长的链路来理解全局。

岂凡超
组织是有反规模效应的。我们尽可能希望在相对有限的组织内,尽可能做到当前能达到的目标。

十四、对AGI与行业格局的判断

对AGI的定义和时间表

岂凡超心目中的AGI

  • 思考、知识、推理、语言交互——这些都是必须的
  • 更重要的一点:有自我的意识
  • 对AGI到来"非常激动",但理性判断:三五年内甚至更久都很难实现

2025年AI爆发预测

岂凡超
2025年就有非常大的概率会爆发。底层逻辑是大家越来越了解大模型能做和做不好的事情,更多团队开始用其他手段补足能力。半年到一年的时间,更多好的产品就开始会出现。
AI产品成熟度:Gartner曲线的位置判断

商业模式探索

开放式探索

  • 前向付费模式:订阅+高级功能
  • 新型流量变现:有了AI即时生产个性化内容后,原来的流量变现模式已"固化",需要新的可能性
  • 参考Perplexity的探索方向
  • 前提:先把产品价值做出来——"只要产品真的给用户带来了不可替代的价值,一定能通过各种方式赚到钱"

创业的航海隐喻

岂凡超
创业真的挺像航海的。尤其是如果你想做出一些真的差异化的、别人没做过的事情的时候,你没法按图索骥。你只能相信自己内心的那个信念,遇到什么问题解决什么问题。在海上茫茫无际,四周都是海,也没有什么灯塔。但是你要做的就是自己相信前方的那个目标,然后还有这个船上有一船同样相信那个目标的人,带领着大家不断地往前走。

十五、关键数据汇总

维度具体内容
创始人年龄94年生,访谈时刚满30岁
MBTIINTJ("很强的J人")
教育清华电子系本科 → 计算机系博士(孙茂松)
公司深研科技(Deepline.ai),2022年3月17日成立
融资轮次A+轮
估值12亿人民币
团队规模60+人
盈利状态亏损
反向词典用户近1000万(自然增长)
本科体验APP数3000+
见过的投资人100+机构
碰壁期2022年6-8月,两个月零TS
产品名称语鲸
核心投资方奇迹创坛、红杉、腾讯、好未来等
AGI时间预测三五年内甚至更久都很难实现
AI产品爆发预测2025年,半年到一年内
推荐书目《自私的基因》《学会提问》
关注的创业方向养老

十六、启示与延伸思考

1. "模型公司不会独立存在"——一个比行业共识更早的判断

岂凡超在2021年决定创业时就选择了"产品优先"路线,在2023年9月大模型热潮最盛时主动从训模型转向做产品。这个判断的底层逻辑是:模型本身没法直接产生价值,必须通过产品转化。到2024-2025年,这逐渐成为行业共识——但他付出的代价是,在23年融资最容易的时候没有选择融最多的钱去做Foundation Model。

2. "信息 ≠ 内容"——一个被忽视的产品设计基本功

推荐引擎分发的是内容(文章、视频),不是信息。同一条信息被包装在N个内容载体中重复推送给用户。岂凡超抓住的优化空间是:把内容解构为最小信息单元,在信息层面去重、筛选、重组。这不是AI搜索(用户主动提问),而是信息级的被动推送——"人越被动越好"。这个思路比大多数AI内容产品想得更深一层。

3. 不确定性是大模型产品化的根本性挑战

移动互联网产品做出MVP就有七八成价值,核心功能十年不变。大模型产品不是这样——"能不能做、什么时候做成"全不确定。这导致三个判断失灵:(1)不确定是模型能力不够还是产品设计有问题;(2)团队目标和分工协作的难度大增;(3)每个人必须覆盖更长的链路才能理解全局。岂凡超的应对是"前向控制+后向校验"——在模型外部建确定性框架。

4. "七龙珠模型"值得所有AI创业者思考

产品需要ABCDE五项能力,大模型只是补齐了其中一两项。真正的产品化不是"模型越强产品越好",而是找到那些光靠scale model仍然解决不了的gap,用其他技术手段补齐。这与行业主流的"等模型变强产品自然就好"逻辑完全不同。岂凡超的类比——LBS之于打车外卖——精准点明了大模型在产品中的真实位置。

5. 融资的"反边际效应"——融太多钱的副作用

在2023年AI融资最热时,岂凡超没有选择融最多的钱。他的逻辑是:超出需要的融资金额,边际效益递减,且会被迫做"看起来有强共识但未必最优"的事情。这是一个反直觉的判断——大多数创业者的本能是"能融多少融多少"。他的克制来自一个清醒的认知:做有差异化的事情比做有共识的事情更重要。

6. 先发优势在大模型时代被极度压缩

岂凡超有切身体会:2021年大模型是极强非共识,短短几个月变成极强共识。与上一代AI(CV时代)不同,大厂在LLM上的人才储备极其充足,共识达成极快。先发优势"半年一年就被抹平"。这意味着AI创业公司不能靠"做得早"获取竞争壁垒,必须找到大公司"很难做或不愿意做"的事情。

7. 90后技术型CEO的管理风格正在塑造新一代公司文化

反信息差管理、不发脾气、基于共识决策、理性驱动——这些不是软弱,而是一种适配AI时代不确定性的组织哲学。当底层技术高度不确定时,信息传递效率和团队认知对齐比传统的层级管控更重要。岂凡超坦承的"邮箱改名事件"也展示了一种稀有的品质:创业者对自己的过度完美主义保持自觉和自嘲。

延伸阅读