本科期间接触计算机视觉(CV)研究,参与大众创业万众创新浪潮中的创业社团和创新创业方向双学位。
师从孙茂松教授,研究方向从CV转向NLP。赶上大模型浪潮:2018年BERT出现、2020年GPT-3发布。在智源研究院支持下做了中国最早的大模型探索(智源悟道系列)。
未找工作、未做博后,直接创业。创办深研科技(Deepline.ai)。
岂凡超在博士期间(2019-2020年)做了一个小demo叫WantWords反向词典——输入"今天天气很好",返回"风和日丽""天朗气清"等词语。灵感来自Hinton 2016年的一篇论文,论证反向词典是验证语义表示系统的好场景。
正向词典:查词 → 获得定义。反向词典:输入含义描述 → 找到对应词语。支持跨语言(中→英、英→中)。发ACL顶会论文后做成产品,完全野生自然增长,至今已有近1000万用户。
岂凡超透露,本科三四年间下载过至少3000多个APP来做探索——"闲暇时间的一个乐趣就是探索新的APP,看它有什么好玩的地方,以及它能够解决什么样的问题。"这种对产品的原生好奇心,是他从研究者转向产品创业者的底层驱动力。
博士毕业前一年。大模型在当时还是"极强的非共识"——圈子之外的人对大模型"没有概念"。
获得奇迹创坛、英诺、水木、智源研究院的种子轮融资。"算是一个启动资金",金额不大。
参加奇迹创坛路演,200+投资人到场,陆续聊了六七十个——两个月内一张TS都没收到。投资人更多将他们看作SaaS公司而非AI公司。
赶上Generative AI浪潮(红杉美国发布GenAI报告),ChatGPT发布前两个月拿到红杉投资。
ChatGPT引爆共识后,大模型从"极强非共识"变为"极强共识"。腾讯、好未来等大机构入局。估值达12亿人民币,A+轮。
深研科技经历了一次关键的战略转向——从训练大模型转向围绕产品需求做技术突破。
Follow WebGPT做了AI搜索demo,还做了AI Summary、AI Writing等demo。效果没有达到预期——"基础模型的能力还远远不够"。
拿到更多钱后投入训更大的模型。在内外部评测中拿过第一。尝试了pre-train阶段增加指令遵循能力、长结构化内容生成等差异化方向。
判断:(1)训大模型的差异化价值在缩小——"越来越多的大厂、初创、研究机构都在做";(2)原来想到的差异化"别人也看到了或已经在做了";(3)有了更强的基础模型后,产品距离理想状态仍有gap,且这个gap不是靠更强的通用模型就能解决的。
全面转向产品驱动:围绕"光靠现成大模型即使不断scale仍解决不好或解决不了的问题",做底层技术突破。
岂凡超用理想汽车的案例解释自己的产品逻辑:纯电技术一直在进步(类比大模型能力一直在提升),但理想选择了增程式混动路线——用现有技术部分解决续航焦虑,产品化速度更快,赢得了用户认可。"同样的话,怎么去把现有的技术转换成产品,这是很重要的。"
做产品就像凑七龙珠——一个产品需要ABC三个能力,原有技术满足了A和B,大模型恰好填上了C。"凑齐了七龙珠",产品就成立了。不是说大模型一个技术就能解决所有问题,而是在产品需求链路上补齐了某个关键环节。类比:打车外卖不是因为有了LBS就够了,LBS只是把链路中某些环节填上了。
这是岂凡超在整场访谈中阐述最深入的思想——信息和内容的根本区别。
信息是"把你的不确定性降低"的东西。内容是信息的载体。同一条信息(如"OpenAI发了新模型")可以通过文章、视频、音频、朋友圈等各种内容载体呈现。消费不同载体获得的信息是一样的——"你可能都是知道了这件事"。
岂凡超引用Steven Pinker的名言:"写作就是把网状的思想,用树状的语法,写成线性的文字。"深研的产品逻辑是反过来:把线性的文字还原成树状的语法,然后将来可能再还原成网状的思想。这决定了产品的"智能大纲"功能——将文章按原文结构层级展开,每一层都可追溯原文。
岂凡超完整梳理了从互联网前到AI时代的信息分发演进逻辑。
| 时代 | 供给侧 | 分发方式 | 消费侧 | 话语权重心 |
|---|---|---|---|---|
| 互联网前 | 物理媒介(图书、杂志、报刊),创作门槛高 | 出版发行 | 有限,必须在物理空间消费 | 生产者话语权极强 |
| 互联网时代 | 门户网站、BBS,创作门槛降低 | 门户分类 + 搜索引擎(主动检索) | PC端消费,时间相对集中 | 平台话语权上升 |
| 移动互联网 | 人人可创作(UGC),信息再次爆炸 | 推荐引擎(被动推送),颗粒度=完整内容 | 碎片化时间被占满 | 分发平台话语权极强 |
| AI时代(预测) | AI可从零创作,供给无限过剩 | 信息级分发(颗粒度=最小信息单元) | 个性化AI助手为每个人重组内容 | 消费者话语权最强 |
同一主题可能有五篇文章、三个视频、一个音频。产品会:
岂凡超花了大量篇幅阐述大模型产品化面临的根本困境——不确定性。
大模型本质是概率模型。我们希望它有更大的多样性、能做更多的事——但多样性的一体两面就是"幻觉"。核心解法:把它发挥错误的概率尽可能降低,把它错误能够影响的面尽可能缩小。
| 产品 | 岂凡超的观察 | 与深研的共性 | 差异点 |
|---|---|---|---|
| Cursor | 细节打磨极致,主动提醒用户(而非等用户指令),符合"让用户更被动"的理念。"一定是自己在深夜里编程遇到很多bug解决很多问题"的一手经验 | 让用户被动获益 | 面向开发者,非信息消费 |
| NotebookLM | 一年半迭代后因AI生成播客一炮而红。爆点功能吸引用户知道产品,但留存靠基础能力 | 借助AI把原始内容加工成个性化新内容 | 交互形态不同 |
| Perplexity | 在Google大树下做AI搜索并快速发展,打破了内容边界。最大挑战是"用户不知道怎么问出好问题" | 从原始内容中找到信息重组成新内容 | 需要用户主动提问(高脑力成本),深研希望更被动 |
NotebookLM的案例给岂凡超最大的启发:相当部分用户因AI播客功能知道了这个产品,但更多人留下是因为基础能力。"这两个能力都得有。"深研之前花了很多时间打磨基础能力,未来要用更快节奏推出爆点功能。
岂凡超观察到几个90后CEO的共性:(1)互联网原住民,从小离不开电脑和网络;(2)成长于中国综合国力上升期,做产品有更大的全球视野——"创业Day One就需要面向全球";(3)技术型CEO为主,不太用情绪做管理;(4)承认自己"某种意义上还挺幼稚的"——希望用最简单的方式思考问题。
岂凡超认为AI公司的组织形态与互联网/移动互联网公司有本质不同,根源在于底层不确定性。
模型输出的不确定性 → "这个东西能不能做、能不能做成、什么时候做成"全不确定 → 目标怎么定、团队怎么配合、信息怎么拉齐全受影响 → 组织的分工协作难度远高于互联网公司。
不能只通过确定性接口接收和传出数据。在AI公司里,"这个东西能做成"没有信息量——真正有信息量的是"在什么条件下、在什么数据下,能达到一个什么样的指标"。只有把这种细粒度信息传递到位,决策才能达成一致。
如果只知道自己环节的东西,很难理解上下游的不确定性会对自己产生什么影响。每个人需要跨越更长的链路来理解全局。
| 维度 | 具体内容 |
|---|---|
| 创始人年龄 | 94年生,访谈时刚满30岁 |
| MBTI | INTJ("很强的J人") |
| 教育 | 清华电子系本科 → 计算机系博士(孙茂松) |
| 公司 | 深研科技(Deepline.ai),2022年3月17日成立 |
| 融资轮次 | A+轮 |
| 估值 | 12亿人民币 |
| 团队规模 | 60+人 |
| 盈利状态 | 亏损 |
| 反向词典用户 | 近1000万(自然增长) |
| 本科体验APP数 | 3000+ |
| 见过的投资人 | 100+机构 |
| 碰壁期 | 2022年6-8月,两个月零TS |
| 产品名称 | 语鲸 |
| 核心投资方 | 奇迹创坛、红杉、腾讯、好未来等 |
| AGI时间预测 | 三五年内甚至更久都很难实现 |
| AI产品爆发预测 | 2025年,半年到一年内 |
| 推荐书目 | 《自私的基因》《学会提问》 |
| 关注的创业方向 | 养老 |
岂凡超在2021年决定创业时就选择了"产品优先"路线,在2023年9月大模型热潮最盛时主动从训模型转向做产品。这个判断的底层逻辑是:模型本身没法直接产生价值,必须通过产品转化。到2024-2025年,这逐渐成为行业共识——但他付出的代价是,在23年融资最容易的时候没有选择融最多的钱去做Foundation Model。
推荐引擎分发的是内容(文章、视频),不是信息。同一条信息被包装在N个内容载体中重复推送给用户。岂凡超抓住的优化空间是:把内容解构为最小信息单元,在信息层面去重、筛选、重组。这不是AI搜索(用户主动提问),而是信息级的被动推送——"人越被动越好"。这个思路比大多数AI内容产品想得更深一层。
移动互联网产品做出MVP就有七八成价值,核心功能十年不变。大模型产品不是这样——"能不能做、什么时候做成"全不确定。这导致三个判断失灵:(1)不确定是模型能力不够还是产品设计有问题;(2)团队目标和分工协作的难度大增;(3)每个人必须覆盖更长的链路才能理解全局。岂凡超的应对是"前向控制+后向校验"——在模型外部建确定性框架。
产品需要ABCDE五项能力,大模型只是补齐了其中一两项。真正的产品化不是"模型越强产品越好",而是找到那些光靠scale model仍然解决不了的gap,用其他技术手段补齐。这与行业主流的"等模型变强产品自然就好"逻辑完全不同。岂凡超的类比——LBS之于打车外卖——精准点明了大模型在产品中的真实位置。
在2023年AI融资最热时,岂凡超没有选择融最多的钱。他的逻辑是:超出需要的融资金额,边际效益递减,且会被迫做"看起来有强共识但未必最优"的事情。这是一个反直觉的判断——大多数创业者的本能是"能融多少融多少"。他的克制来自一个清醒的认知:做有差异化的事情比做有共识的事情更重要。
岂凡超有切身体会:2021年大模型是极强非共识,短短几个月变成极强共识。与上一代AI(CV时代)不同,大厂在LLM上的人才储备极其充足,共识达成极快。先发优势"半年一年就被抹平"。这意味着AI创业公司不能靠"做得早"获取竞争壁垒,必须找到大公司"很难做或不愿意做"的事情。
反信息差管理、不发脾气、基于共识决策、理性驱动——这些不是软弱,而是一种适配AI时代不确定性的组织哲学。当底层技术高度不确定时,信息传递效率和团队认知对齐比传统的层级管控更重要。岂凡超坦承的"邮箱改名事件"也展示了一种稀有的品质:创业者对自己的过度完美主义保持自觉和自嘲。