吴明辉,明略科技创始人、CEO兼CTO,北大数学系00级,数学奥赛山东省第二名、全国前三十名。从2006年硕士期间开始创业,19年间经历了秒针系统、明略数据、云机机器人三家公司的创立,多次合并拆分,最终走向2025年8月29日的港股上市。
| 人物 | 关系 | 时间 |
|---|---|---|
| 李广密(红杉) | 明略数据早期投资人,"主动搜索找过来"的投资人 | ~2015年 |
| 肖红(Red) | 夜莺/微办创始人,被吴明辉收购,曾在明略任职2-3年 | 2020年 |
| 杨植麟(Kimi) | 循环智能曾是明略同赛道竞争对手 | - |
| 李峰(丰瑞资本) | 第一家公司的合并伙伴,北大91级,公司最初的CEO | 2006年 |
吴明辉从小学五年级开始数学竞赛培训,初中就把高中数理化全部学完,高中基本不上课,每天骑自行车去市图书馆看数学书。数学、物理、化学、计算机四门竞赛都拿过很好的奖。
吴明辉将自己"超级乐观"的性格归因于竞赛训练——习惯了每天面对做不出来的难题,建立了对失败的免疫力。"基本上没有什么事让我能够持续的——就有可能有的时候一些事会让我有那么一两秒钟不舒服,但是真的那一两秒钟之后我就过去了。"这种心理韧性在2022年的至暗时刻发挥了关键作用。
进入北大数学系("北大四大疯人院之首"),从原来各科第一名变成了"20名30名之类的"。同级被称为"北大数学黄金一代",出了几位大数学家。吴明辉选择了差异化:不卷数学,开始创业写代码。
2006年硕士二年级,通过新浪教育频道主编介绍认识了李峰(北大91级,时任新东方副总裁)。两人一个有技术团队(纯tech公司做外包),一个有商业想法(想做在线交易),于是合并公司。李峰40%股份做第一大股东,吴明辉30%。第一轮融资:估值300万人民币,融了100万人民币。
因为李峰那家公司的关系,罗永浩和李笑来一度都是这家公司的股东——"因为他们都是新东方的"。天使投资人朱伟(广告公司高管)等人至今未退出,"上市他们会赚很多很多倍"。
最初的商业计划书写的是Recommendation System,但07年的基础设施不ready:PC互联网没有稳定的用户ID(cookie每隔一两个月被360清除),无法持续积累用户行为数据。
给媒体做流量分析时发现:大部分媒体对外吹嘘的流量与真实流量差异巨大。因为它们不希望第三方知道真实流量。于是反过来去找广告主——"他们一直在被骗",帮广告主做真实流量监测就是刚需。从流量的"裁判员"角色切入,秒针系统由此诞生。
早期核心竞争力来自北大天网实验室的分布式计算技术。秒针上线第一天就处理MSN广告投放数据——"几千万"条日志,两台服务器就扛住了(虽然机房带宽爆了)。
吴明辉的硕士论文题目叫"Recommendation System based on Language Model"——注意,虽然没有"Large",但已经是基于语言模型做推荐。研一研二做CV(指纹掌纹识别),研三转NLP,利用北大自然语言所的CCD(中文概念词典)做基于网页内容相似度的推荐系统,第一个用户是罗永浩的牛博网。
吴明辉在访谈中多次使用"忘记初心"——本来广告数据分析只是"三步走"策略的第一步(第二步是广告推荐,第三步是信息推荐)。但当第一步做成了赚钱的生意后,就沿着这条路一直走了。这种路径依赖在创业者中极为常见:短期的reward(赚钱)取代了长期的value(初心)。
张一鸣的成功,吴明辉归因于两点:一是技术越来越先进,但更重要的是它诞生在移动互联网上——移动端有稳定的设备ID,可以持续积累用户历史行为数据,这是推荐系统的基础设施。
12年开始在秒针内部成立新BU做广告推荐(效果广告),做了两年后面临"裁判员又当运动员"的冲突。合伙人提出拆分,选走了新BU,吴明辉留守秒针成为CEO,同时创办了明略数据和云机机器人——一家公司变三家。
14年在中欧上了李善友教授的创业课程,学了第二曲线、精益创业等概念。回公司后发现产研非常冗余——"招了很多很牛的人,完全不需要这么浪费"。优化人员后,同时成立三家公司,每家都是优秀团队。
广密(红杉)当年投资明略数据,就是因为在美国看到了Palantir的高估值,在中国找"更像Palantir"的公司——"他自己莫名其妙的就找到我们了"。明略最初做了大量2G业务(类似Palantir路径),但后来发现2G业务"没有那么真正意义上的AI化",反馈极慢,不适合做AI。
从Big Data到知识图谱(Ontology),经历了两个阶段:早期是符号主义AI(人肉标注规则),今天变成AI生成规则——"代码本身就是一种规则,AI能写代码了,AI也可以标规则"。
2019年3月,秒针、秒针的竞争对手AdMaster、明略数据三家公司合并为明略集团。合并原因:
2019年回北大读工程博士,方向是Conversational Intelligence(对话智能)。两个动机:
读博期间经历了"哭晕在厕所"的时刻:宗旨做完了,BERT是SOTA,但突然GPT变成了主流——"我的这些工作都不用做了"。被迫重新开题,转向多模态视频理解(广告视频的主观情绪分析)。这个方向至今仍是赛道首创,大厂当时没卷,到今天也都没卷。
2020年认识肖红,是通过北大同学周丽(Answer AI创始人)介绍。吴明辉第一次聊完就决定收购——不是因为Application好(虽然确实做得很棒),而是因为微办有大量的客户与销售之间的对话数据,与他的博士研究课题一致。
2020年底发布的产品概念"小明助理"——今天回看就是ChatGPT + Microsoft Co-pilot。但当时L1(聊天式AI)都不ready,就要做L3(Agentic)的事。
仍然相信"我的这个梦想是能融到钱的"。
"所有的人都不会再投你了。"上海封城意味着一半收入没了——国际客户集中在上海,团队无法开发票。
开始大裁员。"所有投资人天天逼死我,觉得我把之前融了那么多钱给浪费了。"
账上约1亿人民币,每月花1亿人民币——"也就是一个月的runway,这是最夸张的时候。"
自己投了公司1000多万美金(借钱投资),腾讯救了一把。融了约1亿美金,但光历史裁员补偿金就超过2亿人民币,还有银行贷款——"真正能留在公司能用的可能也就两个亿。"
吴明辉揭露了一个创业者鲜少公开谈论的陷阱:有些银行在困难时期"过来骗你说你还上吧,还完之后马上就可以续贷——那你还了他就不会再给你贷了"。这是创业者在现金流危机中面临的信任风险。
吴明辉提出的企业竞争核心公式:f是AI模型(智力),X是context(数据/依据)。当f已经足够smart且可被所有人使用时,企业间的竞争本质上是X的竞争——谁的context厉害、谁的data好。
| 类型 | 特点 | 例子 |
|---|---|---|
| 时序数据 | Foundation Model只抓快照,而持续抓取才是壁垒 | KOL每天的粉丝变化数、公司的历史股权变更(如天眼查) |
| 行业私有数据 | 公开互联网获取不到,但对训练至关重要 | 广告点击行为、企业CRM对话、门店人货场数据 |
| 第一方数据 | 客户自己的会员数据,由明略托管 | 宝洁、可口可乐的消费者互动数据 |
| 主观标注数据 | 吴明辉博士研究:不同人群看同一内容的主观感受差异 | 广告视频的audience profile group情感分析 |
吴明辉从哲学层面论证数据的价值:"过去没办法预测未来——这是从哲学上可以推导出来的。"数据不能证明什么(历史不代表未来),但能证伪假设(发现"不对"),以及给decision maker信心——"数据说明它是对的,很多人就这么自我洗脑,他就去这么工作了。"这就是咨询公司和第三方认证的核心价值。
吴明辉投资了一个做SLG游戏的朋友,春节期间亲自花钱充值体验游戏。在滑雪场缆车上想通了整个思路的闭环:
最初叫Deep Mining(因为公司英文名叫MiningLamp),但域名被注册。吴明辉的儿子建议"Deep Miner也挺好",一试available,就注册了下来。产品在春节后第一天上班就开始立项,比Manus发布早一个月。
OSWorld总榜第四名——前三名是OpenAI、字节、通义千问等大厂。Pass at one(只提交了一次),主办方非常惊讶:"你们是从哪冒出来的公司?"
吴明辉用一个反直觉的例子论证Scaling Law的局限性:
类比MoE(Mixture of Experts,混合专家模型),明略提出了MOA——Mixture of Agents。不同的细分任务由不同的specialized agent完成,通过多智能体协作实现整体能力的最优组合。每个agent可以来自不同的团队甚至不同的公司。
吴明辉引用Anthropic的分类:市场上大部分号称的"agent"其实是workflow(人预定义的工作流程),真正的agentic system应该是AI做了planning(如Manus)。但企业需要两种模式的平衡——探索类任务需要发散性,routine任务需要确定性。DeepMiner因此设计了两个模式:自主模式(autonomous)和协作模式(human in the loop)。
吴明辉提出了一个被大部分人忽视的观点:BOA(Browser Use Agent)和CUA(Computer Use Agent)会改变互联网的入口格局。
以前:agent只能在自家数据库内搜索(搜简历/搜职位)。有了BOA/CUA:agent可以on top所有招聘网站——智联、Boss直聘、51job全走一遍。"入口就变了。"这对所有平台公司是一个战略级威胁——如果你只提供连接(生产关系),没有供给侧的独特能力,就可能被绕过。
在A2A(Agent to Agent)协议下,agent应该有身份证和信用体系。持续在上面产生recommendation和建议的记录,建立credit后才能收取溢价。就像麦肯锡、秒针这样的第三方——不是数据本身值钱,而是IP(信誉和专业性)值钱。
吴明辉对教育的激进观点:"应该是每个学生上一门课,最后期末考试的时候考他的agent,不是考他自己。"理由:1) 学生学的那些东西AI都已经知道了;2) 职场里pk的不是"我",是"我+我的AI";3) 考agent既justify了自己的学习能力,又justify了与AI协作的能力。
吴明辉引用哈佛商学院课程《幸福的方法》的框架:
| 类型 | 短期目标 | 长期目标 | 状态 |
|---|---|---|---|
| 忍辱负重 | 不喜欢 | 很明确 | 大部分老板 |
| 醉生梦死 | 只看今天 | 没有 | 享乐主义 |
| 虚无 | 没有 | 没有 | 最惨 |
| 幸福 | 清晰 | 清晰,且与短期高度相关 | "一个比较幸福的老板" |
吴明辉发现训练AI和教育孩子"高度的相关"——pre-train、post-train、上岗后的训练,都能在孩子的成长过程中找到对应。但最大区别是:人有自己的个人目标,而AI的所有context都是你给的——"你对他的控制太容易了"。
吴明辉引用日本学者野中�的SECI模型,将其与AI agent的设计深度结合:
师傅干活,徒弟在旁边看——暗默知识通过社会化传递给另一个暗默知识。师傅没有每句话都说,但徒弟在看的过程中脑子里已经有感觉了。
师傅写PPT、做分享、讲"第一步第二步第三步"——暗默知识变成显性知识。公司内部的专家分享、知识交流属于这一环节。
同一件事可能有好几个专家有不同做法——需要做连接比较:哪种情况用方法A,哪种用方法B。学术圈里的互相引用、分情况讨论也是这个过程。
标准化的guideline形成后,每个人再去学习,变成自己可执行的暗默知识——循环完成。
基于SECI模型,DeepMiner的核心设计理念是:通过多轮人机互动,把专家脑子里的暗默知识挖出来。
2025年8月29日港股上市,对吴明辉而言是"一个新的里程碑"。最核心的意义是资金链的充实——过去几年"太缺钱了"。后续资金将投入AI研发,而非外部投资。
吴明辉用两个比喻论证Scaling Law必然有极限:
| 问题 | 回答 |
|---|---|
| 全球范围内一道喜欢的食物 | 中国的兰州拉面 |
| 全球范围内一个喜欢的地点 | 希腊萨莫斯岛(毕达哥拉斯的老家) |
| 推荐两本书 | 《物种起源》(达尔文)、《几何原本》(欧几里得) |
| 一个创投机会 | 中国芯片及智能硬件的AI化 |
| 你是一个幸福的Founder吗 | "一直都是。我每天都挺开心的。" |
吴明辉在07年就想做推荐系统(比今日头条早5年),在20年就做出了ChatGPT+Co-pilot的概念产品。两次都对方向判断正确,但技术基础设施未就绪。他的教训:"今天我们做Agentic Model还特别好,今天是一个早半步的状态——L1 L2已经比较好了,L3是100分满分是个30分,我们在细分场景里一优化就可以到90分。"关键不是方向对不对,而是当下的基础设施能否支撑"最小可用版本"。
吴明辉两次被"价值网络"困住:一次是广告客户的反馈让他忽视了移动互联网;一次是EIP做得太大太超前导致资金耗尽。有趣的是,他在中欧学了《创新者的窘境》后回公司做改革,结果又陷入了新的窘境。知道理论和能避开陷阱是两回事。
吴明辉坦承学霸天然缺乏consumer insight,更适合做2B。但他指出AI时代出现了变化:有些成功企业确实是"拿着锤子找钉子成功的"——ChatGPT和DeepSeek都不是先想清楚需求再做的。AI时代,技术能力本身可以成为产品,这让学霸型创业者有了新的2C可能性。
吴明辉用电梯缆绳和生物体尺寸两个类比,论证通用大模型不可能覆盖所有任务。这不是反AI的观点,而是一个生态位预测:就像生物进化从单细胞到团队协作,AI也会从单一大模型走向MOA(混合多智能体),每个agent在自己的niche做到最好,组合起来超越通用模型。这是他对Palantir(4000亿美金)和Databricks(1800亿美金)市值合理性的解释。
吴明辉亲身经历的故事极具代表性:为了获取AI训练数据,他强制全公司只能用企业微信联系外部客户,甚至限制了公司WiFi不能用个人微信。结果:1) 自己跟太太聊天也被存档;2) 员工离职后失去在公司内建立的所有社交关系。这个矛盾在AI时代会更加尖锐——agent的memory到底归个人还是组织?
吴明辉转述了肖红(Manus创始人)的商业逻辑:把最新最贵的AI能力首先introduce给客户,获得获客/留客红利;等这个能力变cheap时,客户的依赖已经建立。同时按摩尔定律判断token成本必然下降,所以当前ROI算不明白也没关系。这是一种"用未来的成本结构为今天的产品定价"的策略。
吴明辉指出AI目前提问能力"很差很差"——"没有人去训这方面的能力,众瓜众得豆"。但在企业级场景中,提出好问题是挖掘暗默知识的关键。这可能是下一代enterprise AI最重要的差异化方向:不是AI回答得好,而是AI问得好。就像一个好的访谈者,提问本身就带着context和insight。
从"recommendation system based on language model"到"主观情绪的audience profile group分析",从"Y=f(X)"的决策哲学到SECI模型的重新解读,吴明辉展示了数学训练赋予的独特能力:用第一性原理重新审视"行业常识"。他指出AI领域所有涉及主观的benchmark都是错的——因为从哲学定义上,主观就意味着没有唯一正确答案。这种从定义出发推翻既有范式的思维方式,是纯工程背景难以企及的。
吴明辉的故事本质上是一个"纯理想主义founder"学会经营的过程。300万人民币估值起步到15亿美金,中间经历了"过于乐观"导致的多次危机。他的乐观是双刃剑:一面让他在一个亿runway时仍然坚信"我肯定能搞定";另一面让他"觉得有无数的钱可以给我用"导致铺张浪费。22年的至暗时刻是这个矛盾的极端体现——最终他学会了用40个人做出世界第一的成果,而不是1000个人做出一个"太超前"的产品。资源约束不是限制,而是方向校正器。