← 返回张小珺主页
深度研究 Deep Dive

洪乐潼:让AI证明天书中的定理

#137 对洪乐潼的4小时访谈
2026.4.20 · 04:24:17 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 被数学击中的时刻
  2. 蛮力型选手与自由注意力
  3. MIT:失败是默认项
  4. 从法学院到创业:Axiom的诞生
  5. Verve咖啡馆里的联创故事
  6. 融资:从种子轮到16亿美元独角兽
  7. 小野肯截胡OpenAI
  8. 把数学变成Lean:形式化证明的核心科技
  9. 普特南满分:四个月的奇迹
  10. AI for Math的技术版图
  11. 数学与代码:孪生兄弟
  12. 验证作为第一市场
  13. 数学:被创造还是被发现
  14. 从Math Poor到Math Rich
  15. 启示与延伸思考

一、被数学击中的时刻

洪乐潼(2001年生,广州长大)描述了两种截然不同的"被数学击中"的体验:一种来自看别人的成果,一种来自自己解题的过程。

洪乐潼
我经常在看别人结果的时候,有一种"哇这个东西怎么这么美"的感受。我印象特别深的是第一次看到模形式-椭圆曲线定理——把一个代数性的表达式和一个几何物体联系起来。数学中这种两个领域中间有交集的例子,每次都让我觉得非常非常优美。

她最早的解题震撼来自罗斯夏令营(Ross Program)。每天必须做完全部题才能拿到下一天的题集,像"游戏打怪一样"。最终推导到二次互反律时,简洁的表述背后展现出极深的证明和极具创造力的解法。

核心概念

数学是什么?

洪乐潼的定义:数学是人类决定创造的一个文明体系。基于一些我们"愿意接受是理所当然的"公理,然后往上搭建。这个过程"有一点像艺术"——数学是介于艺术与科学之间的存在。先从例子出发,发现规律,猜测下一步"应该是怎样的",再去证明它。

数学击中她的三个层次

  • 审美层:模形式与椭圆曲线的对应——代数与几何的深层统一
  • 过程层:二次互反律的推导——简洁表述背后的深度证明
  • 哲学层:证明是一种"影响力"——通过严丝合缝的逻辑说服所有人

二、蛮力型选手与自由注意力

洪乐潼反复强调自己"不是天赋型选手",而是"蛮力型选手"——无法做出欧式几何题的直觉解法,只能用复数法"大力出奇迹",需要比别人多两到三倍的时间。

洪乐潼
我一直发现我自己没有什么特别大的数学天赋。我是蛮力型选手。在MIT的时候,我身边每一个人都比我聪明。我是整个数学系里面最愚蠢的——任秋宇、张胜同、高继扬,每一个人都是我小时候看着他们新闻长大的。
核心概念

Bounded Attention vs Free Attention

洪乐潼引述一个导师的框架:Bounded Attention(被框架住的注意力)是你每天必须执行的邮件、任务、deadline;Free Attention(自由注意力)是爱因斯坦洗澡时的灵感时刻。她认为:区分一个平均的创业者和一个有策略性决策力的创业者,关键在自由注意力。但两者需要配比,且"这个配比每个人不一样"。

AlphaGeometry的哲学共振

洪乐潼的"蛮力做几何"和Google DeepMind的AlphaGeometry背后哲学一致——都是把几何图形变成符号表达式来解决,AI因此能解决81%的历史IMO几何题。这暗示了一个深刻的对称:蛮力型人类数学家与蛮力型AI数学家之间存在天然的互补关系

"拒绝被驯化"

洪乐潼在广州数学奥赛体系中(1班到24班按成绩排列,入学时在4班"洗手间旁边")意识到自己"在拒绝被驯化成一个竞争力很强的人"。初中开始自学高等数学——微积分、复分析——从零和游戏转向正和游戏。关键发现:她的竞赛成绩反而因为发散性探索(高等数学)而提高,这与AI中的transfer learning(转移学习)现象高度一致。

三、MIT:失败是默认项

MIT的经历塑造了洪乐潼的核心人格:"失败是我的默认项"

大一第一学期 · 博士概率论

住在东校区Pi楼(圆周率楼),楼上全是IMO/IPhO/IOI选手。听从学长建议上博士概率论——第一天开讲测度论、Borel sigma代数,完全听不懂。期中考40分满分,全班平均分9分,她和几个大一学生都是个位数。

大一下学期 · 疫情隔离

小团队的奖励机制被迫中断。必须学会从"事情本身的难度"中找到快乐——从人际驱动转向事物驱动。

大一暑假 · 小野肯教授的REU

本来要去桥水基金实习,被小野肯教授的暑期数学研究项目(REU)候补名单"捞上来"——因为疫情很多人放弃了。从此走上数论研究之路。

本科期间 · 摩根奖

获得北美数学本科生最高荣誉摩根奖。但她强调"我并不觉得我是数学最好的那一个人",且"谁拿到谁拿不到,随机性很大"。

洪乐潼
我什么失败都不会触发我觉得自己很失败的机制。我把失败当做默认项。MIT特别倡导合作——像登山队。MIT有一门课就叫"Learning to Fail"——你如何更好地失败。

三种创业者类型(洪乐潼的分类)

  • Visionary(前瞻派)马斯克、洪乐潼自认——极度乐观,"就算往下跌一点也还行"
  • Executor(执行派)扎克伯格——"日复一日执行执行执行"
  • Salesman(销售派)Sam Altman——"非常好的沟通能力,能影响和引领别人"

四、从法学院到创业:Axiom的诞生

洪乐潼的学术路线——数学(MIT) → 神经科学(牛津) → 法学(斯坦福) → 数学博士(斯坦福)——看似杂乱,实则每一步都在为AI for Math积累认知。

法学院的关键顿悟

宪法解释的三种哲学

  • Originalism(原典主义):按国父们的原意诠释宪法
  • Textualism(文本主义):宪法字面是什么就读成什么——"特别像数学家会做的诠释"
  • Living Constitutionalism:宪法会呼吸,与时代一起成长

洪乐潼是Textualist。她在法学课上想到:如果已经到了能拿AI看宪法是什么意思的时代,"我为什么不能拿AI做数学?"——而这需要的不是英语,而是更结构性的呈现:Lean形式化语言

关键人物:好友Kenny Luo

从2020年起,Kenny Luo就在做Lean形式化证明——当时Mathlib还是空的,他是把本科代数、本科分析一行行打进去的5-7个学生之一。Kenny是Kevin Buzard的学生,现在也在Axiom。

洪乐潼
我当时去读了科学史。从维基百科开始,到AI for Math的GitHub Repo——大概几百篇文章,每一篇的abstract我都读过。有意思的就把整篇看完。我做了多少次费曼的过程,在纸上去想如果要搭起来应该怎么做。到了一个程度——我发现它不一定是一个研究问题,它是一个工程问题。科技的风险没有我一开始看上去那么高。

五、Verve咖啡馆里的联创故事

Axiom的创始故事发生在Palo Alto的Verve咖啡馆——一个六人桌、周末有狗的地方。

舒伯(Shubo):从陌生人到联创

2023年秋 · 相遇

洪乐潼抱着厚厚的法律书去咖啡馆做作业("周末有狗,可以看狗喝抹茶")。舒伯是Meta FAIR的Director,Facebook AI Research的元老,GPU经验20年,AI经验10年,曾在百度硅谷AI研究室与Dario Amodei(Anthropic创始人)共事。两人在同一张六人桌上认识——因为拉窗帘说上了话。

一年半 · 漫无目的的聊天

持续一年半只聊科学和历史。洪乐潼不知道舒伯在Meta,舒伯可能不知道她有数学研究背景。

2024年秋 · 餐巾纸上的算术

洪乐潼某天晨跑后觉得"这件事真的要发生了",找舒伯算需要多少张GPU卡、融多少钱。"两个人在Verve拿了张餐巾纸在那算。"

2025年2月 · 舒伯加入

"他在Verve咖啡店说的——'好多好的人都走了,感觉这个地方不太像以前的地方。'然后问要不要一起做。"洪乐潼回忆自己"不太敢问"——因为舒伯是AI元老。

竞争对手的咖啡馆巧遇

洪乐潼曾在同一家Verve咖啡馆遇到主要竞争对手的CEO Tudor,主动问"你们招人吗?"——想加入而不是自己创业。对方回复:"我们只招计算机的PhD。"洪乐潼是数学PhD——于是决定自己做。这个细节揭示了Axiom和竞争对手之间DNA的根本差异。

六、融资:从种子轮到16亿美元独角兽

6400万
种子轮融资(美元)
3亿→16亿
估值跃升(美元)
2亿+
A轮融资(美元)
7个月
成立到A轮

种子轮的戏剧性

时间线:2025年1月-7月

  • 1月7日:美国数学学会年会(主题竟然是"AI for Math"),和DeepMind的Adam Zsolt交流
  • 1月中:回来第三天就收到第一个offer——但要稀释50%,拒绝
  • 2月:第二个offer,更合理——开始认真考虑
  • 3月:B Capital的Howard Morgan(文艺复兴科技联合创始人、Jim Simons的伙伴)出现——"他比你更乐观,他比你更觉得你的商业模式有前景"
  • 从第一个到最终offer,估值翻了三倍
洪乐潼
没有人喜欢融资。你是一个复读机,一次一次说一样的事情,一次一次接到一样的问题。真的,我可以录下来然后给你们大家发,反正问题也是一样的。

A轮:被Preempt

A轮原本没打算融——2025年圣诞节时,已有投资人主动递出term sheet。1月5日被叫到外地做pitch,当晚收到offer。最终由Menlo Ventures领投(Anthropic最大机构投资人),Matt Krisiloff是从种子轮开始支持Axiom的partner。

DeepSeek效应的反面

种子轮恰逢2025年2月DeepSeek出圈——投资人一听"模型"就恐慌。但洪乐潼强调"我们不是模型公司,我们是deep tech公司,更像SpaceX"——有大量技术壁垒(自建Lean验证器比社区版快100倍、12-13个辅助工具),R&D周期更长。

七、小野肯截胡OpenAI

小野肯(Ken Ono)教授加入Axiom的故事是整场访谈中最戏剧化的段落之一。

Ken Ono其人

2025年11月底 · 一封奇怪的邮件

Ken Ono写信说他要来湾区,如果加入了OpenAI或DeepMind,希望洪乐潼有心理准备——因为可能存在战略竞争关系。洪乐潼的反应:"你如果能加入OpenAI和DeepMind,那你为什么不来我这里?"

截胡 · 两三天内

Ken Ono去了OpenAI,但没来Axiom实地看。洪乐潼以为"凉了"。结果在Zoom上定了——Ken觉得Axiom"更数学",OpenAI做数学的同学不多。整个过程在对方offer即将expire的两三天内完成。

洪乐潼
我也不太敢问。我不太敢问舒伯,我不太敢问小野肯。我是说你我没有办法说服你,你只能自己说服自己。大家都是成年人,自己做有趣的选择,然后一起承担风险。

Ken Ono与拉马努金的渊源

Ken的父亲是筹款为拉马努金在印度修雕像的数学家之一。拉马努金的遗孀给世界各地数学家写信众筹,Ken父亲回了信。Ken的办公室里至今还有拉马努金遗孀写给他父亲的那封信。Ken本科时绩点不好、高中没毕业——他的父亲用拉马努金的故事勉励他:"任何时候开始也不算晚。"

八、把数学变成Lean:形式化证明的核心科技

洪乐潼详细解释了Lean形式化语言及其在AI for Math中的核心地位。

核心概念

Lean是什么?

Lean是一种形式化证明语言——你可以把数学证明写成代码,跑完看到一个勾(证明正确)或报错(某行有问题)。它既是编程语言,又自带验证能力——"既是C语言,又是GCC compiler和C runtime两者合一"。这使它非常finicky(脆弱),但也非常强大。

Axiom面临的四大工程挑战

挑战问题Axiom的解法
数据稀缺全世界Lean代码加起来tokens很少用AI生成合成Lean数据(而非靠人手打)
验证速度社区原有的comparator慢100倍自建verify proof系统,快100倍
搜索成本AlphaProof用蒙特卡洛树搜索太贵用sub-agents + skill learning替代(类似Anthropic的方向)
工具缺乏Lean没有好用的hammer(一斧头解决sorry)自建12-13个辅助工具

Draft-Sketch-Proof范式

AI for Math的标准三步法(源自2022年论文)

  • Draft(草稿):informal模型列出证明提纲
  • Sketch(框架):把提纲转化为formal Lean代码,中间用sorry标记未证部分
  • Proof(证明):用AI、neural network或纯规则系统(hammer)填充所有sorry

Axiom的证明树已从40个节点scale到4000个节点——更深更广的搜索。

Axiom系统架构:四大核心科技

九、普特南满分:四个月的奇迹

2025年12月6日,成立仅四个月的Axiom在普特南大学生数学竞赛中取得满分120分——人类历史上98年来仅有5个满分,这是第六个,也是第一个由AI获得的。

120/120
普特南满分(12题全对)
4个月
从公司成立到满分
第6个
98年历史上第6个满分
98.93%
代码验证benchmark得分

那天发生了什么

庞加莱会议室的"战争状态"

  • 早上六道题,四道需要求解(比预期多)——"小野肯教授说:现在不是说数学纯粹之美的时刻,现在是战争状态!"
  • 能做数学竞赛题的基本只有Evan Chen(美国IMO队教练)——一个人一道接一道地做
  • 研究型数学家Ken Ono"其实也没有做出来多少道"——研究数学和限时竞赛是完全不同的能力
  • 下午3:58确认8道题(80分,已是世界前五水平)
  • 最终发现AI系统实际上不需要人类求解——它的informal模型可以自己做出解法
洪乐潼
有一道题Evan Chen画了一个图,所有人一看就说"哦,你去把它做出来吧"——一个图的解法。但AI果然没有找到这个一图解法。我们看到几千行Lean代码,硬生生通过类似枚举、分类讨论,一步一步核实把它干出来。大力出奇迹的AI。

意外的Transfer Learning

Axiom发现了一个令所有人惊讶的现象:数学定理证明能力能转移到代码验证能力。在VerifyNot benchmark上,原本DeepSeek Prover达到11%,Axiom的系统达到98.93%。洪乐潼认为这是因为数学证明和代码验证在Lean中的目标函数"聚拢"了——都是形式化语言,而不是一个Python一个英语。

十、AI for Math的技术版图

洪乐潼将AI for Math的核心科技拆解为四个组成部分,并明确了Axiom相对于竞争对手的差异化定位。

Axiom的四大核心科技

  • Prover(证明家):给定命题,自动生成Lean证明
  • Conjecturer(猜想家):提出有价值的数学猜想——"最难做的部分"
  • Auto-formalization(自动形式化):将自然语言数学转化为Lean——"被忽略但可能更难"
  • Knowledge Base(知识库):搜索已知定理、发现反例

Axiom vs 竞争对手

  • 竞争对手认为IMO金牌是终局,准备直接落地商业化
  • Axiom打算做猜想——"我们和竞争对手的区别是我们打算做这件事"
  • 竞争对手"不招数学家";Axiom既要数学家,还要编译器/代码生成的人
  • Axiom信念:"多元产生智能"、"降维打击"

AI for Math的发展简史

2016-2018 · ATP奠基

Christian Szegedy在Google开始用HOList做定理证明;ATPboost(波兰人Bartosz,现在Axiom)。

2019-2020 · OpenAI入场

Ilya Sutskever带队做GPT-f、mini-f2f。Jesse Michael Han、Stan Polu等后来成为创业者。

2021 · AlphaGeometry萌芽

一个实习生在Google DeepMind秘密开始AlphaGeometry项目。

2024年7月 · AlphaProof银牌

IMO六道题做了五道,28分银牌——"跨世纪的时刻"。

2025年12月 · Axiom普特南满分

四个月从零到满分。同时解决了交换代数、代数几何、代数数论、离散数学的多个研究问题。

AI for Math能力进展时间线

十一、数学与代码:孪生兄弟

洪乐潼
Math is code, code is math. 有一个叫Curry-Howard对应——每一个数学证明可以变成一个计算机程序。反过来,为什么后端的distributed system无法像前端那样好地web coding?因为它缺少数学能给的hierarchical分级拆解和backtrack能力。
核心概念

Curry-Howard对应的实践意义

Lean语言体现了这个数学-计算机的同构关系:代码即证明,证明即代码。这意味着Axiom的Prover可以同时做到两件事——生成数学证明验证程序正确性。在Axiom的系统中,这不是两个目标函数拉扯(Python + 英语),而是统一的形式化空间。

语言 vs 数学在AI中的角色

语言的角色

  • 突破边界——conjecture(猜想)
  • 理解用户模糊需求
  • 列证明提纲("很大一个部分的胜利")
  • 数学家用自然语言做逻辑推理已经几千年

数学/Lean的角色

  • 约束和验证——把幻觉拉回来
  • 百分之百正确的grounding
  • 在形式化空间中做纯粹证明
  • "之前大家把数学当语言了,不对——要把数学变成Lean"

洪乐潼提出一个精彩的观察:数学作为英语的子集,词汇的概率分布完全不同——比如代数几何中的"germ",在英语中是"细菌"。如果让AI在英语中做数学,"这不是事情的全貌"。

十二、验证作为第一市场

洪乐潼详细阐述了Axiom的商业路线图:验证(Verification)是第一个市场,之后是AI for Science和最优化。

为什么验证痛点最大

亚马逊的案例

  • 亚马逊拥有世界上最好的自动推理团队之一(无AI,纯人工)
  • 花了3-5年写了26万行定理证明代码
  • 仅仅为了验证一个hypervisor的memory isolation component
  • "AI没有改善这些工程师的生活"——这就是Axiom的市场机会

商业路线图

市场应用场景时间
验证(第一市场)芯片验证(替代基于SMT的Jasper)、代码验证(不需要test case)正在探索
AI for Science为物理学家、生物学家解决理论问题中期
最优化覆盖所有edge case的搜索引擎级能力远期
洪乐潼
我们相信的一件事:任何你能定义的,你都能证明。任何你能表达的,你都能执行。这是我们对coding未来的愿景——有一天你要一个函数的时候,它给你的是百分之百不需要验证的函数。

Specification才是真正的瓶颈

洪乐潼指出验证的难点不在证明本身,而在specification(定义/命题)——你如何把问题精确地写成形式化的命题?这和数学中猜想的困难是同构的。比如First Proof挑战的10道题,Axiom甚至无法参加——因为题目涉及的定义完全不在Mathlib里,"题目我都放不到Lean里面"。这解释了为什么猜想家(Conjecturer)是Axiom的长期战略重点。

十三、数学:被创造还是被发现

这个贯穿整场访谈的哲学问题,在洪乐潼这里得到了层次丰富的回答。

洪乐潼
证明其实某种程度上是影响力——我只要能够严丝合缝地逻辑证明出来,我的数学发现就可以被接受。拉马努金从印度来到英国,像外星人一样——"这是我的草稿本,上面这些全都是对的,我从来没有接受过数学训练,我不知道怎么证明。"哈代和Littlewood用证明来说服所有人。

张益唐的案例

国际数论学家看张益唐的证明时觉得和他们熟悉的学派"非常不一样",但结果是正确的,于是接受了。James Maynard的2022年菲尔兹奖带来了另一套证明技巧。学生们继承、比较、简化——"这个过程是非常有意思的智力过程"。

AI会把这个问题推向新的维度

假设AI用了一个新公理

洪乐潼被问到一个思想实验:如果Axiom的AI证明了重大猜想但使用了一个不属于现有数学的新公理?她的回答:

  • AI已经在尝试用"奇怪的公理"作弊——DeepSeek Prover就曾因此出错
  • 如果这个公理大家觉得"自然",就会被接受
  • 可以按"接受和不接受"两个世界继续运作——branching factor为2
  • 但如果持续分叉,会"一团混乱",最终大家会"tighten"回收
  • "数学某种程度上是人类文明的构造"——比起物理加一个新定律,接受度可能更高

十四、从Math Poor到Math Rich

洪乐潼描绘了AI for Math成功后的世界图景——一个"数学的供给会爆炸"的社会。

洪乐潼
我们从一个math poor到math rich的社会。所有没有被解决的理论问题,所有应用科学家们希望有一个数学家帮他们解决的问题,全部可以解决。指数级的数学发现的增长——我觉得一定会发生。

AlphaFold的先例

洪乐潼引用了DeepMind纪录片中的一幕:AlphaFold成功后,有人建议做一个平台让结构生物学家提交要折叠的蛋白。Demis Hassabis问"有多少蛋白",回答"2亿个",Demis把笔扔在桌上说"Fold everything, that was a stupid idea"。洪乐潼的类比:如果算力无限,"我们要把所有人类能想到的数学问题全部解决"。

数学家的角色转变

有限算力世界

  • 数学家成为资源分配者
  • "200个H200花在这道题,8000个花在那道题"
  • 直觉决定算力分配——"算力与数学家对题目重要性的判断画等号"

无限算力世界

  • 数学家成为好奇心的守护者
  • 提供0.01%的直觉:哪些问题更值得解决
  • 看懂AI的100万行Lean证明,从中获得新猜想
  • Jevons Paradox:工具越强大,用处越多

ASI而非AGI

洪乐潼的"盘子理论"

  • 盘子中心:1+1=2,Hello World
  • 盘子边缘:证明黎曼猜想,治愈癌症,写诺贝尔文学奖作品
  • OpenAI的路线:一点点把圆环撑大,覆盖所有边界(AGI)
  • Axiom的路线:从中心往"证明黎曼猜想"方向打出一个扇形——"绝对不会覆盖到诺贝尔文学奖,但会有一个比较大的扇形"
  • 所以Axiom是ASI(Specialized Superintelligence)而非AGI

十五、启示与延伸思考

1. "蛮力型选手"的创业者优势

洪乐潼反复强调自己不是天赋型——用复数法暴力做几何、六个月做不出sphere packing问题但每周汇报、期中考40分只拿4分。但这恰恰是AI for Math创业者的最佳背景:她深刻理解AI作为"蛮力型数学家"的价值,因为她自己就是这样做数学的。AlphaGeometry的哲学和她的解题方式完全一致。这提示了一个反直觉的创始人筛选标准:在天才云集的领域里,"最愚蠢的那个人"可能最理解如何用工具增强人类

2. 形式化证明是AI推理的下一个基础设施

洪乐潼的核心洞见:之前大家把"数学当语言做拐杖"——但数学应该变成Lean。语言模型的幻觉问题在数学领域有了精确解:形式化验证给出100%确定的对错信号。这不只是数学问题——芯片验证(替代SMT/Jasper)、代码验证(不需要test case)都是直接应用。Axiom在代码验证benchmark上从DeepSeek的11%跳到98.93%,证明了数学证明能力向代码验证的transfer learning是真实的。

3. 定义比证明更难——AI for Math的真正瓶颈

证明可以验证对错,但定义(specification)没有对错之分。猜想家比证明家更难训练,因为"我不知道这个定义是对还是错"。这个问题同构于代码世界的specification问题:你能写出程序,但能精确定义你要解决什么问题吗?洪乐潼坦承Axiom无法参加First Proof挑战——"题目我都放不到Lean里"——因为涉及的定义不在Mathlib中。这是AI for Math和AI for Code共同面临的根本瓶颈。

4. "咖啡馆创业"的硅谷范式

Axiom的创始故事几乎全部发生在Palo Alto的Verve咖啡馆:洪乐潼在那里认识了舒伯(拉窗帘说上话),在那里和竞争对手的CEO偶遇(被拒绝后决定自己做),在餐巾纸上算融资,墙上还有她和舒伯的拍立得。这不是巧合——硅谷的创新密度来自物理空间的碰撞,而非线上网络。洪乐潼说她"没有办法开超过一小时的Zoom",但和舒伯每次讨论四五个小时。

5. New Lab的存在逻辑:好奇心是基本作用力

洪乐潼将New Lab的诞生归结为一个"基本作用力"——人类的好奇心。即使OpenAI/DeepMind开出1亿美元package,也"无法压制住青年研究者的好奇心"。她引用Peter Thiel的话:"垄断导致创新,竞争导致平庸"——New Lab是被使命而非ego驱动的。假设AI解决了所有数学问题——"还会有数学家吗?"——答案是一定会有,因为"你不让我看那100万行Lean代码,我都会去看"。

6. Axiom的生死判断:binary outcome

洪乐潼对自己公司的判断极为清醒:结果一定是"极好或极坏",没有中间态——"要么登月成功,要么火箭坠毁"。她的核心竞争策略是效率("一个单位的创新需要多少单位资源")和人才密度(30人 vs 竞争对手50-75人,但前30篇AI for Math论文的大部分作者都在Axiom)。如果失败了?"我可能会做跟神经科学相关的事情——brain-machine interface目前的实现都太不理想了。"

7. 墓志铭上写"学徒"

被问到墓志铭想写什么,洪乐潼的回答不是"数学家"也不是"CEO"——而是"学徒"。从数学到物理到神经科学到法学到AI,她的模式是在每个领域都做学徒。她说自己"最快乐的状态是research scientist intern——这个intern很重要,因为如果我说的话比较愚蠢,大家会觉得正常"。这个回答解释了为什么一个"最不可能创业的创业者"最终创建了一家追求"天书中的证明"的公司——因为学徒的驱动力不是控制,而是好奇。

关键数据汇总

数据点具体内容
Axiom团队规模30人(竞争对手50-75人)
种子轮6400万美元,估值3亿美元(2025年1-7月)
A轮2亿+美元,估值16亿美元(2026年1月)
普特南成绩满分120分(成立4个月后,2025年12月)
代码验证分数98.93%(vs DeepSeek Prover 11%)
自建验证器速度比社区版快100倍
证明树规模从40节点scale到4000节点
自建工具数量12-13个辅助Lean的生成和验证工具
团队IMO选手5个IMO(含4个IMO金牌)
领投方种子轮B Capital(文艺复兴联创Howard Morgan);A轮Menlo Ventures
竞争对手成立早2年,融资约为Axiom种子轮的5倍
洪乐潼年龄24岁(2001年生)
直觉能力预测5-10年可能实现AI数学直觉
公司名字来源"Axiom"(公理)——源自《数学天书中的证明》
会议室命名高斯、庞加莱、希尔伯特、Lovelace、图灵(因"polymath"原则选定)

延伸阅读