深度研究 — #137 洪乐潼：AI for Math、天书中的证明

← 返回张小珺主页

🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

被数学击中的时刻
蛮力型选手与自由注意力
MIT：失败是默认项
从法学院到创业：Axiom的诞生
Verve咖啡馆里的联创故事
融资：从种子轮到16亿美元独角兽
小野肯截胡OpenAI
把数学变成Lean：形式化证明的核心科技
普特南满分：四个月的奇迹
AI for Math的技术版图
数学与代码：孪生兄弟
验证作为第一市场
数学：被创造还是被发现
从Math Poor到Math Rich
启示与延伸思考

一、被数学击中的时刻

洪乐潼（2001年生，广州长大）描述了两种截然不同的"被数学击中"的体验：一种来自看别人的成果，一种来自自己解题的过程。

洪乐潼

我经常在看别人结果的时候，有一种"哇这个东西怎么这么美"的感受。我印象特别深的是第一次看到模形式-椭圆曲线定理——把一个代数性的表达式和一个几何物体联系起来。数学中这种两个领域中间有交集的例子，每次都让我觉得非常非常优美。

她最早的解题震撼来自罗斯夏令营（Ross Program）。每天必须做完全部题才能拿到下一天的题集，像"游戏打怪一样"。最终推导到二次互反律时，简洁的表述背后展现出极深的证明和极具创造力的解法。

核心概念

数学是什么？

洪乐潼的定义：数学是人类决定创造的一个文明体系。基于一些我们"愿意接受是理所当然的"公理，然后往上搭建。这个过程"有一点像艺术"——数学是介于艺术与科学之间的存在。先从例子出发，发现规律，猜测下一步"应该是怎样的"，再去证明它。

数学击中她的三个层次

审美层：模形式与椭圆曲线的对应——代数与几何的深层统一
过程层：二次互反律的推导——简洁表述背后的深度证明
哲学层：证明是一种"影响力"——通过严丝合缝的逻辑说服所有人

二、蛮力型选手与自由注意力

洪乐潼反复强调自己"不是天赋型选手"，而是"蛮力型选手"——无法做出欧式几何题的直觉解法，只能用复数法"大力出奇迹"，需要比别人多两到三倍的时间。

洪乐潼

我一直发现我自己没有什么特别大的数学天赋。我是蛮力型选手。在MIT的时候，我身边每一个人都比我聪明。我是整个数学系里面最愚蠢的——任秋宇、张胜同、高继扬，每一个人都是我小时候看着他们新闻长大的。

核心概念

Bounded Attention vs Free Attention

洪乐潼引述一个导师的框架：Bounded Attention（被框架住的注意力）是你每天必须执行的邮件、任务、deadline；Free Attention（自由注意力）是爱因斯坦洗澡时的灵感时刻。她认为：区分一个平均的创业者和一个有策略性决策力的创业者，关键在自由注意力。但两者需要配比，且"这个配比每个人不一样"。

AlphaGeometry的哲学共振

洪乐潼的"蛮力做几何"和Google DeepMind的AlphaGeometry背后哲学一致——都是把几何图形变成符号表达式来解决，AI因此能解决81%的历史IMO几何题。这暗示了一个深刻的对称：蛮力型人类数学家与蛮力型AI数学家之间存在天然的互补关系。

"拒绝被驯化"

洪乐潼在广州数学奥赛体系中（1班到24班按成绩排列，入学时在4班"洗手间旁边"）意识到自己"在拒绝被驯化成一个竞争力很强的人"。初中开始自学高等数学——微积分、复分析——从零和游戏转向正和游戏。关键发现：她的竞赛成绩反而因为发散性探索（高等数学）而提高，这与AI中的transfer learning（转移学习）现象高度一致。

三、MIT：失败是默认项

MIT的经历塑造了洪乐潼的核心人格："失败是我的默认项"。

大一第一学期 · 博士概率论

住在东校区Pi楼（圆周率楼），楼上全是IMO/IPhO/IOI选手。听从学长建议上博士概率论——第一天开讲测度论、Borel sigma代数，完全听不懂。期中考40分满分，全班平均分9分，她和几个大一学生都是个位数。

大一下学期 · 疫情隔离

小团队的奖励机制被迫中断。必须学会从"事情本身的难度"中找到快乐——从人际驱动转向事物驱动。

大一暑假 · 小野肯教授的REU

本来要去桥水基金实习，被小野肯教授的暑期数学研究项目（REU）候补名单"捞上来"——因为疫情很多人放弃了。从此走上数论研究之路。

本科期间 · 摩根奖

获得北美数学本科生最高荣誉摩根奖。但她强调"我并不觉得我是数学最好的那一个人"，且"谁拿到谁拿不到，随机性很大"。

洪乐潼

我什么失败都不会触发我觉得自己很失败的机制。我把失败当做默认项。MIT特别倡导合作——像登山队。MIT有一门课就叫"Learning to Fail"——你如何更好地失败。

三种创业者类型（洪乐潼的分类）

Visionary（前瞻派）：马斯克、洪乐潼自认——极度乐观，"就算往下跌一点也还行"
Executor（执行派）：扎克伯格——"日复一日执行执行执行"
Salesman（销售派）：Sam Altman——"非常好的沟通能力，能影响和引领别人"

四、从法学院到创业：Axiom的诞生

洪乐潼的学术路线——数学(MIT) → 神经科学(牛津) → 法学(斯坦福) → 数学博士(斯坦福)——看似杂乱，实则每一步都在为AI for Math积累认知。

法学院的关键顿悟

宪法解释的三种哲学

Originalism（原典主义）：按国父们的原意诠释宪法
Textualism（文本主义）：宪法字面是什么就读成什么——"特别像数学家会做的诠释"
Living Constitutionalism：宪法会呼吸，与时代一起成长

洪乐潼是Textualist。她在法学课上想到：如果已经到了能拿AI看宪法是什么意思的时代，"我为什么不能拿AI做数学？"——而这需要的不是英语，而是更结构性的呈现：Lean形式化语言。

关键人物：好友Kenny Luo

从2020年起，Kenny Luo就在做Lean形式化证明——当时Mathlib还是空的，他是把本科代数、本科分析一行行打进去的5-7个学生之一。Kenny是Kevin Buzard的学生，现在也在Axiom。

洪乐潼

我当时去读了科学史。从维基百科开始，到AI for Math的GitHub Repo——大概几百篇文章，每一篇的abstract我都读过。有意思的就把整篇看完。我做了多少次费曼的过程，在纸上去想如果要搭起来应该怎么做。到了一个程度——我发现它不一定是一个研究问题，它是一个工程问题。科技的风险没有我一开始看上去那么高。

五、Verve咖啡馆里的联创故事

Axiom的创始故事发生在Palo Alto的Verve咖啡馆——一个六人桌、周末有狗的地方。

舒伯（Shubo）：从陌生人到联创

2023年秋 · 相遇

洪乐潼抱着厚厚的法律书去咖啡馆做作业（"周末有狗，可以看狗喝抹茶"）。舒伯是Meta FAIR的Director，Facebook AI Research的元老，GPU经验20年，AI经验10年，曾在百度硅谷AI研究室与Dario Amodei（Anthropic创始人）共事。两人在同一张六人桌上认识——因为拉窗帘说上了话。

一年半 · 漫无目的的聊天

持续一年半只聊科学和历史。洪乐潼不知道舒伯在Meta，舒伯可能不知道她有数学研究背景。

2024年秋 · 餐巾纸上的算术

洪乐潼某天晨跑后觉得"这件事真的要发生了"，找舒伯算需要多少张GPU卡、融多少钱。"两个人在Verve拿了张餐巾纸在那算。"

2025年2月 · 舒伯加入

"他在Verve咖啡店说的——'好多好的人都走了，感觉这个地方不太像以前的地方。'然后问要不要一起做。"洪乐潼回忆自己"不太敢问"——因为舒伯是AI元老。

竞争对手的咖啡馆巧遇

洪乐潼曾在同一家Verve咖啡馆遇到主要竞争对手的CEO Tudor，主动问"你们招人吗？"——想加入而不是自己创业。对方回复："我们只招计算机的PhD。"洪乐潼是数学PhD——于是决定自己做。这个细节揭示了Axiom和竞争对手之间DNA的根本差异。

六、融资：从种子轮到16亿美元独角兽

6400万

种子轮融资（美元）

3亿→16亿

估值跃升（美元）

2亿+

A轮融资（美元）

7个月

成立到A轮

种子轮的戏剧性

时间线：2025年1月-7月

1月7日：美国数学学会年会（主题竟然是"AI for Math"），和DeepMind的Adam Zsolt交流
1月中：回来第三天就收到第一个offer——但要稀释50%，拒绝
2月：第二个offer，更合理——开始认真考虑
3月：B Capital的Howard Morgan（文艺复兴科技联合创始人、Jim Simons的伙伴）出现——"他比你更乐观，他比你更觉得你的商业模式有前景"
从第一个到最终offer，估值翻了三倍

洪乐潼

没有人喜欢融资。你是一个复读机，一次一次说一样的事情，一次一次接到一样的问题。真的，我可以录下来然后给你们大家发，反正问题也是一样的。

A轮：被Preempt

A轮原本没打算融——2025年圣诞节时，已有投资人主动递出term sheet。1月5日被叫到外地做pitch，当晚收到offer。最终由Menlo Ventures领投（Anthropic最大机构投资人），Matt Krisiloff是从种子轮开始支持Axiom的partner。

DeepSeek效应的反面

种子轮恰逢2025年2月DeepSeek出圈——投资人一听"模型"就恐慌。但洪乐潼强调"我们不是模型公司，我们是deep tech公司，更像SpaceX"——有大量技术壁垒（自建Lean验证器比社区版快100倍、12-13个辅助工具），R&D周期更长。

七、小野肯截胡OpenAI

小野肯（Ken Ono）教授加入Axiom的故事是整场访谈中最戏剧化的段落之一。

Ken Ono其人

被认为继承了拉马努金精神的现代数学家之一
美国数学学会前副主席
美国IMO游泳队教练（同时给奥运选手分析游泳数据）
好莱坞电影制片人（拍了拉马努金传记电影，正在拍第一位女性菲尔兹奖得主米尔扎哈尼的电影）
以拉马努金命名的慈善基金会创始人
白宫政策咨询顾问
性格像"高中篮球队教练"——给所有人加油助威

2025年11月底 · 一封奇怪的邮件

Ken Ono写信说他要来湾区，如果加入了OpenAI或DeepMind，希望洪乐潼有心理准备——因为可能存在战略竞争关系。洪乐潼的反应："你如果能加入OpenAI和DeepMind，那你为什么不来我这里？"

截胡 · 两三天内

Ken Ono去了OpenAI，但没来Axiom实地看。洪乐潼以为"凉了"。结果在Zoom上定了——Ken觉得Axiom"更数学"，OpenAI做数学的同学不多。整个过程在对方offer即将expire的两三天内完成。

洪乐潼

我也不太敢问。我不太敢问舒伯，我不太敢问小野肯。我是说你我没有办法说服你，你只能自己说服自己。大家都是成年人，自己做有趣的选择，然后一起承担风险。

Ken Ono与拉马努金的渊源

Ken的父亲是筹款为拉马努金在印度修雕像的数学家之一。拉马努金的遗孀给世界各地数学家写信众筹，Ken父亲回了信。Ken的办公室里至今还有拉马努金遗孀写给他父亲的那封信。Ken本科时绩点不好、高中没毕业——他的父亲用拉马努金的故事勉励他："任何时候开始也不算晚。"

八、把数学变成Lean：形式化证明的核心科技

洪乐潼详细解释了Lean形式化语言及其在AI for Math中的核心地位。

核心概念

Lean是什么？

Lean是一种形式化证明语言——你可以把数学证明写成代码，跑完看到一个勾（证明正确）或报错（某行有问题）。它既是编程语言，又自带验证能力——"既是C语言，又是GCC compiler和C runtime两者合一"。这使它非常finicky（脆弱），但也非常强大。

Axiom面临的四大工程挑战

挑战	问题	Axiom的解法
数据稀缺	全世界Lean代码加起来tokens很少	用AI生成合成Lean数据（而非靠人手打）
验证速度	社区原有的comparator慢100倍	自建verify proof系统，快100倍
搜索成本	AlphaProof用蒙特卡洛树搜索太贵	用sub-agents + skill learning替代（类似Anthropic的方向）
工具缺乏	Lean没有好用的hammer（一斧头解决sorry）	自建12-13个辅助工具

Draft-Sketch-Proof范式

AI for Math的标准三步法（源自2022年论文）

Draft（草稿）：informal模型列出证明提纲
Sketch（框架）：把提纲转化为formal Lean代码，中间用sorry标记未证部分
Proof（证明）：用AI、neural network或纯规则系统（hammer）填充所有sorry

Axiom的证明树已从40个节点scale到4000个节点——更深更广的搜索。

Axiom系统架构：四大核心科技

九、普特南满分：四个月的奇迹

2025年12月6日，成立仅四个月的Axiom在普特南大学生数学竞赛中取得满分120分——人类历史上98年来仅有5个满分，这是第六个，也是第一个由AI获得的。

120/120

普特南满分（12题全对）

4个月

从公司成立到满分

第6个

98年历史上第6个满分

98.93%

代码验证benchmark得分

那天发生了什么

庞加莱会议室的"战争状态"

早上六道题，四道需要求解（比预期多）——"小野肯教授说：现在不是说数学纯粹之美的时刻，现在是战争状态！"
能做数学竞赛题的基本只有Evan Chen（美国IMO队教练）——一个人一道接一道地做
研究型数学家Ken Ono"其实也没有做出来多少道"——研究数学和限时竞赛是完全不同的能力
下午3:58确认8道题（80分，已是世界前五水平）
最终发现AI系统实际上不需要人类求解——它的informal模型可以自己做出解法

洪乐潼

有一道题Evan Chen画了一个图，所有人一看就说"哦，你去把它做出来吧"——一个图的解法。但AI果然没有找到这个一图解法。我们看到几千行Lean代码，硬生生通过类似枚举、分类讨论，一步一步核实把它干出来。大力出奇迹的AI。

意外的Transfer Learning

Axiom发现了一个令所有人惊讶的现象：数学定理证明能力能转移到代码验证能力。在VerifyNot benchmark上，原本DeepSeek Prover达到11%，Axiom的系统达到98.93%。洪乐潼认为这是因为数学证明和代码验证在Lean中的目标函数"聚拢"了——都是形式化语言，而不是一个Python一个英语。

十、AI for Math的技术版图

洪乐潼将AI for Math的核心科技拆解为四个组成部分，并明确了Axiom相对于竞争对手的差异化定位。

Axiom的四大核心科技

Prover（证明家）：给定命题，自动生成Lean证明
Conjecturer（猜想家）：提出有价值的数学猜想——"最难做的部分"
Auto-formalization（自动形式化）：将自然语言数学转化为Lean——"被忽略但可能更难"
Knowledge Base（知识库）：搜索已知定理、发现反例

Axiom vs 竞争对手

竞争对手认为IMO金牌是终局，准备直接落地商业化
Axiom打算做猜想——"我们和竞争对手的区别是我们打算做这件事"
竞争对手"不招数学家"；Axiom既要数学家，还要编译器/代码生成的人
Axiom信念："多元产生智能"、"降维打击"

AI for Math的发展简史

2016-2018 · ATP奠基

Christian Szegedy在Google开始用HOList做定理证明；ATPboost（波兰人Bartosz，现在Axiom）。

2019-2020 · OpenAI入场

Ilya Sutskever带队做GPT-f、mini-f2f。Jesse Michael Han、Stan Polu等后来成为创业者。

2021 · AlphaGeometry萌芽

一个实习生在Google DeepMind秘密开始AlphaGeometry项目。

2024年7月 · AlphaProof银牌

IMO六道题做了五道，28分银牌——"跨世纪的时刻"。

2025年12月 · Axiom普特南满分

四个月从零到满分。同时解决了交换代数、代数几何、代数数论、离散数学的多个研究问题。

AI for Math能力进展时间线

十一、数学与代码：孪生兄弟

洪乐潼

Math is code, code is math. 有一个叫Curry-Howard对应——每一个数学证明可以变成一个计算机程序。反过来，为什么后端的distributed system无法像前端那样好地web coding？因为它缺少数学能给的hierarchical分级拆解和backtrack能力。

核心概念

Curry-Howard对应的实践意义

Lean语言体现了这个数学-计算机的同构关系：代码即证明，证明即代码。这意味着Axiom的Prover可以同时做到两件事——生成数学证明和验证程序正确性。在Axiom的系统中，这不是两个目标函数拉扯（Python + 英语），而是统一的形式化空间。

语言 vs 数学在AI中的角色

语言的角色

突破边界——conjecture（猜想）
理解用户模糊需求
列证明提纲（"很大一个部分的胜利"）
数学家用自然语言做逻辑推理已经几千年

数学/Lean的角色

约束和验证——把幻觉拉回来
百分之百正确的grounding
在形式化空间中做纯粹证明
"之前大家把数学当语言了，不对——要把数学变成Lean"

洪乐潼提出一个精彩的观察：数学作为英语的子集，词汇的概率分布完全不同——比如代数几何中的"germ"，在英语中是"细菌"。如果让AI在英语中做数学，"这不是事情的全貌"。

十二、验证作为第一市场

洪乐潼详细阐述了Axiom的商业路线图：验证（Verification）是第一个市场，之后是AI for Science和最优化。

为什么验证痛点最大

亚马逊的案例

亚马逊拥有世界上最好的自动推理团队之一（无AI，纯人工）
花了3-5年写了26万行定理证明代码
仅仅为了验证一个hypervisor的memory isolation component
"AI没有改善这些工程师的生活"——这就是Axiom的市场机会

商业路线图

市场	应用场景	时间
验证（第一市场）	芯片验证（替代基于SMT的Jasper）、代码验证（不需要test case）	正在探索
AI for Science	为物理学家、生物学家解决理论问题	中期
最优化	覆盖所有edge case的搜索引擎级能力	远期

洪乐潼

我们相信的一件事：任何你能定义的，你都能证明。任何你能表达的，你都能执行。这是我们对coding未来的愿景——有一天你要一个函数的时候，它给你的是百分之百不需要验证的函数。

Specification才是真正的瓶颈

洪乐潼指出验证的难点不在证明本身，而在specification（定义/命题）——你如何把问题精确地写成形式化的命题？这和数学中猜想的困难是同构的。比如First Proof挑战的10道题，Axiom甚至无法参加——因为题目涉及的定义完全不在Mathlib里，"题目我都放不到Lean里面"。这解释了为什么猜想家（Conjecturer）是Axiom的长期战略重点。

十三、数学：被创造还是被发现

这个贯穿整场访谈的哲学问题，在洪乐潼这里得到了层次丰富的回答。

洪乐潼

证明其实某种程度上是影响力——我只要能够严丝合缝地逻辑证明出来，我的数学发现就可以被接受。拉马努金从印度来到英国，像外星人一样——"这是我的草稿本，上面这些全都是对的，我从来没有接受过数学训练，我不知道怎么证明。"哈代和Littlewood用证明来说服所有人。

张益唐的案例

国际数论学家看张益唐的证明时觉得和他们熟悉的学派"非常不一样"，但结果是正确的，于是接受了。James Maynard的2022年菲尔兹奖带来了另一套证明技巧。学生们继承、比较、简化——"这个过程是非常有意思的智力过程"。

AI会把这个问题推向新的维度

假设AI用了一个新公理

洪乐潼被问到一个思想实验：如果Axiom的AI证明了重大猜想但使用了一个不属于现有数学的新公理？她的回答：

AI已经在尝试用"奇怪的公理"作弊——DeepSeek Prover就曾因此出错
如果这个公理大家觉得"自然"，就会被接受
可以按"接受和不接受"两个世界继续运作——branching factor为2
但如果持续分叉，会"一团混乱"，最终大家会"tighten"回收
"数学某种程度上是人类文明的构造"——比起物理加一个新定律，接受度可能更高

十四、从Math Poor到Math Rich

洪乐潼描绘了AI for Math成功后的世界图景——一个"数学的供给会爆炸"的社会。

洪乐潼

我们从一个math poor到math rich的社会。所有没有被解决的理论问题，所有应用科学家们希望有一个数学家帮他们解决的问题，全部可以解决。指数级的数学发现的增长——我觉得一定会发生。

AlphaFold的先例

洪乐潼引用了DeepMind纪录片中的一幕：AlphaFold成功后，有人建议做一个平台让结构生物学家提交要折叠的蛋白。Demis Hassabis问"有多少蛋白"，回答"2亿个"，Demis把笔扔在桌上说"Fold everything, that was a stupid idea"。洪乐潼的类比：如果算力无限，"我们要把所有人类能想到的数学问题全部解决"。

数学家的角色转变

有限算力世界

数学家成为资源分配者
"200个H200花在这道题，8000个花在那道题"
直觉决定算力分配——"算力与数学家对题目重要性的判断画等号"

无限算力世界

数学家成为好奇心的守护者
提供0.01%的直觉：哪些问题更值得解决
看懂AI的100万行Lean证明，从中获得新猜想
Jevons Paradox：工具越强大，用处越多

ASI而非AGI

洪乐潼的"盘子理论"

盘子中心：1+1=2，Hello World
盘子边缘：证明黎曼猜想，治愈癌症，写诺贝尔文学奖作品
OpenAI的路线：一点点把圆环撑大，覆盖所有边界（AGI）
Axiom的路线：从中心往"证明黎曼猜想"方向打出一个扇形——"绝对不会覆盖到诺贝尔文学奖，但会有一个比较大的扇形"
所以Axiom是ASI（Specialized Superintelligence）而非AGI

十五、启示与延伸思考

1. "蛮力型选手"的创业者优势

洪乐潼反复强调自己不是天赋型——用复数法暴力做几何、六个月做不出sphere packing问题但每周汇报、期中考40分只拿4分。但这恰恰是AI for Math创业者的最佳背景：她深刻理解AI作为"蛮力型数学家"的价值，因为她自己就是这样做数学的。AlphaGeometry的哲学和她的解题方式完全一致。这提示了一个反直觉的创始人筛选标准：在天才云集的领域里，"最愚蠢的那个人"可能最理解如何用工具增强人类。

2. 形式化证明是AI推理的下一个基础设施

洪乐潼的核心洞见：之前大家把"数学当语言做拐杖"——但数学应该变成Lean。语言模型的幻觉问题在数学领域有了精确解：形式化验证给出100%确定的对错信号。这不只是数学问题——芯片验证（替代SMT/Jasper）、代码验证（不需要test case）都是直接应用。Axiom在代码验证benchmark上从DeepSeek的11%跳到98.93%，证明了数学证明能力向代码验证的transfer learning是真实的。

3. 定义比证明更难——AI for Math的真正瓶颈

证明可以验证对错，但定义（specification）没有对错之分。猜想家比证明家更难训练，因为"我不知道这个定义是对还是错"。这个问题同构于代码世界的specification问题：你能写出程序，但能精确定义你要解决什么问题吗？洪乐潼坦承Axiom无法参加First Proof挑战——"题目我都放不到Lean里"——因为涉及的定义不在Mathlib中。这是AI for Math和AI for Code共同面临的根本瓶颈。

4. "咖啡馆创业"的硅谷范式

Axiom的创始故事几乎全部发生在Palo Alto的Verve咖啡馆：洪乐潼在那里认识了舒伯（拉窗帘说上话），在那里和竞争对手的CEO偶遇（被拒绝后决定自己做），在餐巾纸上算融资，墙上还有她和舒伯的拍立得。这不是巧合——硅谷的创新密度来自物理空间的碰撞，而非线上网络。洪乐潼说她"没有办法开超过一小时的Zoom"，但和舒伯每次讨论四五个小时。

5. New Lab的存在逻辑：好奇心是基本作用力

洪乐潼将New Lab的诞生归结为一个"基本作用力"——人类的好奇心。即使OpenAI/DeepMind开出1亿美元package，也"无法压制住青年研究者的好奇心"。她引用Peter Thiel的话："垄断导致创新，竞争导致平庸"——New Lab是被使命而非ego驱动的。假设AI解决了所有数学问题——"还会有数学家吗？"——答案是一定会有，因为"你不让我看那100万行Lean代码，我都会去看"。

6. Axiom的生死判断：binary outcome

洪乐潼对自己公司的判断极为清醒：结果一定是"极好或极坏"，没有中间态——"要么登月成功，要么火箭坠毁"。她的核心竞争策略是效率（"一个单位的创新需要多少单位资源"）和人才密度（30人 vs 竞争对手50-75人，但前30篇AI for Math论文的大部分作者都在Axiom）。如果失败了？"我可能会做跟神经科学相关的事情——brain-machine interface目前的实现都太不理想了。"

7. 墓志铭上写"学徒"

被问到墓志铭想写什么，洪乐潼的回答不是"数学家"也不是"CEO"——而是"学徒"。从数学到物理到神经科学到法学到AI，她的模式是在每个领域都做学徒。她说自己"最快乐的状态是research scientist intern——这个intern很重要，因为如果我说的话比较愚蠢，大家会觉得正常"。这个回答解释了为什么一个"最不可能创业的创业者"最终创建了一家追求"天书中的证明"的公司——因为学徒的驱动力不是控制，而是好奇。

关键数据汇总

数据点	具体内容
Axiom团队规模	30人（竞争对手50-75人）
种子轮	6400万美元，估值3亿美元（2025年1-7月）
A轮	2亿+美元，估值16亿美元（2026年1月）
普特南成绩	满分120分（成立4个月后，2025年12月）
代码验证分数	98.93%（vs DeepSeek Prover 11%）
自建验证器速度	比社区版快100倍
证明树规模	从40节点scale到4000节点
自建工具数量	12-13个辅助Lean的生成和验证工具
团队IMO选手	5个IMO（含4个IMO金牌）
领投方	种子轮B Capital（文艺复兴联创Howard Morgan）；A轮Menlo Ventures
竞争对手	成立早2年，融资约为Axiom种子轮的5倍
洪乐潼年龄	24岁（2001年生）
直觉能力预测	5-10年可能实现AI数学直觉
公司名字来源	"Axiom"（公理）——源自《数学天书中的证明》
会议室命名	高斯、庞加莱、希尔伯特、Lovelace、图灵（因"polymath"原则选定）

洪乐潼：让AI证明天书中的定理

目录

一、被数学击中的时刻

数学是什么？

数学击中她的三个层次

二、蛮力型选手与自由注意力

Bounded Attention vs Free Attention

AlphaGeometry的哲学共振

"拒绝被驯化"

三、MIT：失败是默认项

大一第一学期 · 博士概率论

大一下学期 · 疫情隔离

大一暑假 · 小野肯教授的REU

本科期间 · 摩根奖

三种创业者类型（洪乐潼的分类）

四、从法学院到创业：Axiom的诞生

法学院的关键顿悟

宪法解释的三种哲学

关键人物：好友Kenny Luo

五、Verve咖啡馆里的联创故事

舒伯（Shubo）：从陌生人到联创

2023年秋 · 相遇

一年半 · 漫无目的的聊天

2024年秋 · 餐巾纸上的算术

2025年2月 · 舒伯加入

竞争对手的咖啡馆巧遇

六、融资：从种子轮到16亿美元独角兽

种子轮的戏剧性

时间线：2025年1月-7月

A轮：被Preempt

DeepSeek效应的反面

七、小野肯截胡OpenAI

Ken Ono其人

2025年11月底 · 一封奇怪的邮件

截胡 · 两三天内

Ken Ono与拉马努金的渊源

八、把数学变成Lean：形式化证明的核心科技

Lean是什么？

Axiom面临的四大工程挑战

Draft-Sketch-Proof范式

AI for Math的标准三步法（源自2022年论文）

九、普特南满分：四个月的奇迹

那天发生了什么

庞加莱会议室的"战争状态"

意外的Transfer Learning

十、AI for Math的技术版图

Axiom的四大核心科技

Axiom vs 竞争对手

AI for Math的发展简史

2016-2018 · ATP奠基

2019-2020 · OpenAI入场

2021 · AlphaGeometry萌芽

2024年7月 · AlphaProof银牌

2025年12月 · Axiom普特南满分

十一、数学与代码：孪生兄弟

Curry-Howard对应的实践意义

语言 vs 数学在AI中的角色

语言的角色

数学/Lean的角色

十二、验证作为第一市场

为什么验证痛点最大

亚马逊的案例

商业路线图

Specification才是真正的瓶颈

十三、数学：被创造还是被发现

张益唐的案例

AI会把这个问题推向新的维度

假设AI用了一个新公理

十四、从Math Poor到Math Rich

AlphaFold的先例

数学家的角色转变

有限算力世界

无限算力世界

ASI而非AGI

洪乐潼的"盘子理论"

十五、启示与延伸思考

1. "蛮力型选手"的创业者优势

2. 形式化证明是AI推理的下一个基础设施

3. 定义比证明更难——AI for Math的真正瓶颈

4. "咖啡馆创业"的硅谷范式