理想国

向传奇人物学习,记录他们的思想、行动和轨迹
Vol.02 — 吴永辉 (Yonghui Wu)

吴永辉 Yonghui Wu

"AI 是一场马拉松,现在还很早,只是前500米。"

本科南京大学 计算机科学 (2001)
早期微软 3 年 (2001-2004)
博士加州大学河滨分校 (UC Riverside),CS PhD + 统计学硕士
Google2008-2025,近 17 年。Google Fellow (L10) / DeepMind VP of Research
当前字节跳动 Seed 基础研究负责人 (2025.2-至今),直接向 CEO 梁汝波汇报
学术论文引用 5万+,h-index 72,131+ 篇论文
代表作GNMT (一作)、RankBrain、Gemini 1.5 Core Contributor

完整时间线

字节 Seed 全面接管 (2025.2-至今)

全面负责 Seed 基础研究,组建三大虚拟团队(Edge/Focus/Base),推出豆包2.0(万亿参数)和 Seedance 2.0(视频生成,马斯克公开称赞)。

组织改革:与百余名核心研究员一对一沟通,推动数据/代码透明共享,取消 OKR,发放"豆包虚拟股"。
论文产出:接管后三个月论文数超过 2024 年全年。
团队规模:约 1500 人,放缓外部扩张,转而提拔年轻研究员。
Seed Edge:2025年1月组建,鼓励探索长周期 AGI 课题。

Google DeepMind VP / Google Fellow (2023-2025)

2023.9 晋升 Google Fellow (L10),参与 Gemini 研发,担任 Gemini App 总体技术负责人。

Google Fellow:对应 L10 职级,被视为谷歌最高技术职级——其上的 L11 仅 Jeff Dean 和 Sanjay Ghemawat 两人。
Gemini 1.5:论文中列为 Core Contributor。
离开原因:寻求"新的、探索导向的工作",专注"长期基础科学研究"。

Google Brain (2014-2023)

聚焦深度学习与序列模型,研究方向覆盖 ASR、NMT、TTS、语言建模。

GNMT (2016):一作论文 "Google's Neural Machine Translation System",翻译错误较旧系统减少 60%+,彻底改变谷歌翻译,影响数十亿用户。引用量极高。
RankBrain:主要贡献者之一,将深度学习引入谷歌核心搜索排序。
语音领域:端到端语音识别与合成、跨语言翻译。

Google 搜索排序工程师 (2008-2014)

2008 年博士毕业即加入谷歌,最初负责核心网页搜索排序算法优化。

UC Riverside 博士 (2004-2008)

4 年内同时获得 CS 博士和统计学硕士学位。

微软 (2001-2004)

南大本科毕业后在微软工作 3 年,随后重返学术界攻读博士。

南京大学本科 (1997-2001)

计算机科学专业。南大是中国 AI 研究的重镇之一。

GNMT:改变数十亿人的翻译体验

2016年9月发表,吴永辉为第一作者,31位共同作者(含 Jeff Dean)

Yonghui Wu - Google Research

吴永辉在 Google Research 的个人主页

GNMT Paper

GNMT 论文,一作吴永辉,末位 Jeffrey Dean

里程碑

从短语统计到端到端神经翻译

GNMT 基于 Seq2Seq + 注意力机制,一举将翻译错误率降低 60% 以上。2016年11月正式部署到 Google Translate,覆盖 100+ 种语言,每天服务数十亿次翻译请求。这是深度学习首次在 Google 核心产品中实现如此大规模的替代。

GNMT 技术架构要点

组件创新
编码器8 层 LSTM,第一层双向
解码器8 层 LSTM + 注意力机制
训练分布式训练,数据并行 + 模型并行
推理量化推理加速,低精度部署
评估在多语言对上接近人类翻译质量

RankBrain 与搜索排序

将深度学习引入 Google 核心搜索排序

从排序工程师到 AI 研究者的跨越

吴永辉 2008 年加入时是搜索排序工程师——这意味着他对 Google 最核心的商业产品有深刻理解。后来参与 RankBrain 项目,将神经网络引入搜索排序,是 Google 搜索从手工特征工程走向深度学习的关键转折之一。

这种"从工程实践到基础研究"的路径,让他既懂规模化部署,又有前沿研究能力——这正是字节最需要的复合型人才。

Gemini:大模型时代的集大成

在 Gemini 中的角色

Gemini 1.0参与核心研发
Gemini App总体技术负责人
Gemini 1.5Core Contributor(论文署名)

在 Google Brain 与 DeepMind 合并后的新架构下,吴永辉跨越了研究与产品的边界,这段经验对于领导字节 Seed 的"研究到产品"转化至关重要。

Google Fellow:谷歌的"扫地僧"

为什么称"扫地僧"

Google Fellow 对应 L10 职级,是技术序列的最高级别。整个谷歌只有极少数人获此殊荣。L10 之上的 L11(Senior Fellow)历史上仅有 Jeff Dean 和 Sanjay Ghemawat 两人。

吴永辉为人低调,很少公开露面或接受媒体采访,但技术实力位居谷歌金字塔顶端——故被中国媒体称为"谷歌 AI 扫地僧"。

接管 Seed:从"尴尬处境"到"国内第一梯队"

2025年初接手时,Seed 投入上百亿、上千人研发两年,却"被百余人小团队(DeepSeek)反超"

三大虚拟团队架构

团队定位目标
Edge长期 AGI 探索不确定性大、周期长的前沿课题
Focus突破短板解决基础模型核心能力差距
Base当前迭代豆包系列模型的快速版本迭代

三代模型并行研发——既保证短期产出,又为长期积累留出空间。

组织改革:研究氛围重塑

一对一沟通

接手后先与百余名核心研究员逐一对话,了解各自方向和困惑。

信息透明

打通数据和代码库访问权限,解决"看跨团队文档需多层审批"的问题。

取消 OKR

大部分团队取消 OKR 考核机制,让研究员专注于探索而非短期KPI。

鼓励发论文

接管后三个月论文数超过 2024 年全年。实习生可直接与高层交流。

提拔年轻人

不再招聘中高层技术管理者,转而提拔应届生与年轻研究员。

豆包虚拟股

发放独立于公司期权之外的激励,多次提薪。

核心成果

2026.1

豆包 2.0 — 万亿参数大模型

Seed 成立以来最大模型,参数达万亿级,对标 Google Gemini。基础模型完成 4 次迭代,在国内模型评测中跻身第一梯队。

2026.2

Seedance 2.0 — "地表最强视频生成"

视频生成大模型,发布后引爆全球科技圈。马斯克公开称赞其"技术迭代速度远超预期"。吴永辉是 Seedance 系列的最高技术决策者。

技术债的诚实面对

过去两年"重追赶、轻基础建设",参数扩大后系统极不稳定。团队花 3 个月从模型架构、训练数据入手解决,被研究员形容为"边开车边修轮子"。

同期对比:OpenAI 2025 年重构 Infra;阿里 Qwen 组建专属 Infra 团队;腾讯由姚顺雨牵头成立 AI Infra 部。基础设施建设是所有大厂的共同课题。

核心挑战:长短期平衡

"从未真正化解"的矛盾

2025年下半年资源向短期成果团队倾斜,单点长期研究被忽视。部分团队放弃自研算法,转而基于开源项目改进。信息透明也带来副作用——两起实习生泄密事件。

这是所有 AI 大厂的共同难题:如何在商业竞争压力下保护长期基础研究的空间。

值得学习的品质

沉稳与耐心

"沉稳"是 Seed 团队对他的一致印象。在 AI 行业普遍焦虑追赶的氛围中,他坚持"马拉松思维"——"现在还很早,只是前500米"。

工程 + 研究的双重视野

从搜索排序工程师起步,到 Google Brain 前沿研究,再到 Gemini 产品化。这种"懂工程也懂理论"的复合能力极为稀缺。

低调实干

极少公开发言或接受媒体采访。在谷歌17年默默做到最高技术职级,被称"扫地僧"——用成果说话,而非用声量。

组织建设能力

接管1500人团队后的第一动作不是重组架构,而是逐一沟通。取消OKR、鼓励发论文、提拔年轻人——用研究氛围而非管控来激发产出。

敢于在巅峰离开

在 Google Fellow / DeepMind VP 的位置上选择离开,寻求"长期基础科学研究"。这需要对自己想做什么有极清晰的认知。

长期主义的践行者

Seed Edge 团队的设立——鼓励探索"长周期、不确定性大"的 AGI 课题——正是他在组织层面落实长期主义的体现。

金句与理念

"AI 是一场马拉松,现在还很早,只是前500米。既进取,又耐心。"
— 梁汝波内部信(描述吴永辉加入的战略意义)
"寻求新的、探索导向的工作,专注于长期基础科学研究。"
— 吴永辉离开 Google 的原因(36Kr 报道)
"探索智能的上限。"
— 字节 Seed 团队使命

对我的启示

关键洞察

1. 先做工程再做研究——理解产品和规模化是做好研究的前提,不是对立面
2. 17年深耕一个领域——在 NLP/ML 领域从工程师做到顶级研究者,靠的是持续积累而非频繁跳槽
3. 在对的时机做选择——到达 Google 金字塔顶端后寻求新的挑战,而非安于现状
4. 用氛围而非制度管人——取消OKR、鼓励论文、一对一沟通,比层层审批更能激发创造力
5. 接受"边开车边修轮子"——面对技术债不回避,选择迎头解决