"AI 是一场马拉松,现在还很早,只是前500米。"
| 本科 | 南京大学 计算机科学 (2001) |
|---|---|
| 早期 | 微软 3 年 (2001-2004) |
| 博士 | 加州大学河滨分校 (UC Riverside),CS PhD + 统计学硕士 |
| 2008-2025,近 17 年。Google Fellow (L10) / DeepMind VP of Research | |
| 当前 | 字节跳动 Seed 基础研究负责人 (2025.2-至今),直接向 CEO 梁汝波汇报 |
| 学术 | 论文引用 5万+,h-index 72,131+ 篇论文 |
| 代表作 | GNMT (一作)、RankBrain、Gemini 1.5 Core Contributor |
全面负责 Seed 基础研究,组建三大虚拟团队(Edge/Focus/Base),推出豆包2.0(万亿参数)和 Seedance 2.0(视频生成,马斯克公开称赞)。
2023.9 晋升 Google Fellow (L10),参与 Gemini 研发,担任 Gemini App 总体技术负责人。
聚焦深度学习与序列模型,研究方向覆盖 ASR、NMT、TTS、语言建模。
2008 年博士毕业即加入谷歌,最初负责核心网页搜索排序算法优化。
4 年内同时获得 CS 博士和统计学硕士学位。
南大本科毕业后在微软工作 3 年,随后重返学术界攻读博士。
计算机科学专业。南大是中国 AI 研究的重镇之一。
2016年9月发表,吴永辉为第一作者,31位共同作者(含 Jeff Dean)
吴永辉在 Google Research 的个人主页
GNMT 论文,一作吴永辉,末位 Jeffrey Dean
GNMT 基于 Seq2Seq + 注意力机制,一举将翻译错误率降低 60% 以上。2016年11月正式部署到 Google Translate,覆盖 100+ 种语言,每天服务数十亿次翻译请求。这是深度学习首次在 Google 核心产品中实现如此大规模的替代。
| 组件 | 创新 |
|---|---|
| 编码器 | 8 层 LSTM,第一层双向 |
| 解码器 | 8 层 LSTM + 注意力机制 |
| 训练 | 分布式训练,数据并行 + 模型并行 |
| 推理 | 量化推理加速,低精度部署 |
| 评估 | 在多语言对上接近人类翻译质量 |
将深度学习引入 Google 核心搜索排序
吴永辉 2008 年加入时是搜索排序工程师——这意味着他对 Google 最核心的商业产品有深刻理解。后来参与 RankBrain 项目,将神经网络引入搜索排序,是 Google 搜索从手工特征工程走向深度学习的关键转折之一。
这种"从工程实践到基础研究"的路径,让他既懂规模化部署,又有前沿研究能力——这正是字节最需要的复合型人才。
| Gemini 1.0 | 参与核心研发 |
|---|---|
| Gemini App | 总体技术负责人 |
| Gemini 1.5 | Core Contributor(论文署名) |
在 Google Brain 与 DeepMind 合并后的新架构下,吴永辉跨越了研究与产品的边界,这段经验对于领导字节 Seed 的"研究到产品"转化至关重要。
Google Fellow 对应 L10 职级,是技术序列的最高级别。整个谷歌只有极少数人获此殊荣。L10 之上的 L11(Senior Fellow)历史上仅有 Jeff Dean 和 Sanjay Ghemawat 两人。
吴永辉为人低调,很少公开露面或接受媒体采访,但技术实力位居谷歌金字塔顶端——故被中国媒体称为"谷歌 AI 扫地僧"。
2025年初接手时,Seed 投入上百亿、上千人研发两年,却"被百余人小团队(DeepSeek)反超"
| 团队 | 定位 | 目标 |
|---|---|---|
| Edge | 长期 AGI 探索 | 不确定性大、周期长的前沿课题 |
| Focus | 突破短板 | 解决基础模型核心能力差距 |
| Base | 当前迭代 | 豆包系列模型的快速版本迭代 |
三代模型并行研发——既保证短期产出,又为长期积累留出空间。
接手后先与百余名核心研究员逐一对话,了解各自方向和困惑。
打通数据和代码库访问权限,解决"看跨团队文档需多层审批"的问题。
大部分团队取消 OKR 考核机制,让研究员专注于探索而非短期KPI。
接管后三个月论文数超过 2024 年全年。实习生可直接与高层交流。
不再招聘中高层技术管理者,转而提拔应届生与年轻研究员。
发放独立于公司期权之外的激励,多次提薪。
Seed 成立以来最大模型,参数达万亿级,对标 Google Gemini。基础模型完成 4 次迭代,在国内模型评测中跻身第一梯队。
视频生成大模型,发布后引爆全球科技圈。马斯克公开称赞其"技术迭代速度远超预期"。吴永辉是 Seedance 系列的最高技术决策者。
过去两年"重追赶、轻基础建设",参数扩大后系统极不稳定。团队花 3 个月从模型架构、训练数据入手解决,被研究员形容为"边开车边修轮子"。
同期对比:OpenAI 2025 年重构 Infra;阿里 Qwen 组建专属 Infra 团队;腾讯由姚顺雨牵头成立 AI Infra 部。基础设施建设是所有大厂的共同课题。
2025年下半年资源向短期成果团队倾斜,单点长期研究被忽视。部分团队放弃自研算法,转而基于开源项目改进。信息透明也带来副作用——两起实习生泄密事件。
这是所有 AI 大厂的共同难题:如何在商业竞争压力下保护长期基础研究的空间。
"沉稳"是 Seed 团队对他的一致印象。在 AI 行业普遍焦虑追赶的氛围中,他坚持"马拉松思维"——"现在还很早,只是前500米"。
从搜索排序工程师起步,到 Google Brain 前沿研究,再到 Gemini 产品化。这种"懂工程也懂理论"的复合能力极为稀缺。
极少公开发言或接受媒体采访。在谷歌17年默默做到最高技术职级,被称"扫地僧"——用成果说话,而非用声量。
接管1500人团队后的第一动作不是重组架构,而是逐一沟通。取消OKR、鼓励发论文、提拔年轻人——用研究氛围而非管控来激发产出。
在 Google Fellow / DeepMind VP 的位置上选择离开,寻求"长期基础科学研究"。这需要对自己想做什么有极清晰的认知。
Seed Edge 团队的设立——鼓励探索"长周期、不确定性大"的 AGI 课题——正是他在组织层面落实长期主义的体现。
1. 先做工程再做研究——理解产品和规模化是做好研究的前提,不是对立面
2. 17年深耕一个领域——在 NLP/ML 领域从工程师做到顶级研究者,靠的是持续积累而非频繁跳槽
3. 在对的时机做选择——到达 Google 金字塔顶端后寻求新的挑战,而非安于现状
4. 用氛围而非制度管人——取消OKR、鼓励论文、一对一沟通,比层层审批更能激发创造力
5. 接受"边开车边修轮子"——面对技术债不回避,选择迎头解决