← 返回张小珺主页
深度研究 Deep Dive

张月光:从妙鸭到AI朋友

#130 创业两年首次访谈:流程到上下文、One Way Door与乙女游戏
2026.1.22 · 03:14:15 · 张小珺Jun|商业访谈录
🎙 小宇宙 📺 B站 🎧 Apple Podcasts 🎵 Spotify

目录

  1. 产品经理的十二年与鸭川决定
  2. 大厂的内部游戏与外部游戏
  3. 妙鸭:90分等于零分的产品哲学
  4. 妙鸭不是AI Native产品
  5. 从流程设计到上下文设计
  6. One Way Door:单向门产品理论
  7. 创业动机论:期望收益最大化
  8. AI陪伴的三大行业通病与游戏解法
  9. 乙女游戏的IP翘翘板效应
  10. 信息媒介理论与平台机会
  11. ChatBot的终极商业模式:决策控制权
  12. Agent的两个价值取向
  13. Docky与PPT:后发者的竞争方法论
  14. 启示与延伸思考

一、产品经理的十二年与鸭川决定

张月光(悦光)是一位有12年经验的产品经理,先后在孔明科技(SaaS)、支付宝、字节跳动、阿里巴巴(优酷)工作。2023年因妙鸭相机走红,同年10月在京都鸭川边做出人生重要决定。

张月光
我从夜里两点一直坐到凌晨五点,就拿了一罐啤酒在那儿坐着。那天想了很多事情,做了一些很重要的决定。

鸭川之夜的核心思考

即将35岁的张月光回顾过去十几年,发现自己最不满意的是"没有长坡厚雪"——不管是人还是事都没有积累。做过资金产品、红包、相册工具、图像工具、社交、短视频、长视频、AI图像,品类繁杂却缺乏连续性。

人生原则

35到45岁的Flag

张月光给自己定了一个原则:35岁到45岁,跟同一群人,做同一件事情。这个原则的威力在于"让你做决策的时候不用想了"——给他再升P10、涨薪或奖金,都不在讨论范围内,因为大厂无法满足"十年同一群人同一件事"的要求。

2012年 孔明科技

社交媒体管理SaaS工具,帮助用户批量管理微博内容。

2014-2016年 支付宝

做转账等资金类产品,"没有什么想法,老板让干什么就干什么"。

2016-2018年 字节跳动

先做图形图像部门(时光相册),后调到今日头条大团队,发起春节红包项目和字节小程序平台。

2018-2020年 第一次创业

做Live2D社交产品"原音",高峰近10万DAU,最终因低龄化和商业模式问题关停,回到阿里。

2020-2023年 阿里(优酷)

管理近300人团队。发现长视频本质是内容业务而非互联网业务后,将精力转向AI图像创新,孵化妙鸭。

2023年10月 鸭川决定

国庆假期在京都做出创业决定。双十一正式离职。

2024年初 创立沐岩智语

累计融资近三亿元,开始AI游戏和AI应用双线探索。

去字节做AI而非做今日头条

张月光2016年加入字节的真实动机是做视觉AI(CV),而非今日头条。当时正值视觉四小龙兴起,但四小龙做2B,张月光想找做C端的AI公司,最终找到字节的图形图像部门。他坦言"一天今日头条的产品都没做过"。

二、大厂的内部游戏与外部游戏

张月光提出了大厂晋升的两种路径,这也解释了他为什么最终选择离开。

外部游戏

  • 通过战胜外部敌人来打怪升级
  • 在某个战役中赢了,明确是你打的
  • 需要增量周期(行业有新机会)
  • 不确定性更高,但创造价值真实

内部游戏

  • 不需要真的打赢外部敌人
  • 只要在361考核中永远是那个"3"
  • 不需要周期,任何时候都可以玩
  • 大厂体系的"地心引力"让人难免转向内部作战
张月光
外部游戏一定是更难的。但从抖音之后,互联网很久没有出现过那种真正意义上能够改变很多事情的产品。没有增量,大家就很难免会变成内部游戏。今天AI的诞生,又提供了外部游戏的机会。

为什么长视频不是互联网业务

张月光在优酷的核心认知:"长视频本质是个内容业务,甚至你可以把它超向成投资业务。"一个片子拍得好就播得好,从产品技术上不可能用任何手段去辅助。他甚至认为加推荐算法"很有可能是负向的"。这个认知让他决定不再参与优酷的日常会议,将精力转向AI创新。

关于绩效的诚实回答

当被问到怎么给团队打绩效时,张月光的回答极为坦率:"大家都没有什么特别实质的结果。如果大家都没有特别实质的结果,这个绩效更多是过程驱动。"这也折射出在缺乏增量的环境中,产品技术团队面临的困境。

三、妙鸭:90分等于零分的产品哲学

妙鸭相机在2023年7月爆红,三个月内实现大几百万付费用户(超过海马体全年客户量),日收入突破百万级。但张月光强调,这个产品的成功建立在几个"简单而常识性的判断"之上。

四个关键决策

选技术:Diffusion Based Model

ChatGPT最火的时期,团队判断只有图像技术相对成熟,周边生态开发比较好。

选方向:写实人像

基于"人的照片占手机相册76%"的数据洞察,选择做写实人像而非通用图像生成。

选模式:To C写真而非电商图

团队本能是做淘宝模特图,但张月光判断电商链条太长、缺乏溢价权。选择写真这个可以"端到端定价"的消费品。

选标准:真、像、美

三个模型串联解决:底层模型负责"真"(训练大量普通人照片)、用户20张照片训练的模型负责"像"(ID保持)、模板模型负责"美"。

76%
手机相册中人物照片占比
3个
串联模型(真/像/美)
~2万张
高峰期线上推理卡
3个月
从开发到爆红
核心理念

90分等于零分

张月光的产品哲学:AI产品存在一条关键的可用线。90分时,人一眼就看出来这是AI,价值仍然非常受限。但一旦越过100分的线——没人看出来是AI做的——成本的巨大优势就会显现。"你即使成本再低,越过那条线之前,价值仍然非常受限。"这一哲学贯穿他后续所有产品决策。

张月光
很多用户去对比,他自己在海马体真的拍过,拿妙鸭做了一个同样风格的。很多人都觉得妙鸭做的更好看、更像他。因为海马体也是会给你精修的,很多时候修的都面目全非了。

妙鸭的后续构想

张月光走之前的计划:把9块9变成99(加入human in the loop做定制化),以及杀到线下开快闪店。他将妙鸭定位为新消费品牌而非图像工具——"我压根跟美图就不在一桌,我是跟海马体一桌的。"

四、妙鸭不是AI Native产品

这是张月光在两年探索后得出的核心结论,也是本期访谈最重要的认知突破之一。

张月光
妙鸭不是一个AI Native的产品。它是一个把AI能力发挥得非常好的互联网产品。今天AI Native这个词都已经被念烂了,绝大部分的定义就是"没有这代AI技术就做不了"。我觉得这个不够——这是一个必要条件,不是一个充分条件。

AI Native产品的特征

开放性:用户输入和输出的不可穷举

  • 互联网20年的产品设计基本原则是面向流程:用户进来,推五个门,按五个钮,所有行为可预定义
  • 最强的互联网产品(如微信)像游乐园,可以自由走动但仍是"有限自由度"
  • AI Native产品的用户输入是完全开放的——"什么都有可能"
  • 到Agent时代,输出也变得开放
  • 这是互联网20年里所有产品从来没有出现过的情况

为什么妙鸭是互联网思维

妙鸭的流程完全写死:20张照片 -> 固定模型训练 -> 选模板 -> 固定工艺链生成。通过限制用户自由度来谋求更好更稳定的效果。这本质上仍然是互联网产品思维——在当时技术条件下是正确的选择,但不是AI Native。

互联网产品设计

  • 面向流程(Process-Oriented)
  • 有限自由度
  • 用户行为可穷举预定义
  • 产品经理->设计师->工程师线性协同
  • 限制自由度换取稳定效果

AI Native产品设计

  • 面向上下文(Context-Oriented)
  • 开放自由度
  • 用户行为不可穷举
  • 多工种混合、两段式协同
  • 先定义最佳context,再设计流程

五、从流程设计到上下文设计

张月光认为AI产品设计发生了一个范式变化——从面向流程变成面向上下文。他坦言"自己都花了很多时间才突破这个思维"。

范式变化

面向Context的产品设计

核心变化:当产品需要模型执行任务时,第一优先级变成了——"用户的输入,你怎么去给它带来它看不见的上下文?这些上下文在生成环节到底带来什么效果?什么是最佳context和最佳prompt的实践?"先有这个部分,再讨论流程和交互。

两段式工作模式

AI Native团队的协同方式

  • 第一阶段(混合探索):多工种混合,共同摸索模型的context和边界。决策边界变得模糊——产品经理需要碰模型,设计师需要理解技术,"什么是美的"需要多工种共同定义。
  • 第二阶段(分工执行):当大家清楚"模型用来干啥、需要用户给什么context"之后,再进行产品经理设计流程、设计师配合实现、工程师开发的分工。

张月光以自己做Docky(PPT Agent)的实践为例:团队一开始面向交互做产品,效果特别差;后来转为先打磨"最小生成单元"的效果——多工种协同定义什么是美的、怎么布局合理、怎么防止溢出——等效果调好了,自然知道需要用户给什么context,再去设计流程。

张月光
先不管产品交互长啥样,先去打磨最小生成单元那个部分。等这个效果调的非常明白了,你就知道用户在进入这个环节之前,你必须得把什么context给我。然后你再去设计流程。

组织的代差才是创业机会

张月光尖锐指出:"大厂难掉头、反应慢,这都是幻想。在大厂工作过很长时间的人就知道这是幻想。"真正的机会来自组织本身的代差——如果AI Native的组织协同方式与互联网时代有本质不同(线性变混合、确定变模糊),那就存在"不是完全的一个物种"的窗口期。

六、One Way Door:单向门产品理论

张月光提出的"单向门产品"(One Way Door)理论,是他筛选所有产品方向的核心标准。

产品理论

什么是单向门产品

用了这个产品,你就知道这个需求以后只会用这种东西解决。比如CursorClaude Code——用了之后你再也不会用以前的IDE。单向门产品的核心特征:即使今天用户很少,也一定会一天一天往上涨,因为获得一个用户就不会再轻易丢掉。

单向门 vs 非单向门产品的增长路径对比
张月光
创新不是创造新需求的,往往是为一个旧需求提供一个新解法。单向门产品的意思就是你这个新解法,比起旧解法,是一个全方位优势的解法。那你一定会赢的。最大的机会往往在这里——你看到了一个别人都还没看到的、其实会全面优势的单向门,去做。等到大家意识到它是个单向门的时候,你就已经赢了。

非单向门产品的痛苦

Wow but not One Way Door

  • 用户Wow完之后会退回去,无法完全取代以前的使用习惯
  • 需要不断循环做用户召回
  • 用了一阵子解决不了某个问题,用户还得用回原来的工具
  • 典型例子:张月光测试过的所有AI信息聚合产品——"真正有价值的信息,有人工已经整理了",有替代性解法

七、创业动机论:期望收益最大化

张月光对创业动机的分析极为理性,甚至有些冷酷。他将常见动机按"期望收益"排序。

创业动机期望收益分析
就想当老板极高(100%)创业第一天就成功了,哪怕公司不咋地也满足了诉求
特别想让一件事发生极高就算自己没实现、别人实现了也不算输。参与宏伟命题本身就有价值
想赚钱/发财大厂高管的期望收益更高
想证明自己/出名大厂做到高管其实也挺能证明自己
张月光
我第一次创业结束的时候之所以困惑,是因为出发的真实理由就是想证明自己。我觉得我很牛了,我要出名。你碰上一个下行周期,那个目标被否定了,但我当时也没有找到另一个动机。

从湖畔学到的三个必要条件

创业的三个必要条件(非使命愿景)

  • 行业选择:必须选定一个正确的、长期耕耘的行业
  • 团队文化:创始人的真实自我决定团队基因,没有绝对正确的文化
  • 商业模式:必须回答这个问题,否则很危险

张月光出发时前两个比较清晰,第三个(商业模式)花了近两年才找到。他从湖畔的导师那里得知:像马云那样"第一天就能提出使命愿景又有清晰路线图"的公司极为罕见,绝大部分成功公司的使命是在做的过程中慢慢刻画的。

组建团队的多样性原则

50%
大厂背景成员
50%
独立开发者+有调性的初创公司

张月光刻意避免"全都拉原来的同事"——同质化团队会产生思想趋同性,新加入的人也难以融入。他认为在AI时代,多元化的品位和博学的广度比单一技能更重要,因为"人的技能正在贬值"。

八、AI陪伴的三大行业通病与游戏解法

张月光对AI陪伴赛道有深入分析,这直接驱动了他选择做AI乙女游戏的决策。

AI陪伴赛道的事实基础

千万级
赛道DAU(国内+海外)
已打平
部分头部产品收支状况

结论:AI陪伴是一个带有商业价值的真实用户需求。既然已经是真实的,为什么没有彻底爆发?

三大行业通病

通病现象根因
用户门槛过高用户低龄化、小圈层、二次元为主纯对话框交互需要极大的想象力和表达能力,成年人不具备幼儿拿玩具比划一天的能力
商业模式差虽然能收到钱,但毛利率很差商业模式就是收token费用,token很难卖出高溢价
角色无法成长单角色长期留存差所有AI角色都是"死的"、不变的。聊十天就会发现这个人没有变化

游戏化的天然解法

三个问题 -> 三个解法

  • 降门槛:把UGC转成PGC,用户从全主动变为被动+主动。游戏天然有设定、美术、剧情等PGC物料投放,用户被动消费也能获得快乐
  • 自带商业模式:任何游戏类型背后都已有经过验证的商业模式,许多AI产品不能用的变现方式变成游戏后就可以用
  • 角色可成长:PGC的角色有背后团队不断更新驱动力,同一角色在不同用户生命周期可以呈现不同节奏

内测数据验证

AI乙女游戏"新年"第一次内测2000个用户名额,一天秒爆满。小红书官方账号当天1万粉。内测7天后留存和用户时长数据"非常惊人",相关话题百万阅读量以上。关服时所有用户守在手机前与男主角告别,声泪俱下。张月光表示:"AI陪伴用游戏化的方式做,这个猜想应该是没有猜错。"

九、乙女游戏的IP翘翘板效应

张月光对IP构建理论的分析是其乙女游戏策略的底层逻辑,也是为什么他认为现有乙女游戏不可能简单加个AI聊天

IP的四个要素

任何IP的构成

  • 内核:价值观和态度(如爱马仕的"老钱贵族"精神)
  • 表象一:视觉包装(长什么样,配色风格)
  • 表象二:作品表达(歌曲、电视剧、包、商品等)
  • 表象三:用户交互(如何与用户互动)
核心模型

IP的翘翘板效应

越贵的IP,一定要更低频次、更高质量的内容表达,但要降低用户交互频次。顶流大明星不会天天开直播、不会开小红书持续营业、不会做AI聊天——每次亮相都要很慎重,才能保障顶级IP的"贵"。反之,以互动性为优先的IP(如AKB48、直播主播)则追求高频接触但接受较低的内容品质。

IP的翘翘板:内容品质 vs 互动频次

为什么恋与深空不会加AI聊天

张月光
今天的乙女游戏全部都是造大明星的东西,单向给你输出内容。他们绝对不会在自己的游戏里把这些人做成可以AI聊天的。因为那就和你把王一博做了个AI聊天可以随便去聊是一样的——人设会崩。

张月光的结论:以AI互动为内核的乙女IP和以头部明星打造为核心的乙女IP,是两种东西,无法做在一个产品里。这就是AI初创公司的结构性机会——不是给现有游戏"加个功能",而是做一种全新类型的IP。

选择2D Live2D而非3D的理由

十、信息媒介理论与平台机会

张月光提出了一个关于内容平台演进的底层理论,用来回答"AI时代是否有新平台机会"这个核心问题。

底层规律

新媒介 + 新交互 = 新平台

新内容平台的机会来自于新的信息媒介和对应的新交互形式的配对。这是整个互联网20年没有人打破过的规律。

平台信息媒介交互形式
Twitter短文字(140字)Feed流
Instagram纯大图单列图流
小红书图文笔记(以图为主,文为辅)双列Feed流
抖音短视频全屏上下滑
ChatGPT实时生成的流式内容对话交互

Sora为什么不是新抖音

张月光的判断

"绝不可能。因为它没有新媒介,也没有新交互。它还是短视频,交互还是上下滑。加了个左右滑看衍生视频,和抖音里点特效看其他人用这个特效的视频没有本质区别。AI能产生大量新内容,但不能产生新平台——除非有新的媒介形式。"

ChatGPT一定是个平台

张月光明确判断ChatGPT是新平台——因为它定义了新的信息媒介(实时生成的流式内容)和新的交互形式(对话)。它已经有了双边网络效应:连接用户和背后的信息世界。

十一、ChatBot的终极商业模式:决策控制权

这是张月光在访谈中最具前瞻性和争议性的判断。

信息自主权的三级剥夺

  • 搜索时代:用户主动获取信息,拥有信息自主权
  • 短视频时代:推荐算法完全剥夺信息自主权,你不能决定自己看什么信息。商业价值巨大
  • ChatBot时代:可能剥夺自主决策权——用户习惯于什么决策都问大模型,最终放弃独立决策
张月光
ChatBot最终的商业模式,很有可能不是即时性的广告推送,而是可以预判你未来的重要有商业价值的决策,并且用比较长周期去操控你的决策。比如你要买什么房子、买什么车、让孩子上什么学——当你最终下那个决定的时候,是它早就预测好的。

字节的潜在闭环

张月光指出一个惊人的可能性:豆包目前是中国主导的ChatBot,如果字节同时掌握短视频(信息自主权)和ChatBot(决策自主权),"我不仅决定到你看什么,我还决定你怎么想。我可以轻易完全操控一个人。"这已超出商业范畴,进入社会变革的范畴。

Kill Time vs Save Time的终极判断

不看好:更强的Kill Time

  • 短视频可能已接近人脑能承受的上限
  • "短视频已经是海洛因"——更强的刺激会把客户"磕死"
  • 小红书的回潮证明用户需要一定的信息自主权
  • 大麻未必不如海洛因——但冰毒大概率不是更好的生意

不看好:信息分发的Save Time

  • 信息分发的商业模式建立在抢夺注意力之上
  • 为用户节省时间直接背离商业模式
  • 真正重要的信息已有人工整理(日报、早报等)
  • 但AI的生产力/能力突破方向的save time完全看好

十二、Agent的两个价值取向

张月光将当前Agent赛道分为两个截然不同的价值取向,并明确表示自己选择后者。

价值取向一:端到端替代

  • 核心故事:让AI替你做事、节省时间
  • 代表:Manus、各类自动化Agent
  • 指标:Token消耗量、离线执行时长
  • 终极方向:完全自动化、替代人工
  • 今天整个硅谷讲的都是这个故事

价值取向二:能力突破

  • 核心故事:让你做到本来做不到的事
  • 代表:Cursor、Lovable、张月光的Docky
  • 指标:Latency(越快越好)、协作迭代频次
  • 终极方向:人+AI持续协作,突破个人边界
  • "人应该负责Will(意图/意志),AI负责Skill"
张月光
如果真的有一天人就是没办法再参与社会生产了,我们还讨论创业、讨论商业就没什么意义。你先只能假定它不发生。而且我自己也不喜欢这样的事情——如果我是那个为这件事添砖添柴的人,我不是很开心。

人与AI关系的底层理念

核心理念

Human Will + AI Skill

张月光非常深刻相信的理念:人的技能正在贬值,但人的意图、意志(Will)——包括广度、多元性、品位——将成为核心竞争力。团队的核心竞争力不在于成员的技能深度,而在于"Will"的广度和品质。这也是他强调团队多样性的底层逻辑。

十三、Docky与PPT:后发者的竞争方法论

沐岩智语的Agent产品Docky以PPT切入,张月光坦承"都快成the last了"。但他的竞争逻辑完整自洽。

为什么选PPT

三层判断

  • 已PMF:所有人都在做,不需要回答What和Why,只需要回答How
  • 还没有单向门:测试了所有AI PPT产品——套模板派(内容被塞进模板)、前端代码派(改起来比从头做还难)、图像生成派(Napkin式,一眼看出是AI做的)——没有一个真正可以替代PowerPoint
  • 时机判断:2026年已进入技术采用的第三个周期(实用期),用户关心的是"你到底有什么用"而非"the first xxx"

三类AI PPT方案的对比

方案代表核心问题
套模板Kimi内容为了适配模板被扭曲,"不是跟着我的表达"
前端代码Manus等下载后二次编辑极其困难,"比自己从头做还难"
图像生成Napkin等可用度高但"一眼就知道这是Napkin做的",信息被大量省略
Docky自研Agent框架效果优先,多模型混用(Claude做tool call、Gemini画前端、GPT补特定能力)

与模型公司的竞争分析

为什么大模型公司不会做这件事

  • 大模型公司一定朝自动化方向做,想象力更大,定价也能突破工具限制
  • 深入具体任务需要大量纯工程工作(如HTML转PPTX保真),大模型公司不会干
  • 不同模型各有长板:Claude的tool call断档领先,Gemini前端审美更好,GPT在部分任务表现最优——模型公司不会混合竞品
  • 通用解法会随模型能力平均抬升,但具体任务上的"单向门体验"需要深耕

从PPT到"突破边界的朋友"

张月光
纯PPT这个事亏空了公司所有的钱我不愿意。但在"给我造一个突破我本人能力边界的朋友"这件事上亏光所有钱,我是可以认的。因为这个事一定会发生,就算不是我做成的,有人做成了,我也不觉得创业失败了。

Docky的定位是帮助用户创作和表达的Agent,PPT只是第一步。张月光判断这是一个可以独立存在的产品心智——"用户的日常表达和创作完全可以是一个独立产品",就像视频号再怎么做也很难成为短视频第一。

十四、启示与延伸思考

关于"语言就是智能的终点"

张月光
人们都在说今天的语言大模型就是在predict next token。你又怎么知道你现在说的话不是predict next token?你大脑可能就是这么运转的。你自以为很有逻辑,但实际上你不是先在脑海里形成了一套什么逻辑才把话说出来的——你是很自然地就把这个token predict出来的。

核心启示

启示一:AI产品存在"可用线"而非"好用线"

从妙鸭的"真像美"三模型串联到Docky的"效果优先"方法论,张月光始终在追求越过那条"90分=0分"的可用线。这对所有AI产品创业者的警示是:在没有越过可用线之前,所有的交互设计、增长策略、商业模式都是空谈。先让效果到位。

启示二:AI Native的组织代差是创业的真实窗口

大厂不慢、不蠢、不难掉头。创业者的机会不在于速度差或信息差,而在于从"线性协同"到"混合探索+分工执行"的两段式组织范式是否构成真正的物种差异。如果只是用互联网的组织方式做AI产品,本质上仍在大厂的延长线上竞争。

启示三:单向门理论是产品筛选的终极标准

张月光用两年时间、多个失败实验换来一个核心筛选器:如果一个产品不是单向门——用户用了还会退回旧解法——那就不值得all in。这比PMF更严格:一个产品可以有市场需求(PMF),但如果有替代性解法,就不是好的创业标的。

启示四:内容思维vs平台思维的周期切换

过去五年中国诞生的好公司——叠纸、游戏科学、饺子动画、泡泡玛特——都是内容公司而非平台公司。原因有二:平台所依赖的核心能力(推荐算法+用户增长+商业化闭环)是上一代霸主的武器库;而好内容在渠道充分连通的今天,自带传播力。在AI产生新的媒介和交互之前,内容思维可能仍是更好的创业路径。

延伸思考