← 返回张小珺主页
一、产品经理的十二年与鸭川决定
张月光(悦光)是一位有12年经验的产品经理,先后在孔明科技(SaaS)、支付宝、字节跳动、阿里巴巴(优酷)工作。2023年因妙鸭相机走红,同年10月在京都鸭川边做出人生重要决定。
张月光
我从夜里两点一直坐到凌晨五点,就拿了一罐啤酒在那儿坐着。那天想了很多事情,做了一些很重要的决定。
鸭川之夜的核心思考
即将35岁的张月光回顾过去十几年,发现自己最不满意的是"没有长坡厚雪"——不管是人还是事都没有积累。做过资金产品、红包、相册工具、图像工具、社交、短视频、长视频、AI图像,品类繁杂却缺乏连续性。
人生原则
35到45岁的Flag
张月光给自己定了一个原则:35岁到45岁,跟同一群人,做同一件事情。这个原则的威力在于"让你做决策的时候不用想了"——给他再升P10、涨薪或奖金,都不在讨论范围内,因为大厂无法满足"十年同一群人同一件事"的要求。
2012年 孔明科技
社交媒体管理SaaS工具,帮助用户批量管理微博内容。
2014-2016年 支付宝
做转账等资金类产品,"没有什么想法,老板让干什么就干什么"。
2016-2018年 字节跳动
先做图形图像部门(时光相册),后调到今日头条大团队,发起春节红包项目和字节小程序平台。
2018-2020年 第一次创业
做Live2D社交产品"原音",高峰近10万DAU,最终因低龄化和商业模式问题关停,回到阿里。
2020-2023年 阿里(优酷)
管理近300人团队。发现长视频本质是内容业务而非互联网业务后,将精力转向AI图像创新,孵化妙鸭。
2023年10月 鸭川决定
国庆假期在京都做出创业决定。双十一正式离职。
2024年初 创立沐岩智语
累计融资近三亿元,开始AI游戏和AI应用双线探索。
去字节做AI而非做今日头条
张月光2016年加入字节的真实动机是做视觉AI(CV),而非今日头条。当时正值视觉四小龙兴起,但四小龙做2B,张月光想找做C端的AI公司,最终找到字节的图形图像部门。他坦言"一天今日头条的产品都没做过"。
二、大厂的内部游戏与外部游戏
张月光提出了大厂晋升的两种路径,这也解释了他为什么最终选择离开。
外部游戏
- 通过战胜外部敌人来打怪升级
- 在某个战役中赢了,明确是你打的
- 需要增量周期(行业有新机会)
- 不确定性更高,但创造价值真实
内部游戏
- 不需要真的打赢外部敌人
- 只要在361考核中永远是那个"3"
- 不需要周期,任何时候都可以玩
- 大厂体系的"地心引力"让人难免转向内部作战
张月光
外部游戏一定是更难的。但从抖音之后,互联网很久没有出现过那种真正意义上能够改变很多事情的产品。没有增量,大家就很难免会变成内部游戏。今天AI的诞生,又提供了外部游戏的机会。
为什么长视频不是互联网业务
张月光在优酷的核心认知:"长视频本质是个内容业务,甚至你可以把它超向成投资业务。"一个片子拍得好就播得好,从产品技术上不可能用任何手段去辅助。他甚至认为加推荐算法"很有可能是负向的"。这个认知让他决定不再参与优酷的日常会议,将精力转向AI创新。
关于绩效的诚实回答
当被问到怎么给团队打绩效时,张月光的回答极为坦率:"大家都没有什么特别实质的结果。如果大家都没有特别实质的结果,这个绩效更多是过程驱动。"这也折射出在缺乏增量的环境中,产品技术团队面临的困境。
三、妙鸭:90分等于零分的产品哲学
妙鸭相机在2023年7月爆红,三个月内实现大几百万付费用户(超过海马体全年客户量),日收入突破百万级。但张月光强调,这个产品的成功建立在几个"简单而常识性的判断"之上。
四个关键决策
选技术:Diffusion Based Model
在ChatGPT最火的时期,团队判断只有图像技术相对成熟,周边生态开发比较好。
选方向:写实人像
基于"人的照片占手机相册76%"的数据洞察,选择做写实人像而非通用图像生成。
选模式:To C写真而非电商图
团队本能是做淘宝模特图,但张月光判断电商链条太长、缺乏溢价权。选择写真这个可以"端到端定价"的消费品。
选标准:真、像、美
三个模型串联解决:底层模型负责"真"(训练大量普通人照片)、用户20张照片训练的模型负责"像"(ID保持)、模板模型负责"美"。
核心理念
90分等于零分
张月光的产品哲学:AI产品存在一条关键的可用线。90分时,人一眼就看出来这是AI,价值仍然非常受限。但一旦越过100分的线——没人看出来是AI做的——成本的巨大优势就会显现。"你即使成本再低,越过那条线之前,价值仍然非常受限。"这一哲学贯穿他后续所有产品决策。
张月光
很多用户去对比,他自己在海马体真的拍过,拿妙鸭做了一个同样风格的。很多人都觉得妙鸭做的更好看、更像他。因为海马体也是会给你精修的,很多时候修的都面目全非了。
妙鸭的后续构想
张月光走之前的计划:把9块9变成99(加入human in the loop做定制化),以及杀到线下开快闪店。他将妙鸭定位为新消费品牌而非图像工具——"我压根跟美图就不在一桌,我是跟海马体一桌的。"
四、妙鸭不是AI Native产品
这是张月光在两年探索后得出的核心结论,也是本期访谈最重要的认知突破之一。
张月光
妙鸭不是一个AI Native的产品。它是一个把AI能力发挥得非常好的互联网产品。今天AI Native这个词都已经被念烂了,绝大部分的定义就是"没有这代AI技术就做不了"。我觉得这个不够——这是一个必要条件,不是一个充分条件。
AI Native产品的特征
开放性:用户输入和输出的不可穷举
- 互联网20年的产品设计基本原则是面向流程:用户进来,推五个门,按五个钮,所有行为可预定义
- 最强的互联网产品(如微信)像游乐园,可以自由走动但仍是"有限自由度"
- AI Native产品的用户输入是完全开放的——"什么都有可能"
- 到Agent时代,输出也变得开放
- 这是互联网20年里所有产品从来没有出现过的情况
为什么妙鸭是互联网思维
妙鸭的流程完全写死:20张照片 -> 固定模型训练 -> 选模板 -> 固定工艺链生成。通过限制用户自由度来谋求更好更稳定的效果。这本质上仍然是互联网产品思维——在当时技术条件下是正确的选择,但不是AI Native。
互联网产品设计
- 面向流程(Process-Oriented)
- 有限自由度
- 用户行为可穷举预定义
- 产品经理->设计师->工程师线性协同
- 限制自由度换取稳定效果
AI Native产品设计
- 面向上下文(Context-Oriented)
- 开放自由度
- 用户行为不可穷举
- 多工种混合、两段式协同
- 先定义最佳context,再设计流程
五、从流程设计到上下文设计
张月光认为AI产品设计发生了一个范式变化——从面向流程变成面向上下文。他坦言"自己都花了很多时间才突破这个思维"。
范式变化
面向Context的产品设计
核心变化:当产品需要模型执行任务时,第一优先级变成了——"用户的输入,你怎么去给它带来它看不见的上下文?这些上下文在生成环节到底带来什么效果?什么是最佳context和最佳prompt的实践?"先有这个部分,再讨论流程和交互。
两段式工作模式
AI Native团队的协同方式
- 第一阶段(混合探索):多工种混合,共同摸索模型的context和边界。决策边界变得模糊——产品经理需要碰模型,设计师需要理解技术,"什么是美的"需要多工种共同定义。
- 第二阶段(分工执行):当大家清楚"模型用来干啥、需要用户给什么context"之后,再进行产品经理设计流程、设计师配合实现、工程师开发的分工。
张月光以自己做Docky(PPT Agent)的实践为例:团队一开始面向交互做产品,效果特别差;后来转为先打磨"最小生成单元"的效果——多工种协同定义什么是美的、怎么布局合理、怎么防止溢出——等效果调好了,自然知道需要用户给什么context,再去设计流程。
张月光
先不管产品交互长啥样,先去打磨最小生成单元那个部分。等这个效果调的非常明白了,你就知道用户在进入这个环节之前,你必须得把什么context给我。然后你再去设计流程。
组织的代差才是创业机会
张月光尖锐指出:"大厂难掉头、反应慢,这都是幻想。在大厂工作过很长时间的人就知道这是幻想。"真正的机会来自组织本身的代差——如果AI Native的组织协同方式与互联网时代有本质不同(线性变混合、确定变模糊),那就存在"不是完全的一个物种"的窗口期。
六、One Way Door:单向门产品理论
张月光提出的"单向门产品"(One Way Door)理论,是他筛选所有产品方向的核心标准。
产品理论
什么是单向门产品
用了这个产品,你就知道这个需求以后只会用这种东西解决。比如Cursor或Claude Code——用了之后你再也不会用以前的IDE。单向门产品的核心特征:即使今天用户很少,也一定会一天一天往上涨,因为获得一个用户就不会再轻易丢掉。
张月光
创新不是创造新需求的,往往是为一个旧需求提供一个新解法。单向门产品的意思就是你这个新解法,比起旧解法,是一个全方位优势的解法。那你一定会赢的。最大的机会往往在这里——你看到了一个别人都还没看到的、其实会全面优势的单向门,去做。等到大家意识到它是个单向门的时候,你就已经赢了。
非单向门产品的痛苦
Wow but not One Way Door
- 用户Wow完之后会退回去,无法完全取代以前的使用习惯
- 需要不断循环做用户召回
- 用了一阵子解决不了某个问题,用户还得用回原来的工具
- 典型例子:张月光测试过的所有AI信息聚合产品——"真正有价值的信息,有人工已经整理了",有替代性解法
七、创业动机论:期望收益最大化
张月光对创业动机的分析极为理性,甚至有些冷酷。他将常见动机按"期望收益"排序。
| 创业动机 | 期望收益 | 分析 |
| 就想当老板 | 极高(100%) | 创业第一天就成功了,哪怕公司不咋地也满足了诉求 |
| 特别想让一件事发生 | 极高 | 就算自己没实现、别人实现了也不算输。参与宏伟命题本身就有价值 |
| 想赚钱/发财 | 差 | 大厂高管的期望收益更高 |
| 想证明自己/出名 | 差 | 大厂做到高管其实也挺能证明自己 |
张月光
我第一次创业结束的时候之所以困惑,是因为出发的真实理由就是想证明自己。我觉得我很牛了,我要出名。你碰上一个下行周期,那个目标被否定了,但我当时也没有找到另一个动机。
从湖畔学到的三个必要条件
创业的三个必要条件(非使命愿景)
- 行业选择:必须选定一个正确的、长期耕耘的行业
- 团队文化:创始人的真实自我决定团队基因,没有绝对正确的文化
- 商业模式:必须回答这个问题,否则很危险
张月光出发时前两个比较清晰,第三个(商业模式)花了近两年才找到。他从湖畔的导师那里得知:像马云那样"第一天就能提出使命愿景又有清晰路线图"的公司极为罕见,绝大部分成功公司的使命是在做的过程中慢慢刻画的。
组建团队的多样性原则
张月光刻意避免"全都拉原来的同事"——同质化团队会产生思想趋同性,新加入的人也难以融入。他认为在AI时代,多元化的品位和博学的广度比单一技能更重要,因为"人的技能正在贬值"。
八、AI陪伴的三大行业通病与游戏解法
张月光对AI陪伴赛道有深入分析,这直接驱动了他选择做AI乙女游戏的决策。
AI陪伴赛道的事实基础
结论:AI陪伴是一个带有商业价值的真实用户需求。既然已经是真实的,为什么没有彻底爆发?
三大行业通病
| 通病 | 现象 | 根因 |
| 用户门槛过高 | 用户低龄化、小圈层、二次元为主 | 纯对话框交互需要极大的想象力和表达能力,成年人不具备幼儿拿玩具比划一天的能力 |
| 商业模式差 | 虽然能收到钱,但毛利率很差 | 商业模式就是收token费用,token很难卖出高溢价 |
| 角色无法成长 | 单角色长期留存差 | 所有AI角色都是"死的"、不变的。聊十天就会发现这个人没有变化 |
游戏化的天然解法
三个问题 -> 三个解法
- 降门槛:把UGC转成PGC,用户从全主动变为被动+主动。游戏天然有设定、美术、剧情等PGC物料投放,用户被动消费也能获得快乐
- 自带商业模式:任何游戏类型背后都已有经过验证的商业模式,许多AI产品不能用的变现方式变成游戏后就可以用
- 角色可成长:PGC的角色有背后团队不断更新驱动力,同一角色在不同用户生命周期可以呈现不同节奏
内测数据验证
AI乙女游戏"新年"第一次内测2000个用户名额,一天秒爆满。小红书官方账号当天1万粉。内测7天后留存和用户时长数据"非常惊人",相关话题百万阅读量以上。关服时所有用户守在手机前与男主角告别,声泪俱下。张月光表示:"AI陪伴用游戏化的方式做,这个猜想应该是没有猜错。"
九、乙女游戏的IP翘翘板效应
张月光对IP构建理论的分析是其乙女游戏策略的底层逻辑,也是为什么他认为现有乙女游戏不可能简单加个AI聊天。
IP的四个要素
任何IP的构成
- 内核:价值观和态度(如爱马仕的"老钱贵族"精神)
- 表象一:视觉包装(长什么样,配色风格)
- 表象二:作品表达(歌曲、电视剧、包、商品等)
- 表象三:用户交互(如何与用户互动)
核心模型
IP的翘翘板效应
越贵的IP,一定要更低频次、更高质量的内容表达,但要降低用户交互频次。顶流大明星不会天天开直播、不会开小红书持续营业、不会做AI聊天——每次亮相都要很慎重,才能保障顶级IP的"贵"。反之,以互动性为优先的IP(如AKB48、直播主播)则追求高频接触但接受较低的内容品质。
为什么恋与深空不会加AI聊天
张月光
今天的乙女游戏全部都是造大明星的东西,单向给你输出内容。他们绝对不会在自己的游戏里把这些人做成可以AI聊天的。因为那就和你把王一博做了个AI聊天可以随便去聊是一样的——人设会崩。
张月光的结论:以AI互动为内核的乙女IP和以头部明星打造为核心的乙女IP,是两种东西,无法做在一个产品里。这就是AI初创公司的结构性机会——不是给现有游戏"加个功能",而是做一种全新类型的IP。
选择2D Live2D而非3D的理由
- 目标用户是更二次元的用户,而非被恋与深空3D破圈拉入的三次元用户
- 二次元用户天然更追求"可得感和互动感"
- 来自2019年第一次创业(原音)的情怀延续
- 控制成本和变量——AI游戏本身就是新事物,不能同时在内容成本上冒险
十、信息媒介理论与平台机会
张月光提出了一个关于内容平台演进的底层理论,用来回答"AI时代是否有新平台机会"这个核心问题。
底层规律
新媒介 + 新交互 = 新平台
新内容平台的机会只来自于新的信息媒介和对应的新交互形式的配对。这是整个互联网20年没有人打破过的规律。
| 平台 | 信息媒介 | 交互形式 |
| Twitter | 短文字(140字) | Feed流 |
| Instagram | 纯大图 | 单列图流 |
| 小红书 | 图文笔记(以图为主,文为辅) | 双列Feed流 |
| 抖音 | 短视频 | 全屏上下滑 |
| ChatGPT | 实时生成的流式内容 | 对话交互 |
张月光的判断
"绝不可能。因为它没有新媒介,也没有新交互。它还是短视频,交互还是上下滑。加了个左右滑看衍生视频,和抖音里点特效看其他人用这个特效的视频没有本质区别。AI能产生大量新内容,但不能产生新平台——除非有新的媒介形式。"
ChatGPT一定是个平台
张月光明确判断ChatGPT是新平台——因为它定义了新的信息媒介(实时生成的流式内容)和新的交互形式(对话)。它已经有了双边网络效应:连接用户和背后的信息世界。
十一、ChatBot的终极商业模式:决策控制权
这是张月光在访谈中最具前瞻性和争议性的判断。
信息自主权的三级剥夺
- 搜索时代:用户主动获取信息,拥有信息自主权
- 短视频时代:推荐算法完全剥夺信息自主权,你不能决定自己看什么信息。商业价值巨大
- ChatBot时代:可能剥夺自主决策权——用户习惯于什么决策都问大模型,最终放弃独立决策
张月光
ChatBot最终的商业模式,很有可能不是即时性的广告推送,而是可以预判你未来的重要有商业价值的决策,并且用比较长周期去操控你的决策。比如你要买什么房子、买什么车、让孩子上什么学——当你最终下那个决定的时候,是它早就预测好的。
字节的潜在闭环
张月光指出一个惊人的可能性:豆包目前是中国主导的ChatBot,如果字节同时掌握短视频(信息自主权)和ChatBot(决策自主权),"我不仅决定到你看什么,我还决定你怎么想。我可以轻易完全操控一个人。"这已超出商业范畴,进入社会变革的范畴。
Kill Time vs Save Time的终极判断
不看好:更强的Kill Time
- 短视频可能已接近人脑能承受的上限
- "短视频已经是海洛因"——更强的刺激会把客户"磕死"
- 小红书的回潮证明用户需要一定的信息自主权
- 大麻未必不如海洛因——但冰毒大概率不是更好的生意
不看好:信息分发的Save Time
- 信息分发的商业模式建立在抢夺注意力之上
- 为用户节省时间直接背离商业模式
- 真正重要的信息已有人工整理(日报、早报等)
- 但AI的生产力/能力突破方向的save time完全看好
十二、Agent的两个价值取向
张月光将当前Agent赛道分为两个截然不同的价值取向,并明确表示自己选择后者。
价值取向一:端到端替代
- 核心故事:让AI替你做事、节省时间
- 代表:Manus、各类自动化Agent
- 指标:Token消耗量、离线执行时长
- 终极方向:完全自动化、替代人工
- 今天整个硅谷讲的都是这个故事
价值取向二:能力突破
- 核心故事:让你做到本来做不到的事
- 代表:Cursor、Lovable、张月光的Docky
- 指标:Latency(越快越好)、协作迭代频次
- 终极方向:人+AI持续协作,突破个人边界
- "人应该负责Will(意图/意志),AI负责Skill"
张月光
如果真的有一天人就是没办法再参与社会生产了,我们还讨论创业、讨论商业就没什么意义。你先只能假定它不发生。而且我自己也不喜欢这样的事情——如果我是那个为这件事添砖添柴的人,我不是很开心。
人与AI关系的底层理念
核心理念
Human Will + AI Skill
张月光非常深刻相信的理念:人的技能正在贬值,但人的意图、意志(Will)——包括广度、多元性、品位——将成为核心竞争力。团队的核心竞争力不在于成员的技能深度,而在于"Will"的广度和品质。这也是他强调团队多样性的底层逻辑。
十三、Docky与PPT:后发者的竞争方法论
沐岩智语的Agent产品Docky以PPT切入,张月光坦承"都快成the last了"。但他的竞争逻辑完整自洽。
为什么选PPT
三层判断
- 已PMF:所有人都在做,不需要回答What和Why,只需要回答How
- 还没有单向门:测试了所有AI PPT产品——套模板派(内容被塞进模板)、前端代码派(改起来比从头做还难)、图像生成派(Napkin式,一眼看出是AI做的)——没有一个真正可以替代PowerPoint
- 时机判断:2026年已进入技术采用的第三个周期(实用期),用户关心的是"你到底有什么用"而非"the first xxx"
三类AI PPT方案的对比
| 方案 | 代表 | 核心问题 |
| 套模板 | Kimi等 | 内容为了适配模板被扭曲,"不是跟着我的表达" |
| 前端代码 | Manus等 | 下载后二次编辑极其困难,"比自己从头做还难" |
| 图像生成 | Napkin等 | 可用度高但"一眼就知道这是Napkin做的",信息被大量省略 |
| Docky | 自研Agent框架 | 效果优先,多模型混用(Claude做tool call、Gemini画前端、GPT补特定能力) |
与模型公司的竞争分析
为什么大模型公司不会做这件事
- 大模型公司一定朝自动化方向做,想象力更大,定价也能突破工具限制
- 深入具体任务需要大量纯工程工作(如HTML转PPTX保真),大模型公司不会干
- 不同模型各有长板:Claude的tool call断档领先,Gemini前端审美更好,GPT在部分任务表现最优——模型公司不会混合竞品
- 通用解法会随模型能力平均抬升,但具体任务上的"单向门体验"需要深耕
从PPT到"突破边界的朋友"
张月光
纯PPT这个事亏空了公司所有的钱我不愿意。但在"给我造一个突破我本人能力边界的朋友"这件事上亏光所有钱,我是可以认的。因为这个事一定会发生,就算不是我做成的,有人做成了,我也不觉得创业失败了。
Docky的定位是帮助用户创作和表达的Agent,PPT只是第一步。张月光判断这是一个可以独立存在的产品心智——"用户的日常表达和创作完全可以是一个独立产品",就像视频号再怎么做也很难成为短视频第一。
十四、启示与延伸思考
关于"语言就是智能的终点"
张月光
人们都在说今天的语言大模型就是在predict next token。你又怎么知道你现在说的话不是predict next token?你大脑可能就是这么运转的。你自以为很有逻辑,但实际上你不是先在脑海里形成了一套什么逻辑才把话说出来的——你是很自然地就把这个token predict出来的。
核心启示
启示一:AI产品存在"可用线"而非"好用线"
从妙鸭的"真像美"三模型串联到Docky的"效果优先"方法论,张月光始终在追求越过那条"90分=0分"的可用线。这对所有AI产品创业者的警示是:在没有越过可用线之前,所有的交互设计、增长策略、商业模式都是空谈。先让效果到位。
启示二:AI Native的组织代差是创业的真实窗口
大厂不慢、不蠢、不难掉头。创业者的机会不在于速度差或信息差,而在于从"线性协同"到"混合探索+分工执行"的两段式组织范式是否构成真正的物种差异。如果只是用互联网的组织方式做AI产品,本质上仍在大厂的延长线上竞争。
启示三:单向门理论是产品筛选的终极标准
张月光用两年时间、多个失败实验换来一个核心筛选器:如果一个产品不是单向门——用户用了还会退回旧解法——那就不值得all in。这比PMF更严格:一个产品可以有市场需求(PMF),但如果有替代性解法,就不是好的创业标的。
启示四:内容思维vs平台思维的周期切换
过去五年中国诞生的好公司——叠纸、游戏科学、饺子动画、泡泡玛特——都是内容公司而非平台公司。原因有二:平台所依赖的核心能力(推荐算法+用户增长+商业化闭环)是上一代霸主的武器库;而好内容在渠道充分连通的今天,自带传播力。在AI产生新的媒介和交互之前,内容思维可能仍是更好的创业路径。
延伸思考
- 上下文设计的系统化:张月光描述的"面向context的产品设计"目前更多是直觉和实践,尚未形成可复制的方法论。如何让"先调效果、再定流程"这套两段式方法变得可教、可规模化,是AI产品行业的重要命题。
- Will的量化与培养:"Human Will + AI Skill"的框架暗示了一个深层问题——Will能被培养吗?如果AI接管了所有Skill,那些从未有机会通过Skill积累形成Will的年轻人,将如何发展他们的意图和品位?
- AI游戏的天花板:张月光坦言AI游戏目前"真的太窄了",只能做AI乙女游戏。斯坦福小镇两年后仍无法落地,AI互动影游100轮后变得无聊。这个天花板是技术问题还是范式问题?
- 决策控制权的伦理边界:如果ChatBot真的可以通过长周期操控用户的重大决策(买房、买车、教育),这将引发远超广告伦理的社会问题。这个商业模式即使技术可行,社会是否应该允许?