这两周刷到关于 Stacked 的讨论特别密集,尤其那句“AI game economist(AI 游戏经济学家)”很容易被当成营销词。说实话我一开始也有点不信:Web3 游戏里最不缺的就是“我们也有 AI”。但我后来换了个视角去看:如果 Stacked 真的不是“随机空投式奖励”,而是把 LiveOps 里最贵、最难、最容易被薅穿的一块——“给谁、给多少、什么时候给、给完会不会更留存更付费”——做成一个可复用的系统,那它就不是噱头,而是一种把 P2E 从玄学拉回工程学的尝试。因为绝大多数 P2E 的死法不是“没人来玩”,是“来的人不是玩家,是工厂”,奖励越发越快崩。

我先把我愿意相信它的前提摆出来:Stacked 不是从 PPT 里长出来的,它更像 Pixels 在自己游戏里被逼出来的内生系统。官方/社区反复强调“built from everything we learned scaling Pixels”,而且叙事里有几个硬锚点——已经处理了 200M+ rewards、在 Pixels 生态里贡献了 25M+ revenue、覆盖 millions of players,甚至有人直接提到 Pixels 生态跨过 1M DAU 的量级(这些说法在近期多篇讨论里出现得很一致)。

我不想把这些数字当成“结论”,我更想把它们当成“门槛”:如果没有真实规模,AI 经济学家这件事就很难成立,因为没有足够多样的行为数据、没有足够多的实验次数,就做不出可靠的 uplift(提升)评估,只能停留在“感觉上更好”。

那问题就变成:AI 经济学家在 LiveOps 里到底干什么?我用最“工程”的方式拆一下它的职责,不讲玄学。传统 LiveOps 做奖励,有三件事最费钱也最费人:第一是分群(cohort)和识别关键人群,第二是设计奖励策略并快速迭代,第三是验证这个策略到底有没有把留存、付费、LTV 拉起来。Web2 大厂当然也做这些,但工具链是分散的:分析在分析平台、投放在运营后台、反作弊在风控系统、归因在广告平台,最后运营同学拿着一堆互相打架的数据拍板。Web3 更惨,因为你还要对抗 Sybil、脚本、工作室,奖励一旦“按动作给”,动作就会被工业化复制。

Stacked 的核心说法其实就一句:奖励不是福利,是干预(intervention)。AI 经济学家要做的不是“算个最优奖励”,而是像经济学里的政策工具一样,对特定人群在特定时间点做最小成本干预,让他们多留一天、多完成一次关键行为、多发生一次付费或贡献。近期不少帖子把它描述成“decides who should be rewarded, when, and why”,我理解这句话的重点不在“决定”,而在“why”——它需要把奖励和可解释的目标绑定,比如提升 D7 留存、降低流失风险、提升复购、提高任务完成率,而不是“大家都有份”。

如果你把它当成一个黑盒 AI,那你会误解;更像的形态是:上层有一个推荐/策略引擎(AI economist),底层是一整套可执行的 LiveOps 组件。它至少需要四类输入:玩家分层数据(新手/回流/高价值/沉默边缘)、行为轨迹(完成任务路径、经济循环路径)、反作弊与风险信号(异常频率、设备/地址/行为相似度等)、以及“奖励成本”约束(代币/道具/现金券/积分等的边际成本)。它输出的不是“给 10 个币”,而是一组可落地的运营动作:发放哪种奖励、触发条件是什么、持续多久、配套任务怎么设计、是否需要分层限额、以及如何避免被脚本薅。你可以把它当成“把运营活动当成实验”的自动化执行器。

这里我觉得最有价值的一点,是它把“实验”当成默认语言。X 上 Pixels 官方最近也提到“thousands of experiments across live game systems”,这个表述我挺敏感的,因为它暗示 Stacked 的核心能力不是一次做对,而是持续做 A/B、做多变量测试、做长期追踪,直到找到稳定有效的激励曲线。

说白了,Web3 游戏最缺的不是“会发奖励”,而是“会算账”。奖励如果不能被量化成 ROI(哪怕是行为 ROI),那就是把经济系统当焚化炉。一个真正的 AI 经济学家应该能回答非常具体的问题:给“快流失的人群”发一次定向奖励,D1/D7 留存提升多少?对“高价值但最近沉默”的人群,给他们一个任务链而不是直接发放,会不会更有效?奖励从 token 换成“可解锁的体验权益”,对复购曲线有何影响?这些不是概念,是真正的 LiveOps 日常。

我甚至觉得,AI 经济学家最该做的一件事,是把“玩家价值”从“钱包大小”里拆出来。很多人一提 LTV 就直接等同付费,但在 Pixels 这种偏社区、偏经济循环、偏内容产出的生态里,非付费玩家也可能带来价值:提供流动性、提供交易深度、提供社交内容、带动新用户、甚至只是让世界看起来“活着”。如果 AI 只盯着付费,那它会把生态优化成“鲸鱼乐园”;如果它能把价值拆成多维指标(贡献型、传播型、社交型、内容型、交易型),那奖励就可以不再是“给钱”,而是“给任务、给身份、给解锁、给成长加速”,最后把钱留给真正会转化的环节。这样才符合“rewarded LiveOps engine”的定位:奖励是引擎燃料,不是撒币。

但我也必须泼点冷水,不然就太像宣传了。AI 经济学家这套东西,最难的不是模型,而是测量。最近我看到一个观点说得很尖锐:Stacked 对“LTV improvement”的测量如果是真的,那它会给工作室一条“从干预到 LTV 的直线”;如果测不准,就会变成“优化幻觉”。我同意这个担忧,因为 LiveOps 里最常见的坑是:短期指标很好看(比如任务完成率、次日留存),长期却把付费意愿透支了,或者把经济通胀做爆了。

所以我判断 Stacked 成败的关键指标,不是它能不能发奖励,而是它能不能做到三件“反直觉但必须”的事:第一,敢不敢对某些人“不发”,第二,能不能证明“不发反而更健康”,第三,能不能在反作弊压力下依然保持实验的可信度。你想想,脚本会主动配合你的实验吗?不会。它会盯着你的激励规则,把它变成生产线。那你做出来的 uplift 可能只是在奖励脚本更熟练,而不是奖励玩家更留存。

这就引出另一个我在意的点:反作弊不是“附属功能”,而是 AI 经济学家的地基。没有风控,所有分群都不可信;没有可信分群,所有实验都不可信;实验不可信,AI 就只能输出漂亮但错误的建议。所以我反而更愿意把 Stacked 看成“反作弊 + 归因 + 实验平台 + LiveOps 执行”的组合体,上层的 AI 只是把这些能力串成一条更短的闭环。社区也提到它对 studios 侧会提供 fraud control、attribution 等能力,我觉得这是对的方向。

Web3 过去那种“按链上动作发奖励”的粗暴玩法,本质是把风控外包给市场,最后市场告诉你:全是羊毛。现在如果有人试图把风控拉回系统里,把奖励做成“可控变量”,这条路虽然难,但至少是正路。

我再把“热点”这件事落到更现实的语境里:最近外面又在说“Web3 游戏死了”“P2E 就是庞氏”。我不否认很多项目确实像,但我也觉得这种结论太偷懒。真正的问题是激励机制不具备可持续性,奖励没有和长期价值绑定。你要么奖励错误行为(最会刷的人赚最多),要么奖励无法验证(发完不知道有没有用),要么奖励不可控(被脚本规模化复制)。所以当有人用“AI 经济学家”这个词,我宁愿把它理解为:把奖励从“口号”变成“科学管理”,把 LiveOps 从“灵感驱动”变成“实验驱动”。近期 Binance Square 上围绕“奖励应该精准而不是随机”的讨论其实就在讲这个矛盾。

当然,这不保证一定成功,但至少它在回答一个真实存在的问题,而不是凭空造概念。

最后说一点我个人的、但我会控制在“点到为止”的态度:如果 Stacked 真能在多个游戏、多个经济结构里复用,并且还能保持反作弊强度和实验可信度,那 PIXEL 的角色确实可能不再只是“单一游戏代币”,而更像生态奖励层的燃料或忠诚度货币的一部分(注意我说的是“角色可能扩大”,不是价格承诺)。但我不会因为这句话就上头,因为我更想看到的是:它能不能持续公开一些可验证的东西,比如更多关于实验次数、留存提升区间、不同人群策略差异、以及对抗脚本后的策略调整。这些才是“AI 经济学家”四个字能不能站住的证据。

@Pixels $PIXEL #pixel