火星财经消息,Prysm 团队发布主网事故复盘报告称,12 月 4 日以太坊主网 Fusaka 时段内,几乎所有 Prysm 信标节点在处理特定 attestations 时发生资源耗尽,导致无法及时响应验证者请求,引发区块与见证大量缺失。事故影响范围为 epoch 411439 至 411480,共 42 个 epoch,在 1344 个 slot 中缺失 248 个区块,缺失率约 18.5%;网络参与率一度降至 75%,验证者约损失 382 ETH 的见证奖励。根因在于 Prysm 接收到来自可能已与主网不同步节点的 attestations,这些 attestations 引用前一 epoch 的区块根。为验证其合法性,Prysm 反复回放旧 epoch 状态并执行高成本的 epoch transition,导致节点在高并发下触发资源耗尽。相关缺陷源自 Prysm PR 15965,早在一个月前已部署至测试网,但未触发相同场景。官方给出的临时解决方案是,在 v7.0 版本中启用 --disable-last-epoch-target 参数;随后发布的 v7.1 与 v7.1.0 已包含长期修复方案,通过使用 head state 验证 attestations,避免重复回放历史状态。Prysm 表示,问题在 12 月 4 日 UTC 4:45 后逐步缓解,至 epoch 411480 时网络参与率恢复至 95%以上。Prysm 团队指出,此次事件凸显客户端多样性的重要性,若单一客户端占比超过三分之一,可能导致短暂无法终局;超过三分之二则存在终局无效链的风险。同时也反思了功能开关沟通不清及测试环境未能模拟大规模不同步节点的问题,后续将改进测试策略与配置管理。