DataNet分钱前要先看license

企业买AI服务时，最怕的不是模型回答慢一点，而是账结完以后才发现里面混进了不能商用的数据。一个法律问答模型给客户生成合同意见，表面上用了某个DataNet里的判例样本，调用方付了36枚OPEN，贡献者也拿到了分账。过了两周，法务才发现其中一批样本只允许研究使用，不能进入收费回答。这个时候问题已经不是答案准不准，而是谁把不该分的钱分出去了。
DataNet分账不能只看样本有没有被命中。被命中只说明它影响了输出，不说明它有资格参与商业收益。license类型如果不进入影响权重，平台就会把合规问题包装成贡献问题。贡献者上传了一条有用但受限的数据，模型确实用到了它，可商业调用里的收益不应该直接流过去。
FineGrainedMetadataAttribution真正有价值的地方，就在这里。每条数据不只带领域，语言，来源和质量标签，还要带license标签和用途限制。开放许可，内部研究许可，非商业许可，地域限制许可，这些不是后台备注，而应该进入分账判断。模型调用发生时，系统先看用途，再看样本影响，最后才看谁能拿钱。
举个更细的账。用户付出36枚OPEN调用法律模型，其中22枚对应模型和检索服务，8枚准备拆给数据贡献者，4枚给验证者和记录节点，2枚进入争议准备金。如果贡献者A的数据影响权重是40%，但license只允许研究展示，系统就不能把3.2枚OPEN直接发给A。正确做法是先冻结这部分，标记license冲突，再让调用方，贡献者或验证者提交复核材料。
这不是为企业找借口少付钱。相反，分账越细，企业越敢付钱。企业愿意为合规数据付高价，不愿意为后续风险买单。同样是一条医疗资料，公开授权的指南，医院内部训练记录，脱敏程度不足的病例，三者对模型输出的帮助可能都很大，但商业分账资格完全不同。
OPEN在这里要做的是license过滤后的结算单位。调用方付OPEN买到的是一次合规可查的模型服务，不只是一个回答。贡献者收到OPEN，前提是metadata里的license允许当前用途。验证者收到OPEN，是因为它检查了标签和用途是否匹配。失败时，冲突部分先冻结，误标者承担复核成本，误冻结则退回复核费并补发分账。
最差的版本是平台只显示数据贡献者获得收益。外面看起来很公平，实际上一堆不可商用样本也在吃商业调用的钱。等版权方或数据方追责，平台只能解释当时模型确实受了影响，却说不清为什么收益能流出。这种账越跑越多，DataNet会从专业数据市场变成合规黑箱。
这套设计对贡献者也不是坏事。合规标签清楚以后，真正拥有高质量授权数据的人反而能涨价。一个英文开放许可判例样本，可能影响权重只有12%，但因为可商用，可审计，可跨地区使用，它的分账资格比一批来源模糊的高权重样本更稳定。
我会把这个点看成DataNet能不能进企业采购的门槛。没有license过滤，OPEN分账越自动，风险扩散越快。有了metadata，license，用途和冻结记录，分账才不是简单奖励上传者，而是在奖励能被合法使用的影响力。企业最后买的不是热闹的数据池，而是一张出事以后还能查清的结算账，也是一条能继续采购的安全边界。
@OpenLedger #OpenLedger $OPEN