📝Il tuo codice è stato “copiato” dall'AI, e nemmeno un nome è rimasto?

Crypto无雪 · 2026-05-22T18:01:48.000Z

Qualche giorno fa ho visto un post davvero toccante: un sviluppatore indipendente ha scoperto che quel pezzo di codice poco conosciuto che aveva open-source su GitHub è stato “imitato” da un modello di AI, generando funzioni che avevano addirittura gli stessi commenti errati che lui aveva scritto anni fa. Ha provato a far valere i suoi diritti, ma ha scoperto che non c'era modo di dimostrare che l'AI avesse usato il suo codice—i dati di addestramento sono una black box, il processo di inferenza non lascia tracce, e non c'è nemmeno un posto dove contestare. In realtà, non è un caso isolato. Senza neve ha notato che, dall'anno scorso, i tribunali di tutto il mondo hanno visto un aumento esponenziale delle denunce per copyright legate all'AI. Il problema centrale non è se l'AI “può imparare”, ma che, una volta imparato, non lascia alcuna traccia—chi ha contribuito, quanto ha contribuito, e quanto spetta a ciascuno, tutto dipende da quello che dicono le grandi aziende.

前几天刷到一个挺扎心的帖子：一个独立开发者发现，自己开源在GitHub上的那段冷门代码，被某个AI模型原封不动地“学”走了，生成出来的函数连当年写错的注释都一模一样。他想维权，结果发现根本没法证明“AI用过他的代码”——训练数据是黑盒，推理过程不留痕，连找个对质的地方都没有。
这其实不是个例。无雪注意到，从去年开始，全球各地法院接到的AI版权投诉翻了好几倍。问题的核心不是AI“能不能学”，而是学了之后完全不留痕迹——谁贡献了、贡献了多少、该分多少钱，全凭大公司一张嘴说了算。
那有没有办法让AI的每一次“学习”都留下可查的脚印？无雪最近在看 @OpenLedger  这个项目，它搞了一套很有意思的底层机制叫“模块化数据层”。你把它想象成一个透明的加工流水线：原始数据进来，先验证来源是否合规，再打上贡献者的数字指纹，然后分步骤清洗、标注、切分，每一步都实时上链存证。到最后拿去训练的时候，模型“吃”的每一口数据都能追溯到最开始是谁提供的。
这套东西最牛的地方在于，它不是事后去“追责”，而是从源头就把“贡献即记账”变成了一种默认规则。在这个框架下，原生代币 $OPEN  就相当于流水线上的“燃料”和“工资”——调用高质量数据集需要消耗 $OPEN ，而贡献数据、跑验证节点的人则赚取 OPEN。
这就形成了一种正向循环：数据贡献者不用担心被白嫖，因为有链上证明；开发者不用担心数据侵权，因为来源可审计；整个生态越活跃，$OPEN 的需求就越刚性。无雪觉得，这可能是目前看到的最接近“解决AI版权黑洞”的方案之一。
未来的AI世界，不该只有几个巨头闷声发财，而应该是谁贡献，谁受益。想深入了解这套模块化数据层怎么跑通的，请继续关注无雪的动态吧。#OpenLedger