这两天在更深入的了解#openledger ,啃白皮书啃得牙齿都快崩了。看完后整个叙事层面很丰满,但细想一下,我又觉得现实很骨感。为什么这么说呢?看完白皮书我在想:这个系统它怎么验证数据源的真实性?如何“去伪存真”?是通过什么规则/机制或者算法来解决这个问题?带着疑问我又去翻看白皮书,没有找到答案!

@OpenLedger 白皮书叙事很好,号称能够实现可验证的实时归因,确保贡献者获得的奖励与其数据对模型推理的影响成正⽐。它抑制了低质量输⼊,并促进了⾼影响⼒、可验证数据集的收集和整理。拉长时间周期来看,$OPEN 利在未来。但眼前的问题绕不过去。

如何抑制低质量输入?先不说数据归因该项目还没有落地,即便未来这些都落地了,数据源如何“去伪存真”便是摆在面前绕不开的问题,抛开这个问题账本算得再清楚再明白都毫无意义,更妄谈项目价值。

这让我想起3.15的GEO“投毒”新闻,恶意伪造数据源,操作AI,影响模型行为,何等恶劣的破坏行为呀。不解决“去伪存真”的问题,按照这个项目的叙事实现逻辑,那这类“投毒者”是不是可能在未来的AI浪潮中获得更多的经济奖励?这成了变相鼓励人破坏AI健康生态环境,这不该是这个项目的初衷。归因证明是很有必要,账本也更有必要算清楚。但是这些都应该建立在数据源可验证的前提下。

 总之一句话,数据源“去伪存真”的问题未解决,账算得再明白都没有用(况且项目组尚且还未能把数据归因落地等叙事落地呢),叙事再好都是扯淡!