有时候我会觉得,现在AI行业最容易被忽略的,其实不是模型,而是数据本身。因为模型大家都在做,开源越来越多,能力差距也在慢慢缩小,但真正高质量、可信、还能持续更新的数据,其实越来越稀缺。

这也是我后来开始注意OpenLedger的原因。它的数据网络思路和传统AI平台差别挺大,现在很多AI公司的模式,本质上还是“平台收集数据”,用户负责提供内容,平台负责训练模型,最后数据进入系统以后,外面基本看不到后续发生了什么。

但OpenLedger更在意的是,数据能不能被追踪、验证,以及贡献关系能不能保留下来。谁提供数据,谁参与训练,谁贡献推理能力,它想尽量把这些过程记录下来,而不是像传统平台一样,数据一上传就彻底失去归属感。

我觉得这个方向其实挺关键的,尤其以后AI Agent越来越多以后。因为未来很可能不是人在疯狂调用AI,而是AI和AI之间互相协作、互相调用数据。到时候如果没有数据来源验证,没有贡献记录,整个生态其实很容易重新回到中心化平台手里。

还有一点很多人现在没太注意,AI行业已经开始出现“数据污染”问题了。很多模型互相学习AI生成内容,最后AI再拿AI的数据继续训练,时间久了,内容质量可能会越来越混乱。

所以未来真正值钱的,可能不是谁模型参数最大,而是谁能提供可信的数据来源。这也是为什么我感觉,OpenLedger现在做的更像AI数据基础设施,而不只是单纯做一个AI项目。@OpenLedger #openledger $OPEN