前段时间测试几个 Agent 项目的时候,我产生了一个挺反直觉的想法:AI 行业现在很多问题,其实不是 AI 问题,而是软件工程问题。

比如同一个 Agent,在不同环境下输出结果不同;模型升级之后行为发生变化;Prompt 被修改之后没人知道;出了问题只能重新跑一遍,靠经验排查。

这些问题听起来很 AI,但仔细想想,本质上和软件开发早期遇到的问题没有太大区别。 #OPG

也正因为这样,我后来越来越能理解 $OPG 为什么一直在强调模型版本、执行环境和推理记录。

尤其是 @OpenGradient 的 Verifiable Inference。

很多人都把注意力放在“验证”两个字上,但我最近反而觉得,OpenGradient 真正想做的是标准化。

因为现在 AI 世界太混乱了。

同一个模型,可以部署在不同环境。

同一个 Prompt,在不同平台输出不同。

同样一个 Agent,两周之后可能已经不是原来的行为。

而 OpenGradient 希望通过 Verifiable Inference、TEE 和 Model Hub,把这些变量尽可能固定下来。

模型是什么版本。

运行在哪个环境。

输入是什么。

推理过程如何。

输出如何生成。

这些信息都会在 OpenGradient 的系统里留下记录。

说实话,这让我想到 Git。

Git 不能让代码没有 Bug,但它能让开发者知道 Bug 是从哪里来的。

OpenGradient 的 Verifiable Inference 其实也有类似味道。

它不能保证 AI 一定正确,但至少能够保证,当 AI 出现问题的时候,开发者不会完全无从下手。

当然,这里面也有一个我比较担心的问题。

AI 和传统软件不一样,它本身具有概率性。

记录过程并不意味着能够解释结果。

而且随着 Agent 越来越复杂,OpenGradient 记录下来的数据量会越来越大,维护成本和存储成本也会随之增加。

所以 OpenGradient 现在做的,更像是在工程可行性和理想状态之间寻找平衡。