前段时间测试几个 Agent 项目的时候，我产生了一个挺反直觉的想法：AI 行业现在很多问题，其实不是 AI 问题，而是

前段时间测试几个 Agent 项目的时候，我产生了一个挺反直觉的想法：AI 行业现在很多问题，其实不是 AI 问题，而是软件工程问题。比如同一个 Agent，在不同环境下输出结果不同；模型升级之后行为发生变化；Prompt 被修改之后没人知道；出了问题只能重新跑一遍，靠经验排查。
这些问题听起来很 AI，但仔细想想，本质上和软件开发早期遇到的问题没有太大区别。 #OPG 
也正因为这样，我后来越来越能理解 $OPG  为什么一直在强调模型版本、执行环境和推理记录。
尤其是 @OpenGradient  的 Verifiable Inference。
很多人都把注意力放在“验证”两个字上，但我最近反而觉得，OpenGradient 真正想做的是标准化。
因为现在 AI 世界太混乱了。
同一个模型，可以部署在不同环境。
同一个 Prompt，在不同平台输出不同。
同样一个 Agent，两周之后可能已经不是原来的行为。
而 OpenGradient 希望通过 Verifiable Inference、TEE 和 Model Hub，把这些变量尽可能固定下来。
模型是什么版本。
运行在哪个环境。
输入是什么。
推理过程如何。
输出如何生成。
这些信息都会在 OpenGradient 的系统里留下记录。
说实话，这让我想到 Git。
Git 不能让代码没有 Bug，但它能让开发者知道 Bug 是从哪里来的。
OpenGradient 的 Verifiable Inference 其实也有类似味道。
它不能保证 AI 一定正确，但至少能够保证，当 AI 出现问题的时候，开发者不会完全无从下手。
当然，这里面也有一个我比较担心的问题。
AI 和传统软件不一样，它本身具有概率性。
记录过程并不意味着能够解释结果。
而且随着 Agent 越来越复杂，OpenGradient 记录下来的数据量会越来越大，维护成本和存储成本也会随之增加。
所以 OpenGradient 现在做的，更像是在工程可行性和理想状态之间寻找平衡。