前段时间测试几个 Agent 项目的时候,我产生了一个挺反直觉的想法:AI 行业现在很多问题,其实不是 AI 问题,而是软件工程问题。
比如同一个 Agent,在不同环境下输出结果不同;模型升级之后行为发生变化;Prompt 被修改之后没人知道;出了问题只能重新跑一遍,靠经验排查。
这些问题听起来很 AI,但仔细想想,本质上和软件开发早期遇到的问题没有太大区别。 #OPG
也正因为这样,我后来越来越能理解 $OPG 为什么一直在强调模型版本、执行环境和推理记录。
尤其是 @OpenGradient 的 Verifiable Inference。
很多人都把注意力放在“验证”两个字上,但我最近反而觉得,OpenGradient 真正想做的是标准化。
因为现在 AI 世界太混乱了。
同一个模型,可以部署在不同环境。
同一个 Prompt,在不同平台输出不同。
同样一个 Agent,两周之后可能已经不是原来的行为。
而 OpenGradient 希望通过 Verifiable Inference、TEE 和 Model Hub,把这些变量尽可能固定下来。
模型是什么版本。
运行在哪个环境。
输入是什么。
推理过程如何。
输出如何生成。
这些信息都会在 OpenGradient 的系统里留下记录。
说实话,这让我想到 Git。
Git 不能让代码没有 Bug,但它能让开发者知道 Bug 是从哪里来的。
OpenGradient 的 Verifiable Inference 其实也有类似味道。
它不能保证 AI 一定正确,但至少能够保证,当 AI 出现问题的时候,开发者不会完全无从下手。
当然,这里面也有一个我比较担心的问题。
AI 和传统软件不一样,它本身具有概率性。
记录过程并不意味着能够解释结果。
而且随着 Agent 越来越复杂,OpenGradient 记录下来的数据量会越来越大,维护成本和存储成本也会随之增加。
所以 OpenGradient 现在做的,更像是在工程可行性和理想状态之间寻找平衡。