當我觀察推理市場時,我總是注意到同樣的模式:人們只在準確率上給模型打分,然後就到此爲止,彷彿正確性就是全部故事。

讓我對@OpenGradient 的看法發生變化的是意識到:沒有審計追蹤的準確率只是一種主張。模型可以答對,但仍可能無法被驗證;而在金融領域,這兩者並不相同。

我覺得被低估的部分是算子(operator)層。任何人都可以搭起計算資源,但有“綁定”的運營方(bonded operators)揹負的卻是不同的資本——一旦驗證失敗,這部分資本會被扣減。這個單一的設計選擇,會悄悄過濾掉那些本來會用廉價、不可驗證的請求把網絡淹沒、從而薅取手續費量的參與者。

所以當我看到$OPG usage指標時,我不太關心原始的請求次數,更關心“已驗證完成”與“總請求”的比率。那裏一旦差距擴大,通常意味着激勵正在偏離真實需求。

我並不認爲這種情況會永遠成立。運營方集中度、懶惰式驗證或激勵疲勞都可能讓它逐漸被侵蝕。但就目前而言,我寧願追蹤驗證的完整性,而不是交易數量——前者告訴你“發生了什麼且能被證實”,後者只是告訴你“有多忙”。

#OPG