Riyamoni1 (@Riyamoni) 的見解

@OpenGradient
當模型在失敗時，並未出現該問題。
當模型恢復時，問題出現了。
輸出恢復正常。延遲穩定下來。大多數用戶繼續使用了。但仍有少量推理記錄指向了較新的發佈版本。部分代理在問題期間已經調整了它們的行爲。錯誤版本上線期間，有一筆付款已經結算。
模型回來了。
但信心（置信度）沒有。
這讓我開始在 OpenGradient 裏以不同方式思考回滾。
回滾權重可能是最簡單的部分。困難之處在於：要保留圍繞這次失誤的歷史。
到底是哪一個模型版本實際爲請求提供了服務？
哪個 Blob ID 生成了輸出？
哪條證明路徑驗證了這次推理？
哪些代理在有缺陷的發佈期間改變了它們的行爲？
哪些付款在較新版本處於活動狀態時完成了結算？
如果網絡只是簡單地恢復舊模型並隱藏失敗的發佈，那麼技術問題會消失，但信任問題仍然存在。
失敗的版本仍然重要。
審計軌跡很重要。
結算曆史很重要。
一個去中心化的 AI 網絡不僅要負責提供正確的模型。它還必須保存那些不正確模型的記錄。
這也是爲什麼在 OpenGradient 裏進行回滾的感受不同於傳統軟件更新。目標不僅僅是回到可工作的狀態。目標是讓回溯路徑完全可見。
因爲在去中心化 AI 中，舊模型再次變爲活動狀態並不是關鍵問題。
真正的問題是：
當網絡“離線/不在場”時，它能否精確證明期間發生了什麼？
如果在出錯發佈期間，代理、證明、付款和路由都持續在推進，那麼回滾就不再主要是代碼問題，而更多是信任問題。
回去很容易。
留下足夠清晰的痕跡以便信任，這纔是難點。
#opg #DeAI #OpenGradient $OPG
向社區提問：
如果發生模型回滾，對用戶來說最應該重要的是什麼：更快恢復、完整的審計歷史，還是證明每一次推理到底由哪個版本生成的？