我在回顧三月時做出的一個決定,使用的是我依賴了幾個月的聊天機器人。聊天記錄依然在那兒。我無法確定今天回答我的模型是否與當時使用的那個相同。

人們描述人工智能助手的方式就像描述他們經過一段時間調校的工具。底層有一個假設:被調校的東西是穩定的。但是權重、行爲調優和輸出傾向都可能在沒有用戶面對的披露情況下發生變化。感覺上的一致性通常是可見變化的缺失,而不是實際穩定性的存在。

這裏的非對稱性是特定的。平臺確切知道運行的是哪個版本,何時部署了更改,以及行爲發生了什麼變化。用戶對此一無所知,沒有版本號,沒有變更日誌,沒有檢測漂移的機制。你所擁有的是模型所說的歷史,而不是模型是什麼的記錄。

當我嘗試比較同一任務的兩個輸出週期時,我注意到了這一點。提示相似。結果發生了足夠的變化,以至於我無法判斷是我的方法改變了,還是模型改變了。當你試圖系統性地改進某些東西時,處於這樣的境地是很奇怪的。

opengradient 正在圍繞這個差距構建基礎設施。推理層的設計使得運行的模型、時間和參數可以獨立驗證,而不是依賴信任。這不是對模型不會變化的承諾,而是實際運行的可追蹤記錄。

關於人工智能控制的大多數討論集中在訓練數據或輸出過濾上。較少關注的是版本責任。用戶是否可以驗證他們在一月使用的模型在六月是否仍然是同一個模型,如果不是,那幾個月之間發生了什麼變化。

如果你圍繞構建的模型的習慣在這幾個月之間悄然改變,輸出仍然存在。工作流程仍然存在。不存在的是檢測差異的任何機制。

@OpenGradient $OPG #OPG $BEAT $HEI