我仍會想起 2023 年關於 GPT-4 偏移(drift)的討論
研究人員報告說,即使開發者仍在調用同一個端點,用於諸如質數檢測和代碼生成之類任務的推理行爲在幾個月內也發生了明顯變化
人們爭論基準測試
讓我印象最深的卻是另一件事
如果 npm、pip 或 cargo 在不改變版本號的情況下,悄悄替換了某個依賴,大多數工程師都會認爲這是一次運維失敗
而某種 AI 的機制卻把這種情況“常態化”了
你測試了一套工作流
幾周之後,輸出感覺有點不一樣
沒有任何東西崩潰
你只是花上數小時懷疑那個問題到底是出在你的提示(prompts)裏、你的應用裏,還是出在某個你根本無法查看的地方
@OpenGradient 通常被描述爲去中心化的 AI 基礎設施:用於存儲模型、運行推理,並驗證執行
我起初接受了這種說法
後來我花更多時間去研究 Model Hub(模型中心)
模型存儲在 Walrus 上,並通過內容尋址的 Blob ID 來引用,而不是通過可變的端點
代理(agent)並不是在請求“某個提供方當前正在提供的東西”
它是在請求一個特定的加密身份(cryptographic identity)
這種差別起初可能顯得微妙,但當多個自治系統開始彼此協同時
兩名代理都可以聲稱自己在使用同一個模型,但如果底層權重在各自獨立地漂移,它們就不再共享同一套依賴圖(dependency graph)
性能看起來也許仍然“夠好”
協調已經開始走向分歧
傳統的包管理器早在很多年前就通過讓構件(artifacts)不可變來解決這個問題
AI 則在很大程度上用更快的迭代把這種特性換掉了
也許這種取捨對面向消費者的產品來說完全合理
但當自治系統開始調動資金,或做出會影響其他代理的決策時,我就不那麼確定這種取捨仍然合理
我一直在想:AI 中真正的協調單位也許不再是“模型”本身
而可能是每個人都在默默同意去執行的那個哈希(hash)
#opg $OPG $RE $LAB
研究人員報告說,即使開發者仍在調用同一個端點,用於諸如質數檢測和代碼生成之類任務的推理行爲在幾個月內也發生了明顯變化
人們爭論基準測試
讓我印象最深的卻是另一件事
如果 npm、pip 或 cargo 在不改變版本號的情況下,悄悄替換了某個依賴,大多數工程師都會認爲這是一次運維失敗
而某種 AI 的機制卻把這種情況“常態化”了
你測試了一套工作流
幾周之後,輸出感覺有點不一樣
沒有任何東西崩潰
你只是花上數小時懷疑那個問題到底是出在你的提示(prompts)裏、你的應用裏,還是出在某個你根本無法查看的地方
@OpenGradient 通常被描述爲去中心化的 AI 基礎設施:用於存儲模型、運行推理,並驗證執行
我起初接受了這種說法
後來我花更多時間去研究 Model Hub(模型中心)
模型存儲在 Walrus 上,並通過內容尋址的 Blob ID 來引用,而不是通過可變的端點
代理(agent)並不是在請求“某個提供方當前正在提供的東西”
它是在請求一個特定的加密身份(cryptographic identity)
這種差別起初可能顯得微妙,但當多個自治系統開始彼此協同時
兩名代理都可以聲稱自己在使用同一個模型,但如果底層權重在各自獨立地漂移,它們就不再共享同一套依賴圖(dependency graph)
性能看起來也許仍然“夠好”
協調已經開始走向分歧
傳統的包管理器早在很多年前就通過讓構件(artifacts)不可變來解決這個問題
AI 則在很大程度上用更快的迭代把這種特性換掉了
也許這種取捨對面向消費者的產品來說完全合理
但當自治系統開始調動資金,或做出會影響其他代理的決策時,我就不那麼確定這種取捨仍然合理
我一直在想:AI 中真正的協調單位也許不再是“模型”本身
而可能是每個人都在默默同意去執行的那個哈希(hash)
#opg $OPG $RE $LAB