我在測試AI代理時總是遇到同樣的限制:每次會話都感覺像是從頭開始。
幾周前,我在OpenGradient上嘗試了一個工作流程,代理必須在多個交互中處理一系列相關任務。沒什麼複雜的,大約15-20個步驟分散在幾次會話中。讓我印象深刻的不是模型的質量,而是代理能夠參考之前的狀態,而我不需要每次都重建上下文。
這聽起來微不足道,但與通常的體驗相比就不一樣了。
在無狀態系統中,我發現自己不斷重複粘貼相同的信息。一個本該只需5個提示的任務,最終花費了12個提示,因爲模型總是忘記之前做出的決定。問題不是智能,而是記憶。
OpenGradient正在朝着不同的方向發展。該網絡已經處理了超過200萬次推理,值得注意的是,它的設計似乎更加關注在行動之間保留有用狀態,而不是優化孤立的響應。
這種狀態性帶來了新的期望。
一旦代理記住了之前的決定,用戶就不再逐個提示地評判它,而是開始評判一致性。我注意到自己也正是如此。在幾次成功的交互後,一處小細節的遺忘變得比一個平庸的答案更讓人惱火。
這可能是真正的挑戰所在。
讓一個AI系統記住是一個事情。
讓這個記憶足夠可靠,以至於人們不再考慮它,而是簡單地期望它存在,是一個更高的標準,我不確定是否有人完全解決了這個問題。
@OpenGradient $OPG #OPG .
幾周前,我在OpenGradient上嘗試了一個工作流程,代理必須在多個交互中處理一系列相關任務。沒什麼複雜的,大約15-20個步驟分散在幾次會話中。讓我印象深刻的不是模型的質量,而是代理能夠參考之前的狀態,而我不需要每次都重建上下文。
這聽起來微不足道,但與通常的體驗相比就不一樣了。
在無狀態系統中,我發現自己不斷重複粘貼相同的信息。一個本該只需5個提示的任務,最終花費了12個提示,因爲模型總是忘記之前做出的決定。問題不是智能,而是記憶。
OpenGradient正在朝着不同的方向發展。該網絡已經處理了超過200萬次推理,值得注意的是,它的設計似乎更加關注在行動之間保留有用狀態,而不是優化孤立的響應。
這種狀態性帶來了新的期望。
一旦代理記住了之前的決定,用戶就不再逐個提示地評判它,而是開始評判一致性。我注意到自己也正是如此。在幾次成功的交互後,一處小細節的遺忘變得比一個平庸的答案更讓人惱火。
這可能是真正的挑戰所在。
讓一個AI系統記住是一個事情。
讓這個記憶足夠可靠,以至於人們不再考慮它,而是簡單地期望它存在,是一個更高的標準,我不確定是否有人完全解決了這個問題。
@OpenGradient $OPG #OPG .
