我曾經以爲RAG只是個簡單的花招,問個問題,抓幾塊信息,讓模型拼湊個答案。
但當你真正和它待久了,你開始注意到一個不舒服的事情:答案不是有趣的部分。
選擇纔是。👀
在像@OpenGradient OpenGradient這樣的系統中,重要的不僅僅是模型能說什麼。
而是網絡在它發聲之前讓它看到什麼。
這一部分在一切都集中化的時候感覺幾乎是隱形的。你不會質疑索引。
你只是假設這就是“知識”。
但一旦知識變成系統,它就不是中立的。
檢索增強生成聽起來像是將模型紮根於現實。
實際上,更像是通過偏好排名、索引、緩存、延遲權衡、節點行爲的層次來引導現實。
一旦檢索去中心化,微妙的東西就會改變。你不再擁有單一的記憶。
你會得到一些微微不同的記憶片段,取決於你問的地方、時間,以及網絡那時優先考慮什麼。
這一部分是大多數人忽略的。
在這些系統中的審查感覺並不像刪除。它感覺像是某些東西沒有首先出現。然後是第二個。
最終根本沒有出現,因爲大多數用戶從不滾動那麼遠。
而且“真相”是如何迅速開始與“最快到達的東西”混淆的,真讓人驚訝。
更難的問題不是分佈式檢索是否能在速度或規模上趕上集中式向量數據庫,而是這樣的系統是否仍然能夠產生共享的現實感,還是隻是彼此重疊的版本,從未完全對齊。
當存儲、檢索和推理開始在網絡中生活而不是在系統內部時,智能不再是一個聲音。
它變成了一種更像是通過靜電聽東西,並根據最先到達你的信息決定你相信什麼。
#OPG $OPG
$SYN $MITO
但當你真正和它待久了,你開始注意到一個不舒服的事情:答案不是有趣的部分。
選擇纔是。👀
在像@OpenGradient OpenGradient這樣的系統中,重要的不僅僅是模型能說什麼。
而是網絡在它發聲之前讓它看到什麼。
這一部分在一切都集中化的時候感覺幾乎是隱形的。你不會質疑索引。
你只是假設這就是“知識”。
但一旦知識變成系統,它就不是中立的。
檢索增強生成聽起來像是將模型紮根於現實。
實際上,更像是通過偏好排名、索引、緩存、延遲權衡、節點行爲的層次來引導現實。
一旦檢索去中心化,微妙的東西就會改變。你不再擁有單一的記憶。
你會得到一些微微不同的記憶片段,取決於你問的地方、時間,以及網絡那時優先考慮什麼。
這一部分是大多數人忽略的。
在這些系統中的審查感覺並不像刪除。它感覺像是某些東西沒有首先出現。然後是第二個。
最終根本沒有出現,因爲大多數用戶從不滾動那麼遠。
而且“真相”是如何迅速開始與“最快到達的東西”混淆的,真讓人驚訝。
更難的問題不是分佈式檢索是否能在速度或規模上趕上集中式向量數據庫,而是這樣的系統是否仍然能夠產生共享的現實感,還是隻是彼此重疊的版本,從未完全對齊。
當存儲、檢索和推理開始在網絡中生活而不是在系統內部時,智能不再是一個聲音。
它變成了一種更像是通過靜電聽東西,並根據最先到達你的信息決定你相信什麼。
#OPG $OPG
$SYN $MITO