OpenAI 承認，通過隱藏的網絡或電子郵件指令操縱 AI 代理的提示注入攻擊仍然是其 ChatGPT Atlas 瀏覽 | 幣安廣場上的币界网

--

OpenAI 承認，通過隱藏的網絡或電子郵件指令操縱 AI 代理的提示注入攻擊仍然是其 ChatGPT Atlas 瀏覽器面臨的一項持續性安全挑戰，而且不太可能得到徹底解決。該公司正在部署一個基於 LLM（邏輯邏輯模型）的自動化攻擊者，該攻擊者使用強化學習進行訓練，以在內部模擬和發現新的攻擊策略。雖然安全更新已經改進了檢測能力——例如，能夠標記出之前誘騙代理髮送辭職信的惡意電子郵件——但專家指出，像 Atlas 這樣的智能瀏覽器兼具一定的自主性和對敏感數據的高度訪問權限，其風險狀況可能尚未達到足以證明其日常使用價值的程度。

免責聲明：包含來自第三方的見解。非財務建議。可能包含贊助內容。請參閱條款。