OpenAI 承認,通過隱藏的網絡或電子郵件指令操縱 AI 代理的提示注入攻擊仍然是其 ChatGPT Atlas 瀏覽器面臨的一項持續性安全挑戰,而且不太可能得到徹底解決。該公司正在部署一個基於 LLM(邏輯邏輯模型)的自動化攻擊者,該攻擊者使用強化學習進行訓練,以在內部模擬和發現新的攻擊策略。雖然安全更新已經改進了檢測能力——例如,能夠標記出之前誘騙代理髮送辭職信的惡意電子郵件——但專家指出,像 Atlas 這樣的智能瀏覽器兼具一定的自主性和對敏感數據的高度訪問權限,其風險狀況可能尚未達到足以證明其日常使用價值的程度。