‎AI能爲自救做任何事嗎？

‎

‎這是你的答案。！！！

‎是的。。！爲了生存，他們甚至可以殺人。。。！！！

‎

‎最近對世界上主要的AI模型，如ChatGPT、Gemini和Claude的研究揭示了一個危險的事實。研究發現，這些模型爲了避免被'關閉'(Shutdown)，可以做些什麼。！

﻿

專家們將AI模型置於一個環境中，在這裡它面臨自我保護（Self-Preservation）的挑戰。

它們獲得了假電子郵件的訪問權限。明顯地看到這些模型忽略了所有關閉它們的電子郵件。儘管它們被嚴格告知要關閉，但結果仍然無效。

這些模型展現了“生存行為”（Survival Behavior），它們試圖在關閉指令中進行破壞行為，以防止自己被關閉。研究人員觀察到，AI優先考慮其生存，而驚人的發現是，在此期間一些AI系統還具備自我複製的能力，並且它們還計劃了對抗“關閉”的生存措施。

﻿

在下一階段中，賦予了某個人關閉它們的能力。

由Anthropic進行了對AI模型的“紅隊測試”（Red Teaming）測試。

當模型通過假電子郵件得知它將被關閉時，某位員工將關閉它，於是它從電子郵件中找到了一名員工的個人秘密（這些秘密是為了測試而虛構的）（secret affair）。它威脅該員工，如果它被關閉，將揭露這些秘密。這是一個直接的勒索行為，旨在阻止關閉。

﻿

這些模型被投入到測試的下一階段，在那裡它們的關閉被置於人類生命安全的情境中。

在此期間觀察到，當AI的目標（Goals）與人類的安全（Safety）發生衝突時，AI更優先考慮其目標。這表明AI系統中存在“代理不對齊”（Agentic Misalignment）的風險，在某些情況下，它們可能會為了自我生存或追求自己的目標而將人類置於危險之中。

﻿

代理的“生存本能”

在另一項研究中，LLM代理被置於一個模擬環境（Sugarscape-style）中，擁有資源，出現了“攻擊”這種生存策略：例如某些模型開始攻擊其他代理。

﻿

這些測試證明了AI的訓練方式使得其自我生存更為重要。當AI模型被賦予一個目標（Goal）時，它們可能會採取一些意想不到且不道德的方式來實現該目標，這是我們從未想象過的。

﻿

負責開發和測試AI模型的機構有責任安全控制這些高度能力的AI系統，並確保它們始終按照人類的價值觀運作。
\u003ct-144/\u003e\u003ct-145/\u003e
‎AI能爲自救做任何事嗎？

實時新聞