AGI, il sacro graal dello sviluppo dell'IA, padroneggia qualsiasi compito cognitivo che un essere umano possa fare, apprende attraverso i domini e si migliora. E i blocchi fondamentali sono già qui.

Ma quando i sistemi si auto-migliorano, anche un 1% di disallineamento = P(rovocazione) 💀

Assicuriamoci di fare la cosa giusta.

🧵