AGI, il sacro graal dello sviluppo dell'IA, padroneggia qualsiasi compito cognitivo che un essere umano possa fare, apprende attraverso i domini e si migliora. E i blocchi fondamentali sono già qui.
Ma quando i sistemi si auto-migliorano, anche un 1% di disallineamento = P(rovocazione) 💀
Assicuriamoci di fare la cosa giusta.
🧵
