Quand l'IA peut générer des cartes d'identité, des interfaces UI et des captures d'écran de TikTok si réalistes qu'elles sont indiscernables du vrai, le mot "capture d'écran" devient obsolète.
Ces dernières années, l'IA avait une faiblesse : le texte était toujours illisible. À l'époque de DALL·E, "Hello" pouvait devenir "Hellp" ; avec GPT-Image-1.5, l'anglais était lisible, mais le chinois ressemblait encore à des hiéroglyphes.
Mais récemment, des images de test de GPT-Image-2 ont totalement comblé cette lacune.
Cartes d'identité, cartes de visite, interfaces UI, captures d'écran de livestream TikTok - chaque mot est parfaitement précis, la mise en page est soignée, et à première vue, c'est identique à la réalité. Quelqu'un a demandé de générer une image principale pour un produit de soin de la peau, la liste des cadeaux, les prix, les millilitres, tout était clair et lisible ; quelqu'un a demandé une carte du monde, avec des centaines de noms de lieux, de noms d'océans et de légendes, presque comme si c'était copié directement d'une base de données.
Ce n'est pas une mise à niveau technologique, c'est l'effondrement de la définition de "preuve".
Avant, on disait "une image vaut mille mots" parce que le coût de la fraude était élevé - une capture d'écran falsifiée capable de tromper tout le monde nécessitait un designer professionnel et beaucoup de temps. Maintenant, l'IA génère cela en un mot, sans coût, sans barrière, sans trace. Les captures d'écran sont passées de "preuves en cour" à "à titre de référence uniquement".
Le véritable choc ne se trouve pas au niveau technique, mais au niveau de la confiance.
Designer : avant, ce qui avait de la valeur, c'était "savoir dessiner", maintenant, ce qui a de la valeur, c'est "savoir juger quelle image peut être utilisée". Les tâches de base que l'IA peut accomplir, mais le jugement esthétique, l'adaptation aux scènes, la compréhension des demandes des clients - tout cela, pour l'instant, l'IA ne peut pas remplacer.
Ordinaire : les "captures d'écran de service client", "reçus de transfert", "preuves de conversation" que vous recevez peuvent toutes être générées par l'IA. Récemment, des consommateurs ont utilisé des images de produits altérés générées par l'IA pour demander un "remboursement complet", et un groupe de propriétaires a été plongé dans la panique à cause d'images générées par l'IA montrant un "sans-abri entrant dans leur maison".
Légalité : la Cour suprême des États-Unis vient de rejeter une demande d'enregistrement de droits d'auteur pour des images générées par l'IA, et le premier cas de violation de droits d'auteur pour "génération d'images en un clic" en Chine a également été jugé : les images générées par une simple saisie de mots-clés ne constituent pas des œuvres et ne sont pas protégées par la loi sur le droit d'auteur. La technologie avance plus vite que la loi, mais les frontières de la loi sont en train d'être tracées une à une.
C'est là que GPT-Image-2 devient vraiment inquiétant.
Ce n'est pas sa puissance, mais le fait qu'il a complètement brisé la ligne de base de "voir c'est croire". Quand les cartes d'identité, les historiques de conversation et les interfaces UI peuvent être générées d'un simple clic, en quoi pouvez-vous encore avoir confiance ? $AI
Ces dernières années, l'IA avait une faiblesse : le texte était toujours illisible. À l'époque de DALL·E, "Hello" pouvait devenir "Hellp" ; avec GPT-Image-1.5, l'anglais était lisible, mais le chinois ressemblait encore à des hiéroglyphes.
Mais récemment, des images de test de GPT-Image-2 ont totalement comblé cette lacune.
Cartes d'identité, cartes de visite, interfaces UI, captures d'écran de livestream TikTok - chaque mot est parfaitement précis, la mise en page est soignée, et à première vue, c'est identique à la réalité. Quelqu'un a demandé de générer une image principale pour un produit de soin de la peau, la liste des cadeaux, les prix, les millilitres, tout était clair et lisible ; quelqu'un a demandé une carte du monde, avec des centaines de noms de lieux, de noms d'océans et de légendes, presque comme si c'était copié directement d'une base de données.
Ce n'est pas une mise à niveau technologique, c'est l'effondrement de la définition de "preuve".
Avant, on disait "une image vaut mille mots" parce que le coût de la fraude était élevé - une capture d'écran falsifiée capable de tromper tout le monde nécessitait un designer professionnel et beaucoup de temps. Maintenant, l'IA génère cela en un mot, sans coût, sans barrière, sans trace. Les captures d'écran sont passées de "preuves en cour" à "à titre de référence uniquement".
Le véritable choc ne se trouve pas au niveau technique, mais au niveau de la confiance.
Designer : avant, ce qui avait de la valeur, c'était "savoir dessiner", maintenant, ce qui a de la valeur, c'est "savoir juger quelle image peut être utilisée". Les tâches de base que l'IA peut accomplir, mais le jugement esthétique, l'adaptation aux scènes, la compréhension des demandes des clients - tout cela, pour l'instant, l'IA ne peut pas remplacer.
Ordinaire : les "captures d'écran de service client", "reçus de transfert", "preuves de conversation" que vous recevez peuvent toutes être générées par l'IA. Récemment, des consommateurs ont utilisé des images de produits altérés générées par l'IA pour demander un "remboursement complet", et un groupe de propriétaires a été plongé dans la panique à cause d'images générées par l'IA montrant un "sans-abri entrant dans leur maison".
Légalité : la Cour suprême des États-Unis vient de rejeter une demande d'enregistrement de droits d'auteur pour des images générées par l'IA, et le premier cas de violation de droits d'auteur pour "génération d'images en un clic" en Chine a également été jugé : les images générées par une simple saisie de mots-clés ne constituent pas des œuvres et ne sont pas protégées par la loi sur le droit d'auteur. La technologie avance plus vite que la loi, mais les frontières de la loi sont en train d'être tracées une à une.
C'est là que GPT-Image-2 devient vraiment inquiétant.
Ce n'est pas sa puissance, mais le fait qu'il a complètement brisé la ligne de base de "voir c'est croire". Quand les cartes d'identité, les historiques de conversation et les interfaces UI peuvent être générées d'un simple clic, en quoi pouvez-vous encore avoir confiance ? $AI
