Cliquez et faites glisser l’édition d’images AI pourrait tout changer

Le dernier développement en matière d'intelligence artificielle est un outil qui vous permet d'éditer une image déjà générée selon vos spécifications.

Supposons que vous vouliez "modifier les dimensions d'une voiture ou manipuler un sourire en fronçant les sourcils d'un simple clic et glisser", vous pouvez le faire avec ce modèle appelé DragGAN.

Faites glisser votre GAN : Manipulation interactive basée sur des points sur le collecteur d'images génératives

page papier : https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA

— AK (@_akhaliq) 19 mai 2023

Le Generative Adversarial Network (GAN) est actuellement sous la forme d'un document de recherche, cependant, il a attiré une telle attention de la part de ceux qui souhaitent voir ses démos que la page d'accueil de l'équipe de recherche a connu un plantage en raison du trafic important.

The Verge a comparé DragGAN à l'outil Warp de Photoshop, ajoutant qu'il est beaucoup plus puissant car il n'écrase pas les pixels, mais plutôt "régénère l'objet sous-jacent" et peut même faire pivoter les images 3D.

Le potentiel d'un tel outil réside dans le fait que l'IA générative text-to-image ne produit pas toujours ce que vous pourriez souhaiter. Ainsi, vous pouvez revenir en arrière et apporter des modifications à une image existante, au lieu d'avoir à générer automatiquement une nouvelle image.

Certaines démos qui font partie du document de recherche incluent l'ajout de hauteur à une montagne, la modification du positionnement d'un modèle et la modification de la longueur et de la forme de ses vêtements, l'ouverture ou la fermeture de la gueule d'un lion et le changement du visage d'une personne d'un simple regard à un sourire. Avec de nombreux outils d'IA actuellement disponibles, les utilisateurs doivent régénérer une image avec une invite plus spécifique pour obtenir un résultat plus souhaitable.

L'équipe de recherche a noté dans son article que de nouveaux détails peuvent être ajoutés dans la régénération des aspects édités des images qui sont bénéfiques pour la mise à jour. "Notre approche peut halluciner le contenu occlus, comme les dents à l'intérieur de la gueule d'un lion, et peut se déformer en fonction de la rigidité de l'objet, comme la flexion d'une jambe de cheval."

De nombreuses marques tentent d'offrir des options d'édition pour le contenu IA génératif. Cependant, la plupart ne vont pas jusqu'à autoriser l'édition proprement dite des images, mais plutôt des aspects tels que l'édition autour des images. Par exemple, l'application Designer de Microsoft vous permet de générer des images AI à partir d'une invite de texte, et vous pouvez sélectionner votre favori parmi trois résultats, puis l'apporter au studio de conception où vous pouvez créer une multitude de projets basés sur la créativité et la productivité, tels que publications sur les réseaux sociaux, invitations, cartes postales numériques ou graphiques avec l'image comme point central. Cependant, vous ne pouvez pas modifier l'image générée par l'IA.

L'outil DragGAN étant encore une démo pour le moment, on ne sait pas quelle serait la qualité d'une technologie facilement disponible, ou si cela serait même possible, d'autant plus que les démos sont basées sur des vidéos basse résolution. Cependant, c'est un exemple intéressant de la rapidité avec laquelle l'IA continue de se développer.