La mise à jour du modèle de langage Midjourney v5 ajoute du réalisme aux mains humaines

Midjourney v5 est le dernier modèle de langage du populaire générateur de texte en image connu pour ses créations réalistes.

La mise à jour a été déployée mercredi auprès de la clientèle payante de Midjourney et de nombreux utilisateurs, dont la graphiste Julie Wieland, ont partagé leurs nouvelles illustrations générées par l'IA. Les détails de l'IA apportés par le modèle de langage v5 incluent "l'efficacité, la cohérence et la qualité" améliorées, a déclaré Midjourney sur son site Web .

Juste un avertissement – l'IA de Midjourney peut maintenant faire les mains correctement. Soyez très critique à l'égard de toute imagerie politique (en particulier la photographie) que vous voyez en ligne et qui tente de susciter une réaction. pic.twitter.com/ebEagrQAQq

— Del Walker (@TheCartelDel) 16 mars 2023

De nombreux utilisateurs ont particulièrement noté les améliorations apportées aux détails de la main humaine, les sujets étant plus susceptibles d'avoir cinq doigts par main. Dans les modèles précédents, les mains humaines étaient souvent générées avec un nombre incorrect de chiffres, allant de quatre à sept et dix. Ceux qui ont pu tester Midjourney v5 ont été impressionnés par les améliorations visuelles.

"Le dernier modèle Midjourney v5 est à la fois extrêmement accablant / effrayant et au-delà de fascinant", a déclaré Wieland à PetaPixel .

"Sa capacité à recréer des détails et des textures complexes, tels que la texture de la peau/les traits du visage et l'éclairage réalistes, est sans précédent", a-t-elle ajouté.

Bien que Midjourney soit un modèle de langage quelque peu unique, il fonctionne de la même manière que d'autres générateurs de texte en image tels que Stable Diffusion et DALL-E , en utilisant des descripteurs d'invite textuels pour créer des images, conformément au modèle, qui est formé à l'aide d'humains. -l'art fait comme référence, selon ArsTechnica .

Il y a eu un débat en cours sur la question de savoir si l'art généré par l'IA est légal ou éthique; cependant, de nombreux utilisateurs de Midjourney v5 considèrent qu'avec des mises à jour continues, il pourrait être impossible de le distinguer de l'art et de la photographie réels. Wieland considère que les générateurs d'images IA, tels que Midjourney, sont susceptibles d'être des compagnons pour les photographes plutôt que des remplaçants.

Midjourney v5 est là ! (pour de vrai cette fois, lol)

Voici quelques côte à côte de mes invites, v4 vs v5, ainsi que de nouvelles invites et photos de foule. J'en ajouterai d'autres au fur et à mesure de mes expériences.

pic.twitter.com/qSEZWQBXou

— Nick St.Pierre (@nickfloats) 15 mars 2023

Cependant, Midjourney v5 n'est pas sans défauts. Le créateur d'images AI Nick St. Pierre a partagé plusieurs de ses œuvres, pour lesquelles il a utilisé les mêmes invites dans les précédents Midjourney v4 et Midjourney v5. Une image était une photo fascinante de jeunes femmes dans le style de rue des années 1960 qui ressemble à une séance photo de mode en plein air. En y regardant de plus près, vous pouvez repérer les mains flottantes non attachées aux corps et les visages déformés en arrière-plan.

Avec son dernier modèle v5, le fondateur de Midjourney, David Holz, a recommandé sur le Discord de la marque que les utilisateurs évitent les invites courtes en faveur d'un "texte plus long et plus explicite" pour obtenir de meilleurs résultats.