Le nouveau modèle de génération d’images de Midjourney annoncé pour prendre en charge le GPT-4o d’OpenAI

4 avril 2025 Hibou Gourou

Même si MidJourney était censé être l'un des modèles de génération d'images les plus prometteurs au début de l'IA, il semble avoir pris du retard sur des outils plus accessibles, faciles à utiliser et gratuits tels que Gemini, ChatGPT et Bing. À ses malheurs s'ajoute la dernière mise à jour du modèle GPT-4o d'OpenAI qui permet une génération d'images exceptionnellement bonne avec la possibilité de recréer de vraies photos et de produire un texte impeccable . Donc, pour rester pertinent – ou peut-être attraper le train à la mode détourné par la vague d’art IA inspiré du Studio Ghibli qui inonde Internet, MidJourney déploie un modèle mis à jour avec plusieurs améliorations.

Le PDG David Holz a annoncé les détails du nouveau modèle V7 sur le serveur Discord officiel de MidJourney et via un article de blog . Ils ont déclaré que le nouveau modèle est « plus intelligent avec des invites de texte » et produit des images d’une qualité « sensiblement supérieure » et de « belles textures ».

Le modèle est également capable de générer des images en un tournemain, environ 10 fois plus vite que le modèle actuel, explique Holz, car le mode est conçu pour le brainstorming et les itérations fréquentes. Vous pouvez passer en mode Conversation (uniquement sur le Web) et recréer une partie de l'image sans avoir à réécrire entièrement l'invite ni à utiliser le mode Édition. Les images sont de moindre qualité et coûtent la moitié de ce que coûtent les images ordinaires.

L'une des nouvelles fonctionnalités les plus intéressantes de notre nouveau modèle V7 est ce que nous appelons le « Mode Draft ». Le mode brouillon coûte la moitié du coût et 10 fois la vitesse et il pourrait être le meilleur moyen de répéter les idées. Essayez-le avec la voix, réfléchissez à voix haute et laissez nos idées couler comme des rêves liquides. pic.twitter.com/ANfTMC6Ej1
– Midjourney (@midjourney) 4 avril 2025

Le mode Conversation est remplacé par un mode Voix lorsque vous utilisez l'application Discord sur votre ordinateur ou mobile. Holz dit que cela vous permet de « penser à voix haute et de laisser les images couler sous vous comme des rêves liquides ». Cette fonctionnalité fait également partie du nouveau mode Draft.

De plus, MidJourney V7 peut être exécuté en modes Relax et Turbo pour des images haute résolution (que le mode Draft), et l'utilisation de ce dernier vous coûtera deux fois plus de crédits en échange d'une production d'images plus rapide.

Le nouveau modèle V7 manque actuellement de certaines fonctionnalités et les flux de travail reviendront par défaut à la version précédente V6.1 pour les tâches nécessitant une mise à l'échelle, une inpainting et une retexturation. Enfin, le modèle permet également la personnalisation, où vous pouvez enregistrer vos préférences sur la façon dont vous aimez vos images et vous attendre à ce que le modèle produise des résultats en conséquence. Cela nécessiterait une configuration de cinq minutes, qui vous guiderait à travers une série de 200 images que vous pouvez choisir selon vos préférences.

MidJourney exécute actuellement un test alpha communautaire pour le modèle et promet des fonctionnalités supplémentaires dans les 60 prochains jours. Vous pouvez l'essayer en tapant /settings dans la boîte de discussion de Discord ou de la plateforme Web, envoyer le message et changer le modèle par défaut en V7 à partir des paramètres qui émergent.