J’ai donné la même invite vidéo à différentes IA et l’une d’elles était bien meilleure que la concurrence
L'intelligence artificielle progresse à un rythme effréné. La plupart des compagnons IA peuvent générer des images, servir de chatbots ou effectuer des recherches approfondies. Cependant, de nombreux compagnons IA permettent désormais de générer des vidéos, que ce soit directement via l'IA ou via un logiciel partenaire externe.
Avec autant d'options différentes pour la génération de vidéos par l'IA, j'ai décidé de tester certaines des options les plus populaires en leur fournissant toutes la même invite et en déterminant quelle vidéo sortait le mieux. J'ai notamment testé Sora, qui permet la génération de vidéos sur Microsoft Copilot et a été créé par OpenAI, les propriétaires de ChatGPT . J'ai également testé Grok et Google Gemini .
En termes de message, j'ai veillé à fournir exactement le même message à tous les logiciels d'intelligence artificielle. J'ai également demandé à des humains d'apparaître dans la vidéo pour en évaluer le réalisme. Je voulais un premier plan et un arrière-plan pour créer une certaine profondeur de champ.
J'ai demandé au sujet de la vidéo de faire un signe de la main afin que nous puissions voir comment les générateurs vidéo d'intelligence artificielle peuvent créer des mains et des doigts. Les IA peuvent être confrontées à ce qu'on appelle des hallucinations, où les vidéos contiennent des sujets supplémentaires.
Voici l’invite exacte que j’ai fournie aux compagnons d’intelligence artificielle :
Créez une vidéo d'un homme utilisant un ordinateur portable. Il se trouve dans un bureau, derrière lui. Il lève les yeux vers la caméra et lui fait un signe de la main, le sourire aux lèvres. L'ambiance est d'abord tendue, puis se détend lorsqu'il sourit à la caméra.
Voici les résultats de l'invite ci-dessus, par ordre de performance :
3. Sora (ChatGPT et Microsoft Copilot)
Sora est l'outil de génération vidéo d'OpenAI. ChatGPT ne peut pas générer de vidéos lui-même, mais il vous redirige vers Sora pour effectuer le travail. Microsoft Copilot permet de générer des vidéos directement depuis son interface, mais cette fonctionnalité est également optimisée par Sora. Pour utiliser Sora, que ce soit directement sur la plateforme ou via Microsoft Copilot, vous devez souscrire à un abonnement premium, qui coûte 19,99 $ par mois.
J'ai généré cette vidéo directement dans Sora et j'ai été assez déçu du résultat. La vidéo est d'une qualité exceptionnelle et semble très réaliste : le sujet est net et l'arrière-plan est flou, mais l'action reste claire.
Cependant, bien que le décor et l'ambiance soient corrects, le sujet ne fait pas exactement ce que je lui ai demandé, ce qui signifie qu'il a complètement raté sa cible. De plus, on dirait que le sujet ne regarde pas l'écran de son ordinateur portable au début de la vidéo, mais qu'il regarde au-delà.
Malgré la haute qualité de cette vidéo, il est difficile de lui attribuer la couronne ici étant donné que l'invite n'a pas été suivie.
2. Grok
Avant de juger la vidéo de Grok, il est important de noter que Grok est le seul outil de génération vidéo basé sur l'IA disponible gratuitement. Bien qu'un compte soit nécessaire pour générer des vidéos, il n'est pas nécessaire de souscrire à un abonnement payant.
La vidéo a parfaitement suivi le message, l'arrière-plan et l'ambiance étant clairement ceux d'un bureau. Le sujet regarde la caméra, fait un signe de la main et a le nombre correct de doigts, mais on peut voir un léger bug. Il est clair que la vidéo est générée par l'IA grâce à un étrange filtre de lissage superposé.
Même si cette vidéo n'était pas la meilleure de celles que j'ai créées, c'était la seule que j'ai pu créer gratuitement. De plus, elle était meilleure que l'une des alternatives, Sora, car elle suivait parfaitement les instructions.
1. Veo 3 (Google Gemini)
Pour générer une vidéo avec Google Gemini, vous devez accéder à Veo 3. L'utilisation de Veo 3 est payante. Un mois d'essai gratuit est disponible, mais le coût est de 19,99 $ pour les clients payants. Une fois abonné, vous pouvez demander à Gemini de générer des vidéos pour vous.
La vidéo générée par Veo 3 était clairement au top. La qualité était exceptionnelle, l'arrière-plan étant flou et le sujet clairement cadré. L'ambiance et le décor étaient parfaits, comme le voulait le message : il paraissait très tendu et concentré lorsqu'il utilisait son ordinateur portable, mais souriait et semblait heureux lorsqu'il regardait la caméra.
Lorsqu'il fait signe à la caméra, les mains et les doigts paraissent très réalistes, sans aucun bug ni hallucination. Cet extrait pourrait tout droit sortir d'une vidéo marketing ou d'une publicité télévisée, tant il est réaliste et suit fidèlement les instructions.
Veo 3 remporte la palme, avec la vidéo la plus claire et la plus nette, sans aucun problème. Cependant, Grok a tout de même créé une excellente vidéo et était entièrement gratuit, ce qui en fait une excellente option pour ceux qui ne souhaitent pas payer pour un outil d'IA.