ChatGPT dévoile Sora avec une génération de vidéo AI jusqu’à 20 secondes

OpenAI promet de lancer son modèle de générateur vidéo de nouvelle génération, Sora, depuis février . Lundi, la société a finalement publié une version fonctionnelle dans le cadre de son événement « 12 Days of OpenAI ».

"Il s'agit d'un élément essentiel de notre feuille de route AGI", a déclaré Sam Altman, PDG d'OpenAI, lors de la diffusion en direct de l'entreprise.

Selon l'équipe OpenAI, Sora sera mis à la disposition des abonnés Plus et Pro aux États-Unis et dans le monde à partir de lundi après-midi.

YouTuber Marquis Brownlee aurait eu un accès anticipé au générateur vidéo et aurait publié une brève critique sur sa chaîne lundi matin. Sora ne semble pas être construit sur GPT-4 , comme le sont pratiquement tous les autres outils génératifs d'OpenAI. Le modèle n'est pas disponible via le site Web standard ChatGPT, mais via Sora.com (qui n'est toujours pas en ligne au moment de la publication de cet article).

Le modèle est capable de générer des vidéos dans des résolutions allant de 480p à 1080p d'une durée de 5 à 20 secondes, à partir d'invites textuelles ou d'images de référence. Il est également capable d'éditer et d'étendre des clips vidéo existants. Les abonnés ChatGPT Plus auront droit à jusqu'à 50 générations de clips jusqu'à 720p par mois, et à moins de vidéos à des résolutions plus élevées, chacune d'une durée de cinq secondes. Les utilisateurs professionnels auront droit à des générations illimitées à toutes les résolutions et durées jusqu'à 20 secondes. En plus des outils d'édition, Sora propose également une fonctionnalité « storyboard » qui permettra aux créateurs de combiner plusieurs invites en une seule scène cinématographique.

Brownlee note que le modèle a besoin de « quelques minutes » pour générer un clip 1080p, mais note « c'est aussi, comme en ce moment, quand presque personne d'autre ne l'utilise. Je me demande en quelque sorte combien de temps cela prendra lorsque tout le monde pourra l'utiliser. Brownlee souligne également que le modèle a beaucoup de difficulté à générer correctement les jambes et leurs mouvements, les jambes avant et arrière échangeant leurs positions de manière peu naturelle et incompréhensible.

Contrairement à Grok 2 , Sora limitera ce que ses utilisateurs peuvent créer et interdira explicitement la génération de sujets protégés par le droit d'auteur, les personnes de moins de 18 ans et tout ce qui contient de la violence ou des « thèmes explicites ».

Malgré la position de leader d'OpenAI dans l'industrie de l'IA, Sora a été en proie à des retards tout au long de son développement, permettant à des concurrents tels que le Gen-3 alpha de Runway , les modèles Kling de Kuaishou Technology et Movie Gen de Meta de le devancer sur le marché. Sora a également été récemment (bien que brièvement) divulgué publiquement par un groupe de bêta-testeurs, qui ont accusé la société de « laver l'art » des capacités du modèle.