Un premier aperçu des nouveaux outils de génération vidéo IA d’Adobe
Adobe a présenté en avant-première ses prochains outils d'IA vidéo, qui font partie du modèle vidéo Firefly annoncé par la société en avril, dans une publication YouTube récemment publiée. Les fonctionnalités (et le modèle) devraient arriver d'ici la fin de l'année et être disponibles à la fois sur l'application bêta Premiere Pro, ainsi que sur un site Web gratuit.
La société a mis en avant trois nouvelles fonctionnalités qui sont actuellement en version bêta privée mais qui seront prêtes à être publiées plus tard cette année : Generative Extend, Text to Video et Image to Video. Generative Extend allongera n'importe quelle vidéo d'entrée jusqu'à deux secondes, tandis que les fonctions Texte et Image en vidéo permettent aux utilisateurs de générer des clips haute définition d'une durée de cinq secondes à l'aide d'invites de mots et d'images.
Vous pouvez ensuite éditer et modifier ces vidéos, en ajustant les commandes de la caméra pour modifier les angles de la caméra, leur mouvement et la distance de prise de vue. Et contrairement à Grok , les garde-fous de Firefly bloqueront la génération de contenu incluant de la nudité, des drogues et de l'alcool.
Generative Extend arrivera plus tard cette année dans le cadre de la version bêta de Premiere Pro, tandis que Text and Image to Video sera disponible sur le site Web de Firefly. Les deux derniers devraient être disponibles pour les utilisateurs du niveau gratuit, bien que probablement avec des limites d'utilisation. La société aurait l'intention d'intégrer à terme les fonctionnalités de génération vidéo dans le reste de ses applications Creative Cloud, Experience Cloud et Adobe Express.
Adobe considère les générations d'images et de vidéos de Firefly comme « commercialement sûres », le modèle ayant été formé exclusivement sur du contenu sous licence, du domaine public et d'Adobe Stock.
D'après la vidéo teaser ci-dessus, les prochaines capacités vidéo de Firefly semblent équivalentes à celles de Sora d'OpenAI (lui-même encore inédit), de Kling de Kuaishou Technology et du modèle Gen-3 Alpha de Runay. Cela semble certainement bien meilleur, et beaucoup moins hallucinant, que ce que peut produire la multitude de générateurs vidéo gratuits actuellement disponibles sur Internet .
Midjourney travaillerait également sur un modèle texte-vidéo. Le PDG et fondateur David Holz, lors d'une session Discord « Office Hour » en décembre 2023, a annoncé que le modèle serait publié dans « quelques mois », bien qu'aucune mise à jour n'ait été publiée depuis lors.