Des vidéos IA produites en quelques secondes sont disponibles ! Je l’ai utilisée pour créer le Labubu le plus magique, et même les débutants qui ne savent pas écrire de sujets peuvent l’utiliser en quelques secondes.

Cette année, vous pouvez voir divers maîtres de la vidéo IA inonder l'écran presque tous les jours, comme Ultraman contre Pomask, Snow King contre Oriental Pearl, la découpe de métal et de verre ASMR… Cela donne des démangeaisons aux gens.

Mais en l'essayant, on se rend compte que c'est du pur jeu d'enfant, et que le prix est exorbitant. Les heures d'attente sont monnaie courante, les points s'épuisent plus vite que le papier, et les vidéos qui en résultent présentent des personnages déformés, des graphismes étranges, ou ignorent tout simplement vos instructions.

Face à l'"assassin vidéo IA", il y a vraiment un "Roi des Parchemins" qui se lève .

PixVerse, devenu populaire l'année dernière avec les « effets spéciaux Venom », a discrètement publié aujourd'hui un grand mouvement – PixVerse V5 .

Cette fois, ils ont affirmé avoir réalisé un travail difficile de « génération en temps quasi réel », en optimisant de manière exhaustive la dynamique, la clarté, la cohérence et les capacités de compréhension des commandes.

▲ Page d'accueil de PixVerse Chine

PixVerse V5 n'est pas seulement une mise à jour mineure, ils ont sorti trois plats durs :

1. Génération rapide
Cela a toujours été le point fort de pixVerse . Grâce à une technologie de pointe, ils ont compressé la génération vidéo au « second niveau ». Un court-métrage 360p peut être produit en 5 secondes et une vidéo HD 1080p en 1 minute .

2. Moins semblable à l'IA
La V5 exploite des données esthétiques étendues et l'ajustement des préférences humaines (RLHF) pour améliorer la compréhension du modèle, tant sur le plan esthétique que sur le plan du réalisme. Cela améliore considérablement les mouvements complexes des personnages et le réalisme des ombres et des lumières, produisant des images plus proches de la réalité.

3. Viser et photographier <br /> Ils utilisent la technologie « espace fonctionnel unifié » pour résoudre le problème récurrent de « l'IA qui ne comprend pas le langage humain ». En termes simples, que vous lui fournissiez une phrase, une image ou une vidéo de référence, elle peut comprendre plus précisément votre intention , permettant une créativité multimodale complexe avec des images, du texte et des vidéos, vous offrant ainsi un contrôle précis.

Cela étant dit, je ne me vante pas, mais j'ai tout de suite la licence de test bêta, donc je vais essayer.

Ridiculement rapide, le prix est touchant

Rapide est la première impression que me donne le V5.

Lors de tests réels, une vidéo 360p de 8 secondes avec son prend moins de 30 secondes entre la mise en file d'attente et la fin du processus, y compris le temps de mise en file d'attente et le temps de génération ; tandis qu'une vidéo ultra-haute définition 1080p prend un peu plus de temps, mais dure environ 2 minutes.

▲ En comparant avec la vidéo générée par Keling, le temps d'attente est de 3 heures

Outre sa rapidité incroyable, V5 est également incroyablement abordable . Connectez-vous quotidiennement pour gagner 60 points (créer une vidéo silencieuse 360p de 5 secondes ne coûte que 20 points). De nombreuses options d'abonnement permettent de réduire considérablement le coût des cartes à tirer.

À titre de comparaison, Keling offre 166 points par mois, et la création d'une vidéo standard de 5 secondes coûte également 20 points. Actuellement, l'ajout d'effets sonores à Keling est gratuit, tandis que PixVerse nécessite 10 points supplémentaires.

PixVerse V5 offre une solution élégante aux deux principaux problèmes que sont le temps et l'argent . Mais qu'en est-il de la qualité, pourtant essentielle ?

Test de résistance : de « l'ouverture de la boîte aveugle » à « l'examen du livre semi-ouvert »

Allons droit au but et testons sa véritable qualité avec quelques cas populaires.

Commençons par une chose simple : générer une vue aérienne de la tour de Guangzhou.

Image : Images aériennes cinématographiques prises par drone, focalisées sur la tour de Canton. Filmées sur pellicule Kodak 35 mm avec grain. Images aériennes dynamiques avec mouvements de caméra circulaires. Préserver la composition, le cadrage et les détails structurels de l'image de référence.

PixVerse est très performant et rapide. De plus, contrairement à Veo 3, qui ne génère actuellement que des vidéos 16:9, PixVerse adapte automatiquement la vidéo générée au format d'image de l'image téléchargée.

Ensuite, nous augmenterons la difficulté pour tester la cohérence des personnages et la capacité de compréhension de la scène.

Nano-banane a connu un grand succès ces derniers temps. Nous l'avons utilisé pour générer de nombreuses photos intéressantes il y a quelques jours. De nombreux utilisateurs des réseaux sociaux l'ont également utilisé pour créer une histoire complète, grâce à sa forte cohérence entre les personnages, l'environnement, le style photographique et le contenu.

Nous avons trouvé quelques ensembles de photos intéressants pour voir si PixVerse V5 pouvait générer une vidéo.

D'abord, il y avait ces deux filles qui jouaient au billard, elles ont commencé devant en prenant des selfies, puis je voulais qu'elles viennent à l'arrière, prennent leurs queues de billard et commencent à jouer.

Le résultat était quelque peu surprenant. La scène était soignée, et les mouvements et expressions de la marche étaient également impeccables. Mais… ils ont inexplicablement intégré une fille de la rue !

Il semble que l'IA peine encore à comprendre les interactions complexes entre deux personnes et les relations spatiales. Cependant, comparée à la version 4.5 (qui générait auparavant des ralentis incompréhensibles), la version 5 comprend au moins mieux l'intention de « marcher ».

La nanobanane est également utilisée depuis peu pour réaliser des figurines. Grâce à ces images, nous pouvons créer de nombreuses vidéos intéressantes.

Astuce : Créez un modèle de personnage à partir de cette photo. Placez une boîte avec l'image du personnage imprimée dessus et un écran d'ordinateur affichant le processus de modélisation dans Blender. Ajoutez un socle rond en plastique devant la boîte pour que le personnage puisse se tenir debout. Utilisez du PVC transparent et installez la scène en intérieur si possible.

Nous avons d'abord utilisé de la nano-banane pour fabriquer un labubu qui semblait avoir été imprimé en 3D par nous-mêmes, puis nous avons envoyé cette image à PixVerse.

▲ Invite : La silhouette marron commence à explorer le bureau. Elle marche vers la gauche, regarde vers la droite, puis saute dans la boîte à côté d'elle. Ne déplacez pas le labubu sur la boîte, maintenez-le immobile. L'animation 3D affichée sur l'ordinateur est en mode aperçu et pivote automatiquement.

Nous avons également utilisé PixVerse pour tester la vidéo de vision nocturne par IA, récemment très populaire et convaincante. Franchement, l'effet est incroyablement convaincant. Le chaton, perché sur le dos de l'ours, sautille prudemment d'avant en arrière ; son contact avec l'ours et ses bonds semblent authentiques.

Si la gestion de mouvements aussi simples n'est pas assez difficile, nous lui donnerons directement un gros plan de ses pas de skateboard et le laisserons réaliser ces mouvements de skateboard complexes.

PixVerse V5 génère également des mouvements de pied précis et sans erreur. Nous avons testé avec la version 4.5, et parfois les chaussures étaient portées à l'envers, et il y avait des choses bizarres : le skateboard avait l'air très chaud et les joueurs ne savaient pas où placer leurs pieds.

On peut affirmer sans se tromper que PixVerse a connu de nombreuses améliorations en termes de qualité de production. Globalement, la version V5 a connu des améliorations significatives en termes de cohérence et de réalisme, donnant un rendu plus proche de la réalité que d'images trop inspirées par l'IA.

Encore une chose et assistant de création d'agent

En plus de la conversion d'image en vidéo, PixVerse V5 fournit également un ensemble de fonctionnalités sophistiquées mais pratiques telles que la continuation, le multi-agent et l'intelligence des agents.

Mon préféré est « Continuation ». Actuellement, la plupart des vidéos IA ne peuvent générer que quelques secondes à la fois. Pour créer une longue vidéo, il faut capturer manuellement la dernière image et la régénérer, ce qui est très fastidieux.

La fonction de réécriture permet de prolonger la vidéo de manière relativement fluide et prend en charge les vidéos de moins de 30 secondes. Je l'ai utilisée pour réaliser une courte vidéo « Cat Dreaming of Being a Chef », et le résultat est très mignon.

Regardez le sourire satisfait du chaton à la fin !

Pour répondre au défi majeur de l'impossibilité d'écrire des mots clés, V5 a également lancé un Agent . Il s'agit d'une véritable bibliothèque de modèles créatifs. Il vous suffit de trouver un modèle qui vous convient, de saisir des mots-clés, et l'Agent effectuera automatiquement l'ensemble du processus, de la compréhension de l'intention à la génération du script et à la création de la vidéo.

Actuellement, PixVerse propose plus de dix projets intégrés à son IA. Parmi ceux-ci, on compte le trampoline lapin, récemment très populaire, la possibilité de modifier la matière d'un personnage ou d'un objet, de combiner plusieurs objets pour créer une nouvelle espèce, et même une IA permettant à votre animal de compagnie de se déguiser en cafard et de faire du ballet.

J'ai téléchargé la photo de Labubu que nous utilisions auparavant. Le processus de l'agent intelligent est toujours différent du modèle. Le modèle applique simplement un ensemble de mots d'invite, tandis que l'agent intelligent PixVerse automatise toutes les opérations comme nous utilisons l'agent ChatGPT, ce qui nous évite de générer d'abord les images dans Nano Banana.

Même s'il fait parfois des erreurs, comme confondre ma figurine Labubu avec une figurine portant un costume de cafard marron (je suis désolé, Labubu !).

Mais ce ballet bien fait démontre le potentiel de la fonctionnalité Agent – ​​il abaisse considérablement le seuil pour que les gens ordinaires puissent réaliser leur créativité.

Actuellement, PixVerse V5 et l'assistant de création d'agent ont été entièrement lancés sur le Web, l'application et l'API de plate-forme ouverte de la version internationale de PixVerse (https://app.pixverse.ai/) et de la version nationale de Pai Wo AI (https://pai.video/).

La vidéo IA est finalement passée d'un « gros pari » à une « loterie à gratter »

Après une expérience complète, cette mise à jour de PixVerse V5 peut être clairement résumée en deux mots : plus rapide et meilleur .

Ce n'est peut-être pas encore le modèle vidéo le plus parfait, et il est encore difficile à appréhender lors d'interactions complexes entre plusieurs personnes. Mais il me rappelle les images brutes de Doubao. La qualité n'est peut-être pas aussi bonne que celle de Midjourney, mais il est gratuit, propose un contenu riche et complet. Vous pouvez l'essayer.

▲ Doubao peut générer 20 images à la fois

PixVerse V5 suit cette voie, changeant complètement l'état d'esprit créatif avec sa vitesse de génération en temps quasi réel et ses coûts d'essais et d'erreurs extrêmement faibles.

Auparavant, attendre des heures dans la file d'attente, épuiser d'innombrables points et finalement obtenir une boîte aveugle insatisfaisante était une expérience pénible et frustrante. Aujourd'hui, les résultats sont visibles en quelques secondes et, en cas d'insatisfaction, vous pouvez simplement réessayer. L'expérience ressemble davantage à un ticket de loterie à gratter : facile, fréquent et rempli d'une attente constante du prochain ticket gagnant.

De ce point de vue, la principale compétitivité de PixVerse V5 n’est peut-être pas la qualité des vidéos qu’il génère, mais plutôt le fait qu’il offre une expérience de création à haute fréquence et sans contrainte .

Lorsque le coût d’ouverture d’une boîte aveugle deviendra suffisamment bas et lorsque l’instabilité de l’IA ne vous fera plus regretter votre temps et votre argent, la création de vidéos par l’IA passera véritablement de l’autel de quelques grands noms à la vie quotidienne de chacun d’entre nous.

Texte|Li Chaofan et Zhang Zihao

Lien original : https://mp.weixin.qq.com/s/Q0_1JM-2tJa9VyMP0LYUBQ

#Bienvenue pour suivre le compte public officiel WeChat d'iFaner : iFaner (ID WeChat : ifanr), où du contenu plus passionnant vous sera présenté dès que possible.

iFanr | Lien original · Voir les commentaires · Sina Weibo