Tout à l’heure, la bombe royale d’OpenAI, Sora, a été officiellement lancée ! Le site Web est si populaire qu’il plante, Ultraman ferme d’urgence l’enregistrement des utilisateurs
Tout à l'heure, OpenAI Sora a officiellement fait ses débuts.
Cette conférence de presse a poursuivi le style rapide du « court drame », qui a duré environ 20 minutes et a été animé par le PDG Sam Altman, le directeur de Sora Bill Peebles et d'autres.
OpenAI a déclaré sur le
Il est intéressant de noter qu'en raison de la popularité de Sora, un grand nombre d'utilisateurs ont afflué vers le site Web d'expérience, provoquant le crash du site Web et l'arrêt de l'inscription et de la connexion. Le service médiocre permet également à Altman d'apaiser les utilisateurs de la plateforme X :
« En raison d'une demande plus élevée que prévu, nous devrons fermer par intermittence les inscriptions de nouveaux utilisateurs et la vitesse à laquelle le contenu est généré ralentira pendant un certain temps. Nous travaillons dur !
Ci-joint l'adresse de l'expérience : Sora.com
L'interface Sora révélée, a 6 fonctions de niveau divin, pas besoin d'apprendre l'édition ?
Semblable à l'interface Web de Midjourney, Sora possède également sa propre interface utilisateur distincte. Les utilisateurs peuvent non seulement organiser et parcourir les vidéos générées, mais également afficher des astuces et du contenu sélectionné par d'autres utilisateurs.
Dans la fonction « Bibliothèque », les utilisateurs peuvent enregistrer leurs mots d'invite préférés ou utiles pour une utilisation ultérieure. Et les mots d'invite enregistrés peuvent être visualisés ou modifiés selon les besoins, ce qui améliorera sans aucun doute considérablement l'efficacité des utilisateurs qui doivent créer à plusieurs reprises un contenu similaire.
En termes de flux de travail, la fonction d'édition de Sora est un point fort important qui le distingue des autres produits concurrents.
Par exemple, dans la fonction Remix, les utilisateurs peuvent éditer des vidéos à l'aide d'invites en langage purement naturel et contrôler le degré de changement généré via de simples options et curseurs de « force ».
La fonction Re-cut peut identifier intelligemment la meilleure image et prendre en charge l’extension de la scène dans n’importe quelle direction.
La fonction Storyboard de Sora est similaire à un éditeur vidéo. Elle peut regrouper plusieurs mots d'invite pour générer une vidéo plus longue et gérer facilement des scènes complexes en plusieurs étapes.
Avec les fonctions Loop et Blend, les utilisateurs peuvent également créer des vidéos en boucle transparente et mélanger parfaitement différents clips, tandis que la fonction Style presets peut prédéfinir et ajuster les styles générés.
En termes de spécifications techniques, Sora prend en charge la génération vidéo de 5 à 20 secondes et est compatible avec les formats d'image grand public tels que 1:1 et 9:16. La vitesse de génération est désormais considérablement améliorée par rapport aux versions précédentes.
De plus, il y a quelques détails auxquels il faut prêter attention.
OpenAI adopte une stratégie de tarification de points flexible. Le nombre de points varie en fonction de la résolution et de la durée. Si vous êtes déjà membre ChatGPT Plus et Pro, vous pouvez l'utiliser sans frais supplémentaires.
Par exemple, générer une vidéo 480p, 5s nécessite 25 points, et générer une vidéo 480p, 20s nécessite 150 points.
De plus, si vous utilisez des fonctions telles que Re-cut, Remix, Blend ou Loop, et que le travail généré dépasse 5 secondes, vos points seront déduits en plus. Plus vous en utilisez, plus vous dépenserez d'heures supplémentaires. car les heures supplémentaires vous coûteront également de l’argent.
Pour les abonnés, le forfait ChatGPT Plus à 20 $ offre 50 crédits vidéo prioritaires (1 000 points), prenant en charge une résolution jusqu'à 720p et une durée de 5 secondes.
Le forfait ChatGPT Pro à 200 $ offre jusqu'à 500 vidéos prioritaires (10 000 points), prend en charge une résolution 1080p, une durée de 20 secondes, 5 générations simultanées et aucune sortie de filigrane.
OpenAI développe également différents modèles de tarification pour différents types d'utilisateurs, qui seront lancés au début de l'année prochaine.
À propos, Sora ne prend actuellement pas en charge les versions Team, Enterprise et Edu de ChatGPT, et n'est pas ouvert aux utilisateurs de moins de 18 ans. À ce stade, les utilisateurs peuvent accéder à Sora partout où ChatGPT est disponible, à l'exception des régions telles que le Royaume-Uni, la Suisse et l'Union européenne.
Le test actuel de Sora révèle ses plus gros défauts, mais ces scènes sont comparables au niveau professionnel
Le célèbre blogueur Marques Brownlee a utilisé Sora une semaine à l'avance et a partagé son expérience sur YouTube.
Il a souligné que le produit présente encore certaines limites.
En termes de simulation physique, la compréhension du mouvement des objets par le modèle n'est pas assez approfondie et des problèmes tels que des mouvements non naturels et la disparition soudaine d'objets surviennent souvent. Surtout lorsqu'il s'agit d'objets avec des mouvements de jambes, les positions des jambes avant et arrière sont souvent confondues, ce qui donne un aspect peu naturel aux mouvements.
Ou bien, certains résultats de génération vidéo peuvent ressembler à un ralenti, tandis que d'autres parties de la vidéo sont lues à vitesse normale. Cette « maladresse » est facilement perceptible à l'œil nu. Bref, Sora n'a toujours pas résolu son vieux problème, le manque de compréhension des lois du monde physique.
De plus, Sora n'a pas réussi à résoudre le problème de la génération de texte, ce qui a entraîné une confusion fréquente du texte. Cependant, le style d'édition, le mouvement de la barre de défilement du texte et la génération du style d'ancrage des actualités sont particulièrement réalistes.
Cependant, il y a pas mal de scènes dans lesquelles Sora est doué.
Par exemple, Sora excelle dans le traitement des prises de vue de paysages et peut produire des images aériennes de drones qui rivalisent avec les images professionnelles, mais il fonctionne également moins bien avec les styles de dessins animés et d'animation stop-motion.
En termes de performances, une vidéo 360p de 5 secondes peut généralement être générée en 20 secondes.
Cependant, lorsqu'il s'agit de 1080p ou de mots d'invite complexes, le temps de génération peut être prolongé jusqu'à quelques minutes, mais avec l'afflux d'un grand nombre d'utilisateurs aujourd'hui, la vitesse de génération est évidemment inférieure à un demi-battement.
De nombreux internautes ont également découvert Sora pour la première fois. Par exemple, l'internaute @bennash voulait générer une vidéo, mais le rendu a pris 22 minutes sans succès. Le site Web a même cessé de s'inscrire et de se connecter pendant un certain temps.
Le blogueur @nickfloats a commenté que lorsque Sora convertissait des images en vidéos, même si certains effets visuels spécifiques n'étaient pas conservés, l'effet global de conversion était « clair et satisfaisant ».
Sora peut-il devenir la prochaine « poule d’or » d’OpenAI ?
La carte système Sora répertorie également certains détails auxquels il convient de prêter attention.
Les responsables d'OpenAI estiment que Sora fournit une base pour des modèles capables de comprendre et de simuler le monde réel et constituera une étape importante dans la réalisation de l'intelligence artificielle générale (AGI).
Comme mentionné dans le blog officiel, Sora est un modèle de diffusion qui part d'une vidéo de base qui ressemble à du bruit statique et supprime progressivement le bruit et se transforme en vidéo finale. En traitant plusieurs images simultanément, le modèle résout avec succès un problème difficile : garantir que l'objet reste cohérent dans la vidéo, même s'il quitte temporairement le champ de vision.
Semblable au modèle GPT, Sora adopte l'architecture Transformer.
Sora utilise la technologie d'annotation de DALL·E 3, qui génère des étiquettes hautement descriptives pour les données d'entraînement visuel. En conséquence, le modèle est capable de générer avec plus de précision du contenu vidéo basé sur les instructions textuelles de l'utilisateur.
En plus de pouvoir générer des vidéos à partir de commandes de texte uniquement, Sora est capable de générer des vidéos à partir d'images statiques existantes, animant le contenu de l'image avec précision et attention aux détails. Le modèle peut également agrandir ou remplir les images manquantes des vidéos existantes.
Afin de garantir le déploiement sécurisé de Sora, OpenAI l'a renforcé sur la base de l'expérience de sécurité de DALL·E dans le déploiement de ChatGPT et d'API, ainsi que des mesures de protection de sécurité d'autres produits OpenAI (tels que ChatGPT).
- Utiliser l'image d'une autre personne sans sa permission, et les représentations de véritables mineurs sont interdites ;
- Créer du contenu illégal ou portant atteinte aux droits de propriété intellectuelle ;
- Interdire les contenus préjudiciables, tels que les images intimes non consensuelles, les contenus destinés à intimider, harceler ou diffamer, ou les contenus destinés à propager la violence, la haine ou à causer de la détresse à autrui ;
- Créer et distribuer du contenu destiné à frauder, frauder ou induire autrui en erreur.
Toutes les vidéos générées par Sora sont accompagnées de métadonnées C2PA qui identifient la vidéo comme provenant de Sora, augmentant ainsi la transparence et pouvant être utilisées pour vérifier son origine.
Contrairement à Flux, qui s'appuyait auparavant sur de vrais portraits pour faire sa marque, Sora a fixé des normes de révision particulièrement strictes pour le téléchargement de contenu contenant des personnes. Il n'est actuellement fourni qu'à titre de fonction pilote à un petit nombre de premiers testeurs, et le contenu contenant de la nudité est bloqué. .
Il y a plus de six mois, Sora, qui a fait ses débuts, a été acclamée sur Internet.
Cependant, si nous ne pouvions pas crier « la réalité n'existe plus » à un groupe de démos il y a un an, alors sous le baptême continu de divers modèles vidéo au pays et à l'étranger, il est difficile pour notre appétit déjà développé d'être attiré par le même produits.
Ce changement d’attitude découle d’un simple fait.
Lorsque l’IA passera de « à peine utilisable » à « peut être utilisée à grande échelle », les attentes des utilisateurs augmenteront également, passant de « est-ce possible » à « dans quelle mesure cela peut-il être fait ».
Heureusement, Sora n'est pas resté immobile sous les applaudissements. Grâce à une coopération approfondie avec les artistes, ils ont apporté des améliorations significatives dans le domaine du flux de travail. Re-cut, Remix, Storyboard et d'autres fonctions sont très utiles.
L'existence de la partie A et de la partie B détermine que la communication dans le flux de travail est toujours une nécessité. Ce que l'IA peut faire, c'est rendre cette communication plus efficace. La valeur de Sora ne réside pas dans ce qu'elle peut faire, mais dans le fait de permettre aux créateurs de s'en échapper. détails techniques et véritable retour à l'essence de la créativité.
Dans le même temps, le plan d'abonnement ChatGPT Pro à 200 $ qui a suscité de nombreuses discussions la semaine dernière a désormais un prix plus raisonnable. Le plan prend également en charge un accès illimité à Sora. Cette synergie de produits devrait également stimuler des scénarios d'application et dépasser largement les attentes. valeur commerciale.
Au vu de la situation actuelle, l’argent réel des utilisateurs ne sera jamais falsifié.
Keling AI a généré des résultats exceptionnels de plusieurs dizaines de millions de revenus mensuels. Le potentiel de cet océan bleu se dessine déjà. Pour OpenAI, qui en est encore au stade de « brûler de l'argent », Sora devrait devenir un autre œuf d'or après ChatGPT. .
Lorsque Sora passera de « utilisable » à « facile à utiliser » puis à « merveilleux », peut-être un jour dans le futur, nous découvrirons que ce qui n'existe pas réellement n'est pas la réalité, mais la fin de la créativité humaine.
# Bienvenue pour suivre le compte public officiel WeChat d'Aifaner : Aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo