Comment un humain déguisé en Sora est-il devenu un mot de passe pour la circulation ?

24 février 2024 Hibou Gourou

Will Smith a encore une fois contribué à un mème, la dernière fois c'était la gifle d'Oscar, cette fois c'était du spaghetti mukbang.

En mars 2023, un internaute de Reddit a utilisé l'IA pour créer une vidéo amusante de Will Smith mangeant des nouilles. Son visage était hideux et ses traits étaient déformés, ce qui faisait perdre l'appétit aux gens.

En février 2024, deux jours après la sortie de Sora par OpenAI, Will Smith a publié une vidéo comparative de manger des nouilles sur Instagram. Il est devenu plus beau et ses mouvements alimentaires sont devenus plus décents.

Pensez-vous que la seconde moitié de la vidéo a été générée par Sora ? Non, les nouilles ont été mangées par Will Smith lui-même, et il a fait tout le travail.

Le pied avant a été choqué par la démonstration officielle de Sora, et le pied arrière a vu cette dynamique, et les gens ont commencé à douter de qui je suis, d'où je viens et où je vais.

Bien que Sora ne soit pas encore ouvert au public, Internet est devenu de plus en plus ridicule : les vidéos d'IA se rapprochent de plus en plus de la réalité, et de plus en plus de vidéos réelles sont de fausses IA.

Je ne sais pas si cela peut tuer Hollywood, Sora a d'abord brûlé mon tronc cérébral.

Nous avons plus ou moins vu les vidéos des performances stables de Sora. Dans le même temps, OpenAI a également publié généreusement des vidéos de retournement. Certaines d'entre elles sont plus populaires sur les réseaux sociaux, notamment l'invite suivante : « Les archéologues ont trouvé une poignée de voitures dans le désert. Une chaise en plastique ordinaire, soigneusement déterrée et époussetée" vidéo.

La chaise semble être une créature respirante et pensante venue d'un autre monde, qui n'est pas liée par la gravité ou le pouvoir humain. Elle apparaît et se transforme à partir de rien, et emporte même secrètement un être humain. Ce n’est peut-être pas la faute de l’IA : après tout, le mot d’invite n’indique pas s’ils sont sur terre.

Si la vidéo était distribuée sur les réseaux sociaux, elle pourrait être étiquetée avec : #streamofdrivenness, #surrealism, #preciousvideoofearlyhumankindtamingthewildchair…

OpenAI a sérieusement expliqué pourquoi le bug s'est produit : Sora n'a pas réussi à modéliser la chaise comme un objet rigide, c'est-à-dire un objet qui ne change pas de forme et de volume sous l'action de forces externes, donc l'interaction physique était inexacte.

La vidéo de Sora montrant casser une tasse semble être un art qui ne peut être vu qu'après avoir mangé des champignons vénéneux. La tasse se déplace automatiquement sans aucun vent. Le liquide jaillit du verre comme de la gelée avant de se briser. Chaque étape est inattendue.

De plus, il y a des athlètes qui utilisent des tapis roulants à l'envers, des bougies d'anniversaire qui ne peuvent pas être soufflées, des loups qui apparaissent et disparaissent de nulle part… L'IA a fait par inadvertance des choses que ni le cerveau humain ni les effets spéciaux ne peuvent imaginer.

Depuis l'annonce officielle de Sora, les magnats de l'IA se demandent si elle peut comprendre le monde physique. Le rapport technique d'OpenAI n'a pas pris de position claire, mais a seulement mentionné que Sora peut simuler certains aspects des personnes, des animaux et de l'environnement dans le monde réel. , mais il peut être difficile de simuler avec précision les principes physiques de scènes complexes, comme confondre gauche et droite et ne laisser aucune marque de morsure après avoir mordu un cookie.

Même si l’IA n’a pas encore évolué jusqu’à un état complet, autant utiliser votre imagination. Les vidéos d'IA qui ne sont pas encore stables peuvent être utilisées comme bibliothèque de matériaux pour des thèmes surnaturels, de suspense, d'horreur et fantastiques, fournissant ainsi une nouvelle inspiration pour la création. Plus vous essayez de soulever le cercueil de Newton, plus votre performance devient artistique.

Tout comme « creuser des chaises » et « casser des tasses », ils peuvent déjà être utilisés dans des MV, des publicités, des films et des jeux. Cela ressemble toujours à une grosse production. Même si l'effet est étrange, il est étonnamment fluide. Il bat Station B. Série « Appris cinq ans en animation ».

Même si le contenu était si magique, certains internautes ont encore hésité une seconde : "Si le bug n'était pas révélé, je douterais qu'il ait été filmé." "Est-ce un tour de magie ?"

En effet, même la vidéo de retournement de Sora peut encore battre ses « prédécesseurs » tels que Pika et Runway en termes de durée, de qualité d'image et de stabilité.

Alors que d'autres outils génèrent des vidéos d'une durée maximale de 3 à 4 secondes et tentent de garder une seule prise de vue aussi stable que possible, Sora augmente la limite supérieure à 1 minute pour obtenir une commutation transparente entre plusieurs prises de vue et maintenir de manière relativement précise la cohérence du sujet principal. et le style visuel de l'image, comme s'il savait s'en servir. Le langage de l'objectif et le rythme narratif racontent des histoires.

À première vue, il semble que de véritables caméras suivent la scène : les personnes, les objets et les scènes se déplacent tous dans un espace tridimensionnel, et le même personnage peut avoir plusieurs perspectives.

▲ Sora peut atteindre plusieurs perspectives.

Certaines personnes plaisantent en disant qu’il s’agit d’un saut des « images animées » aux « vidéos » générées par l’IA.

La vidéo de Sora renversant la voiture peut certainement être comptée parmi elles. C'est comme écrire un tas de code dans le désordre, mais il arrive à fonctionner.

Zhou Hongyi, président de 360, a parlé d'un point intéressant sur Weibo : Sora fonctionne comme un rêve humain. Nous rêverons de choses étranges, mais cela est basé sur ce que nous voyons avec nos yeux et l'expérience accumulée dans la vie. , ce n'est pas nécessaire pour modéliser en 3D et effectuer un rendu image par image comme dans l'industrie du cinéma et de la télévision.

D'un certain point de vue, l'IA générative est en effet comme une machine à rêves, se rapprochant de plus en plus de la façon dont les humains pensent. Elle utilise divers mots d'invite pour créer des réponses raisonnables ou déraisonnables avec probabilité. Peu importe si elle est bonne ou mauvaise, elle sera certainement vous donner une réponse.

En fait, depuis le début de ChatGPT, les gens ont voulu utiliser l'IA pour concrétiser leurs rêves. Il existe de nombreux articles sur Xiaohongshu qui visualisent les rêves. Bien qu'ils ne puissent pas vraiment restaurer l'effet dans l'esprit, ils apportent également des fantômes de l'esprit spirituel. monde dans la réalité.

À l'avenir, Sora pourrait rendre les rêves ou la créativité humaine plus vivants. En saisissant du texte, des images ou des vidéos, vous pouvez ajouter des changements de lumière et d'ombre, ajuster l'angle de l'image et même ajouter des effets sonores en "un seul clic"…

Je ne sais pas si l’élite hollywoodienne perdra son emploi. Les internautes sont déjà impatients de l’essayer. En plus de leur instinct de s’adonner à la pornographie, ils ont aussi une place pour mettre leur imagination.

Les êtres humains qui rient de leur propre échec utilisent l'imitation de Sora comme mot de passe pour la circulation.

En plus de la vidéo du renversement de la voiture, les autres vidéos de Sora sont étonnantes à première vue, mais elles ne résistent pas à l'examen minutieux d'une loupe. Les caractères tronqués sur l’enseigne, la cinquième patte du chat, les faux pas du mannequin…

Les bugs constituent peut-être le dernier mur entre l’IA et la réalité, mais les humains eux-mêmes veulent le faire tomber.

Bien que Sora ne soit pas encore ouverte au public, ceux qui vendent des cours et des chips gagnent de l'argent, et ceux qui s'amusent à jouer des tours ont également trouvé des moyens de pêcher en eaux troubles et ont inventé une nouvelle façon d'attirer le trafic.

Lorsqu'ils ont publié la vidéo sur les réseaux sociaux, ils ont ajouté « généré par Sora » et des invites décentes à la copie, faisant semblant d'être réalisée par l'IA, tout comme Will Smith imitant l'IA en s'imitant lui-même.

De courts blogueurs vidéo de différents circuits y participent. Ceux qui montrent des animaux mignons, jouent à des jeux, des célibataires idoles Amway, font de la publicité pour des produits… ne fournissent-ils vraiment pas d'inspiration pour Sora en matière d'emploi ?

Parmi eux, les plus difficiles à distinguer entre le vrai et le faux sont sans aucun doute les films de Bollywood. Les intrigues et les effets spéciaux des films de police indiens sont particulièrement étonnants. Ils sont trop avancés pour les humains et rendent la physique inexistante. Même l'IA doit en tirer des leçons. . .

Sans les gens enthousiastes qui ont ajouté des commentaires et joint un lien YouTube mis en ligne il y a 11 ans pour prouver le caractère pionnier et inhumain des films indiens, personne n'aurait osé en témoigner.

Même le compte officiel de Netflix Inde s'est joint à la fête : il a intercepté un extrait du film anti-britannique indien "RRR" et a prétendu avoir été généré par Sora. Selon l'exagération habituelle des blockbusters indiens, les premières secondes peuvent en effet tromper l'auditoire.

Bien que ces fausses vidéos d'IA soient créées par des humains et que l'IA qui y est mélangée semble ordinaire, l'IA n'est peut-être pas incapable de les imiter.

En confondant l'opinion publique et en s'en prenant à vous-même, le mal est toujours causé par des êtres humains et une chaîne de suspicion est apparue.

Les internautes ont commencé à craindre que lorsque les photos réelles et générées par l'IA ne sont vraiment pas claires, ils puissent avoir des « preuves concluantes » même s'ils n'ont rien fait.

C'est l'intrigue du drame britannique à suspense "Truth Capture": les services de renseignement ont falsifié des vidéos de surveillance afin de condamner des criminels.

Ils estiment que la falsification de vidéos de surveillance ne fait que « reconstituer » des preuves illégales, telles que des écoutes téléphoniques, en preuves juridiques. Des choses se sont produites et les criminels ont commis des crimes.

Mais personne ne sait si les gens qui utilisent la technologie franchiront la ligne et passeront du greffage et du greffage à la création de quelque chose à partir de rien.

L'identification des méthodes de réponse de l'IA peut également être utilisée sous un autre angle comme une astuce pour échapper à la coquille de la cigale dorée.

Parce que l'IA n'est pas douée pour dessiner les mains, il y a eu un mème dans le passé où les criminels portaient de faux doigts pour commettre des crimes. On aurait dit qu'ils avaient six doigts. Cela pourrait calomnier la vidéo de surveillance comme étant générée par l'IA et ne pourrait pas être utilisée comme preuves au tribunal.

L’IA est proche de la réalité, alors que les humains se font passer pour l’IA. L’IA peut également être utilisée pour falsifier des preuves présentées au tribunal et invalider des preuves. Un monde magique où la magie vainc la magie pourrait bien arriver. L’IA ne peut pas encore provoquer activement le chaos, et ce sont les humains eux-mêmes qui peuvent briser la confiance.

L’IA n’est peut-être pas encore capable de simuler le monde, mais elle a déjà affecté notre façon de voir le monde.

Concernant la question de l’IA qui rend plus difficile la distinction entre le vrai et le faux, lorsque nous parlons du changement de visage Deepfake, nous en avons déjà trop parlé. Comment Sora pourrait-il être différent ?

Récemment, OpenAI a fait un geste inattendu : ouvrir un compte TikTok et télécharger les œuvres de Sora.

OpenAI non seulement étiquette soigneusement chaque vidéo générée par l'IA pour éviter que les gens ne confondent la réalité, mais inclut également des mots d'invite.

"Une vidéo réaliste montre un papillon capable de nager sous l'eau à travers un magnifique récif de corail" "Une prise de vue macro d'une feuille montre de minuscules trains se déplaçant dans ses veines" "Une caméra au ras du sol suit de près les fourmis dans la jungle"… …

Ces vidéos sont mélangées au flux d'informations vidéo court et réel et sont accompagnées d'une musique de fond. Si vous ne faites pas attention et faites glisser votre doigt trop vite, cela peut être considéré comme réel.

Les internautes ont demandé, à moitié en plaisantant et à moitié sérieusement, dans la zone de commentaires d'OpenAI : "Vous feriez mieux de créer quelque chose comme un filigrane, sinon l'humanité est condamnée."

Sora n'a pas encore été lancé. En fait, tout le monde suppose que les praticiens du contenu vidéo sont peut-être le groupe de personnes le plus calme car ils sont plus professionnels et comprennent mieux les affaires. La démo de Sora a beaucoup de problèmes avec la cohérence et l'exactitude du contenu. Si cela ne suffit pas et ne répond pas aux exigences précises de la Partie A, il sera difficile d'introduire la technologie dans le processus industriel.

Mais je ne suis pas très optimiste. L’IA a déjà affecté non seulement le vrai et le faux, mais aussi notre façon de voir le monde. Elle ne remplace pas directement tel logiciel de montage, tel scénario ou tel réalisateur.

Le praticien de l'IA @Kwebbelkop spécule qu'OpenAI ne publie actuellement que de courtes vidéos d'IA sur TikTok, éventuellement pour collecter des données utilisateur pertinentes telles que le nombre de vues, affiner le modèle à partir des commentaires humains et même créer une version IA de TikTok à l'avenir.

L'algorithme de vidéo courte est déjà très efficace pour deviner ce que vous aimez. Que se passera-t-il si une IA générative est ajoutée pour rendre le contenu vidéo plus personnalisé ?

À l'avenir, notre expérience de visionnage de films pourrait également subir des changements qualitatifs. Au lieu de s'appuyer sur les cinémas et les médias en streaming, de grands modèles linguistiques et des modèles de génération vidéo peuvent être utilisés pour déterminer le contenu de l'histoire et les files d'attente.

Cependant, les attentes d’OpenAI en matière de produits d’IA ne se limitent certainement pas à discuter avec vous et à réaliser des vidéos : l’ambition la plus profonde est de permettre à l’IA d’apprendre le langage naturel humain et les lois physiques du monde.

Même si cela se limite au domaine de la vidéo, si Sora peut réaliser des films conceptuels approximatifs, c'est déjà très impressionnant. La manière de créer des vidéos, le style du contenu et même nos préférences en matière de contenu peuvent tous être modifiés grâce à l’IA.

En mettant de côté l’IA, le téléphone mobile possédé par presque tout le monde a en réalité affecté la façon dont les vidéos sont tournées et produites, permettant à chacun de devenir le réalisateur de sa propre vie.

Les vidéos de beauté où vous vous maquillez tout en parlant à la caméra, les Vlogs qui montrent des fragments de votre vie personnelle, etc. sont les produits que de nombreux blogueurs peuvent filmer dans leur chambre avec leur téléphone portable sous cette influence. L’explosion des courtes vidéos nous a également habitués de plus en plus à glisser de haut en bas sur nos téléphones portables, nous laissant moins patients et plus distraits.

Bien que par rapport à Sora, les outils de génération vidéo tels que Runway et Pika aient des capacités limitées, certaines personnes les ont combinés avec des outils de génération d'images tels que Midjourney et les ont utilisés pour créer des bandes-annonces de films.

En raison de la mauvaise stabilité, le style vidéo a également été choisi : il s'agit principalement d'un montage rapide, avec une narration, axée sur le rythme et l'impact visuel, mais il manque de dialogues entre personnages et de scènes plus complexes.

▲ Court métrage de science-fiction sur l'IA "Borrowing Time".

En revanche, Sora peut prendre en charge des scènes, des actions de personnages et des interactions plus complexes entre les personnages et le monde environnant. Quelqu'un a utilisé l'exemple de film de Sora, puis a utilisé l'outil vocal d'IA ElevenLabs pour le doubler et a utilisé iMovie pour le monter, afin de créer une "bande-annonce de film" plus fluide qui semble être "un plan jusqu'à la fin".

Les deux types de vidéos que Sora présente au monde extérieur peuvent être grossièrement divisés en deux types : l'un est l'imagination créative, comme des astronautes se tenant sur une planète froide, deux navires pirates se battant dans un café et des personnages de dessins animés dansant du disco. L'autre est proche. à la réalité et à l’exploitation de l’or. La Californie sous la chaleur, les reflets dans les vitres des trains, les extérieurs du Nigeria en 2056…

Le reflet sur la fenêtre du train est très similaire à ce que filmerait un Vlog. La scène extérieure au Nigeria, avec la caméra allant du marché en plein air au paysage urbain, ressemble également beaucoup au plan vide d'une vidéo d'actualité. Quelqu'un a déjà prévu de combiner des personnages numériques avec cette vidéo.

La photographie peut même parfois sembler inutile. Sora peut directement créer une vue plongeante d'une attraction touristique grâce à des mots rapides, ce qui n'est pas très différent des images d'un humain pilotant un drone. Nos yeux et notre cerveau savent à quoi ressemble Santorin, et l’IA le « sait » également, donc c’est à l’IA de faire le travail.

Il y avait une métaphore très intéressante auparavant, ce monde est une immense "Earth Online", un jeu de rôle en ligne massivement multijoueur développé par Solar System, avec le meilleur système VR et à l'œil nu en 3D.

Le concept de « simulateur de monde » proposé par OpenAI traite tout comme une entrée d'informations dans une certaine mesure, absorbant du texte, des images et des vidéos, puis génère des informations, transformant le texte en peintures et les images en vidéos, comme si " Le Seigneur du Earth Online", mais nous ne comprenons peut-être pas le principe. Nous pouvons simplement faire la demande et obtenir le résultat.

Un tel avenir devrait être loin. Au moins pour l’instant, regarder trop de vidéos de Sora ennuiera les gens. Les femmes qui marchent dans les rues de Tokyo n’ont aucune émotion dans leurs yeux et ne peuvent pas ressentir l’atmosphère humaine. Mais quand nous regardons de courtes vidéos Parfois, c'est aussi le cas, le monde a besoin de films subtils et accepte d'énormes redondances, tout comme la résistance du protagoniste de "The Matrix" est également conçue.

Un avenir dans lequel l’IA s’impliquera de plus en plus s’annonce. La prochaine fois que nous verrons un bug suspecté, nous ne le jugerons peut-être pas directement comme étant faux. Nous pourrions nous demander si l'IA a un but ici, tout comme la compréhension en lecture. Nous n’aimons peut-être pas cela, mais nous devons l’accepter.

Zhang Chengchen

Elle est aussi vive que le gel d’automne et peut conjurer les désastres maléfiques. E-mail professionnel : [email protected]

E-mail 8

# Bienvenue pour suivre le compte public officiel WeChat d'Aifaner : Aifaner (WeChat ID : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo