Pas de panique, la peinture IA ne peut pas tuer l’art

1 décembre 2022 Hibou Gourou

Un jour de peinture IA est un an sur terre.

Dall-E 2 et Midjourney, devenus populaires au premier semestre, ont été complètement éclipsés par Stable Diffusion au second semestre.

Les produits récents de dessin à chaud ont tous "diffusion" dans leur nom, et ils bénéficient tous de l'algorithme de "diffusion" de l'intelligence artificielle. Cet algorithme franchit le point critique de l'application de la peinture AI, qui est plus facile à utiliser et plus efficace.

La peinture à la machine a une histoire d'un demi-siècle, et en deux ans, la peinture AI est soudainement devenue un "géant attaquant". Non seulement la qualité s'est améliorée visible à l'œil nu, mais la vitesse de génération des images a également été réduite de quelques heures au début de l'année à plus de dix secondes cloche.

Des avancées significatives dans la technologie de peinture par IA ont suscité un intérêt pour "l'IA créative" – une gamme d'outils d'IA qui imitent la créativité humaine, des beaux-arts à la poésie. Mais personne ne s'est vraiment senti paniqué.

Il y a quelque temps, de nombreuses personnes ont émis l'hypothèse que Yan Ning, un biologiste, avait quitté les États-Unis et était retourné en Chine parce que le système d'intelligence artificielle AlphaFold pouvait prédire la structure des protéines et s'était fait voler son travail. En fait, les logiciels capables d'écrire des informations d'actualité existent depuis longtemps et aucun journaliste n'a perdu son emploi à cause de cela. L'IA ne peut même pas remplacer les personnes qui écrivent des cubes de tofu, sans parler des meilleurs scientifiques.

Qu'est-ce que l'algorithme de diffusion

Les modèles d'intelligence artificielle actuels utilisent des réseaux de neurones d'apprentissage en profondeur. Les modèles d'auto-apprentissage, tels que GPT-3 est le plus célèbre de ces modèles, qui "apprendront" sur le réseau neuronal d'environ 45 To de données textuelles, et généreront des œuvres presque identiques à la production humaine.

Stable Diffusion fait partie de la famille du deep learning. Plus précisément, Stable Diffusion apprend le lien entre les images et le texte grâce à un modèle de diffusion latente. Cela fonctionne en prenant des données d'image et en y ajoutant du "bruit". Le bruit, également appelé bruit, fait référence aux points rugueux des images capturées par les appareils de photographie numérique, qui sont généralement produits par des interférences électroniques.

Une image est progressivement ajoutée avec du bruit jusqu'à ce que toute l'image devienne un bruit blanc. Le modèle enregistre ce processus et l'inverse pour que l'IA apprenne.

Du point de vue de l'IA, la première chose que vous voyez est une image pleine de bruit, puis vous voyez que l'image devient plus claire, et finalement elle devient une peinture. Ce que l'IA apprend, c'est tout le processus de débruitage, en particulier comment traiter le bruit gaussien, et enfin générer des peintures.

Le bruit gaussien fait référence à un type de bruit dont la fonction de densité de probabilité obéit à une distribution gaussienne (c'est-à-dire une distribution normale). L'algorithme de diffusion ajoute un bruit gaussien. L'un consiste à vérifier la validité de l'image "réelle", car les images dans l'environnement d'utilisation sont tous bruyants. L'un est pour la commodité de l'apprentissage, tant que le bruit n'est pas conforme à la distribution normale standard, il sera invalide.

La base de données de base de Stable Diffusion s'appelle LAION-Aesthetics, qui contient des images avec des illustrations, et est également filtrée selon le "style esthétique". D'autres modèles d'intelligence artificielle formés ont également "corrigé" la base de données pour prédire comment les gens réagiraient aux évaluations "à quel point aimez-vous cette peinture" afin d'éliminer certains contenus pornographiques.

En quoi est-il différent des "prédécesseurs"

Stable Diffusion est similaire à Dall-E 2 et Midjourney en ce sens qu'il s'appuie sur la "description textuelle" pour générer des images.

Cependant, Stable Diffusion est open source et son code sous-jacent est accessible au public. Ni Open AI ni Google n'ont publié leurs propres modèles d'IA.

Stability AI comprend plus de 4 000 GPU NVIDIA A100 exécutés dans le cloud Amazon (AWS). Selon les rapports, les coûts d'exploitation et de dépenses cloud de Stability AI dépassent 50 millions de dollars.

La société affirme qu'elle peut fournir une "percée en termes de vitesse et de qualité", et que les GPU avec moins de 10G de mémoire peuvent également fonctionner. Ils fourniront également des versions fonctionnant sur les puces AMD, Apple M1/M2.

Actuellement, la fonction de Stable Diffusion est qu'elle peut convertir du texte en une image de 512 × 512 pixels en quelques secondes ; l'image peut être transformée, agrandie, modifiée et remplacée ; en utilisant la modélisation GFP-GAN, permettant aux utilisateurs de télécharger des images faciales floues pour zoomer ou restaurer l'apparence d'origine.

Le mois dernier, Stability AI a levé 101 millions de dollars. Le PDG Emad Mostaque est diplômé de l'Université d'Oxford avec une maîtrise en mathématiques et en informatique, et a précédemment travaillé comme analyste dans divers fonds spéculatifs. Actuellement, la société est évaluée à 1 milliard de dollars.En plus de Stable Diffusion, il existe également l'édition de musique Dance Diffusion.

Le plan lucratif de Stability AI consiste à former des modèles "privés" et des plates-formes d'infrastructure à usage général pour les clients. Il dispose d'une plateforme, DreamStudio, qui est également accessible aux utilisateurs individuels. Aujourd'hui, DreamStudio compte plus de 1,5 million d'utilisateurs qui ont créé environ 200 millions d'images. En comptant toutes les chaînes, Stable Diffusion compte plus de 10 millions d'utilisateurs.

La société a également embauché le scientifique et futuriste de Google, Daniel Jeffries.

Est-ce de l'art ?

Avec l'annonce de diverses intelligences artificielles, les problèmes éthiques et juridiques connexes augmentent également. La diffusion stable permet la génération d'images réelles, et le problème devient plus "sérieux".

Stable Diffusion a été utilisé par les utilisateurs pour créer beaucoup de contenu sensible, et de fausses photos de célébrités volent partout. Getty Images a interdit les téléchargements d'images générées par Stable Diffusion en raison de problèmes de propriété intellectuelle.

La représentante de la Chambre des représentants des États-Unis, Anna G. Eshooo, a récemment publié une lettre exhortant le conseiller à la sécurité nationale des États-Unis et le Bureau de la politique scientifique et technologique à s'attaquer à ces "modèles dangereux".

Dans l'annonce de sortie, Stability AI a annoncé une "licence libre permettant une utilisation commerciale et non commerciale", qui est en fait un accord avec les utilisateurs. Il s'attend à ce que les utilisateurs autorégulent leur comportement et fassent la "bonne chose" et ont peu d'effet pour punir les utilisateurs qui ne respectent pas les règles.

Outre les problèmes juridiques, les œuvres générées par l'intelligence artificielle sont également sujettes à suspicion.

Quoi qu'il en soit, le U.S. Copyright Office considère ces images comme "pas de l'art". En février, la commission d'examen du Bureau du droit d'auteur a rejeté les demandes d'images générées par l'intelligence artificielle.

La Commission d'examen a souligné que "la paternité humaine est une condition préalable à la protection du droit d'auteur" et nécessite "la relation entre la pensée humaine et l'expression créative". Le tribunal fédéral américain a également jugé dans un jugement récent que l'intelligence artificielle ne peut être considérée comme « l'inventeur » d'un brevet.

L'art de l'intelligence artificielle est très attractif, bien qu'il ne soit pas légalement reconnu, il est reconnu par le marché. En 2018, Christie's a vendu une peinture d'intelligence artificielle pour 435 000 $. De plus, la grande majorité des consommateurs ne peuvent pas faire la différence entre les peintures d'IA et les œuvres de peintres humains.

Le plus controversé est le concours d'art de la Colorado State Fair en septembre de cette année. L'œuvre d'intelligence artificielle "Théâtre D'opéra Spatial" a remporté le premier prix. Elle a été produite par Midjourney et l'opérateur Jason Allen a déclaré "L'art est mort, l'IA gagne, les humains perdent".

En fait, il ne faut pas généraliser : dans la création de l'intelligence artificielle, il ne faut pas être trop optimiste ou exagérément pessimiste.

La création artistique de l'intelligence artificielle est produite selon la "logique" de l'être humain. Naturellement, elle n'est pas aussi bonne que les élites humaines, mais elle est plus que suffisante pour dépasser la médiocrité parmi elles.

#Bienvenue pour prêter attention au compte public WeChat officiel d'Aifaner : Aifaner (WeChat ID : ifanr), un contenu plus excitant vous sera présenté dès que possible.

Ai Faner | Lien d'origine · Voir les commentaires · Sina Weibo