Ne s’arrêtant pas à la « Grand Graphics Card », NVIDIA a sorti le modèle Perfusion « Vincent graph » pour apprendre de nouvelles technologies
Les cartes graphiques NVIDIA sont tellement vendues qu'on oublie presque qu'il s'agit également d'un géant de l'IA générative.
Récemment, le dernier article publié par NVIDIA a révélé une technologie d'apprentissage personnalisée appelée modèle "Vincent graph" de Perfusion.
Selon le site officiel, la technologie Perfusion a été développée conjointement par NVIDIA et l'Université de Tel Aviv en Israël. La technologie de perfusion permet la liberté de créer des objets plus personnalisés, d'obtenir des résultats plus vifs, d'avoir une meilleure correspondance des repères et d'être moins sensible aux caractéristiques d'arrière-plan de l'image d'origine.
Aaron Lefohn, vice-président de la recherche graphique de NVIDIA, a un jour décrit la technologie Perfusion comme "une technologie très compacte… qui permet aux utilisateurs de combiner plusieurs éléments personnalisés, tels que des ours en peluche et des théières spécifiques, en un seul visuel généré par l'IA".
Parmi eux, NVIDIA utilise un nouveau mécanisme appelé "key lock".
L'explication populaire est qu'elle divise le mécanisme d'attention dans le modèle de génération d'images en deux parties : la partie emplacement et la partie contenu. La partie position détermine l'objet à dessiner et la partie contenu détermine le style d'apparence de l'objet.
Le "mécanisme clé" fixe la partie position et empêche l'objet de changer arbitrairement. Par exemple, la position d'un ours en peluche spécifique est cohérente avec tous les ours en peluche modifiés. Dans le même temps, la partie contenu permet à l'apparence de l'objet de changer librement, comme changer la tenue de l'ours en peluche à partir de rien.
De plus, la technologie Perfusion peut choisir de contrôler le degré de changement de l'objet dans le processus du diagramme de Vincent, qui peut être plus proche de l'objet d'origine ou plus conforme à la description de l'utilisateur. Plusieurs objets générés par des enregistrements historiques peuvent également être combinés dans la même image.
Grâce à la nature avancée du mécanisme "key lock", l'officiel affirme que la qualité d'image générée par la technologie Perfusion est comparable à celle de la version Stability Diffusion v1.5.
Cependant, la technologie Perfusion est plus personnalisée, avec la capacité d'apprendre rapidement à gérer de nouveaux concepts sans recycler l'ensemble du modèle, ce qui n'est pas disponible dans Stability Diffusion.
De plus, la technologie Perfusion offre un meilleur contrôle, qui peut facilement équilibrer la qualité visuelle et le contrôle sémantique, et peut combiner plusieurs nouveaux concepts (comme faire en sorte que le modèle génère un ours en peluche spécifique et une théière spécifique en même temps).
En général, la technologie Perfusion innove principalement dans l'apprentissage et le contrôle personnalisés, ce qui rend la génération du système de diagramme de Vincent plus facile à personnaliser.
Ce que beaucoup de gens ne savent peut-être pas, c'est que le discret NVIDIA a en fait réalisé de nombreuses réalisations dans le domaine de l'IA générative et a apporté des contributions pionnières à de multiples tâches génératives telles que la super-résolution d'image et l'estimation de la profondeur.
En mai de cette année, le fondateur de NVIDIA, Jensen Huang, a prédit avec audace : "L'industrie informatique subit deux transformations simultanées : l'informatique accélérée et l'intelligence artificielle générative." Il a ajouté : "Alors que les entreprises se précipitent pour appliquer l'IA générative à chaque centre numérique d'un billion de dollars. l'infrastructure sera mise à niveau vers l'informatique accélérée pour les produits, les services et les processus commerciaux.
L'IA générative forme des réseaux de neurones à grande échelle, nécessitant une puissance de calcul très complexe. Le GPU est plus polyvalent, plus adapté au calcul parallèle à grande échelle, et le processus de conception et de fabrication est relativement mature, c'est précisément la zone de confort de NVIDIA pour maîtriser la "porte de la vie" des grands modèles d'IA.
En termes de parts de marché, NVIDIA détient 84% du marché des GPU. Selon les données publiées par TrendForce, une agence d'études de marché, si la puissance de traitement de la carte graphique NVIDIA A100 est utilisée, 30 000 GPU NVIDIA seront nécessaires pour exécuter ChatGPT, ce qui signifie que NVIDIA pourra gagner plus de 300 millions de dollars américains. .
Cependant, l'unique NVIDIA n'est pas seulement satisfait du "vendeur d'or et d'eau", mais a pleinement libéré le "talent inné" de ses propres ressources dans le domaine du développement de technologies de modèles génératifs.
En 2018, les chercheurs de NVIDIA ont pris l'initiative de proposer le réseau de confrontation générative StyleGAN, qui est le premier modèle GAN capable de générer des images de visage de haute qualité. Un an plus tard, NVIDIA a officiellement publié le premier modèle GAN capable de générer directement des images réalistes. .
Il existe de nombreuses "premières" similaires.Aujourd'hui, la technologie Perfusion est l'un des résultats de la dernière IA générative de NVIDIA.
La sortie de la technologie Perfusion, d'une part, peut continuer à démontrer les capacités techniques de NVIDIA dans le domaine de l'IA générative, et établir pleinement le leadership et l'influence de NVIDIA dans le domaine de l'IA générative.Intégration future dans les produits et services NVIDIA.
Il est à noter que NVIDIA n'a pour l'instant publié que des articles pertinents sur le site officiel et que des démonstrations de code spécifiques seront bientôt lancées.D'ici là, les utilisateurs auront des choix plus diversifiés pour les exigences fonctionnelles des graphes Vincent.
#Bienvenue pour suivre le compte public WeChat officiel d'Aifaner : Aifaner (WeChat ID : ifanr), un contenu plus excitant vous sera présenté dès que possible.
Ai Faner | Lien d'origine · Voir les commentaires · Sina Weibo