« Black Myth Wukong » modifié par magie pour vaincre Midjourney. Cet artefact de dessin d’IA rend les gens accros.

Lorsque les idéogrammes IA rivalisent pour le réalisme et le talent artistique, Ideogram a ouvert une voie délicate : il peut générer avec précision du texte sur des images, et les polices et mises en page sont magnifiques.

Cette demande n'est pas une niche. La génération d'affiches et d'illustrations en un clic sans avoir besoin d'images P peut éviter bien des problèmes et convient très bien aux gens ordinaires qui ne connaissent rien au design.

Nous avons déjà parlé de la version 1.0 d'Ideogram . Le 21 août, la version 2.0 est arrivée. Le réalisme est meilleur, les affiches sont plus conçues et la compétence particulière du texte est également plus forte.

Vous n'en avez peut-être jamais entendu parler. Il s'agit d'un produit d'IA développé par d'anciens employés de Google. Il présente de nombreux défauts, mais le longboard peut « dépasser » Midjourney dans les virages.

guider le chemin  https://ideogram.ai/

AI veut savoir, de quel Wukong parlez-vous ?

Ideogram possède une fonctionnalité particulièrement adaptée aux débutants : « Magic Tips ».

Vous entrez directement le mot d'invite chinois, et cela vous aidera à le traduire en anglais et à l'optimiser en même temps. En tant que produit étranger, ce type d’opération peut gagner le cœur des gens.

Dans le même temps, Ideogram se concentre sur cinq styles : ordinaire, réaliste, design, 3D et animation. Ils sont tous faciles à comprendre, le choix ne sera donc pas déroutant.

Permettez-moi de commencer par un simple mot chinois, "Sun Wukong tenant un gourdin d'or", style anime, laissez l'IA m'aider à le traduire et à l'optimiser, et voir comment il peut être utilisé librement.

Lorsque la version "Dragon Ball" de Wukong de Shui Lingling est sortie, j'ai été choqué. Quand j'ai regardé les invites, l'IA a traduit Sun Wukong en "Son Goku", donc ce n'est pas surprenant.

De plus, je veux aussi demander à Ideogram si c'est trop flagrant pour payer des royalties.

Afin d'éviter d'autres malentendus de la part de l'IA, j'ai arrêté d'être paresseux en saisissant le mot d'invite et j'ai souligné que « Sun Wukong » est « Sun Wukong » et non « Son Goku ».

Cette fois, nous avons adopté un style réaliste et précisé une scène plus détaillée. Le grand sage porte une armure et tient un cerceau doré à la main. Son expression est solennelle et majestueuse. Il se tient devant la grotte bouddhiste. ton, le bas de l'image indique "Black Myth : Wukong" (Black Myth : Wukong).

Il n'y a pas d'erreurs dans le texte, les majuscules ont un fort impact, et l'atmosphère de la grotte bouddhiste est également créée. Cependant, le tempérament du « Grand Sage » est un peu décalé, l'image est un peu atavique, et. il n'y a pas de lumière dans ses yeux.

Utilisez les mêmes mots d'invite pour générer Midjourney une fois. Le texte est à la fois faux et n'a aucun sens du design, mais le "Monkey King" légèrement plus beau et le style du jeu Web compensent cela.

▲Généré à mi-parcours

Ne voulant pas me réconcilier, j'ai réessayé le style 3D. Le mot d'invite est resté fondamentalement le même, mais le texte en bas a été remplacé par « Lancement du jeu le 20 août ».

En conséquence, le résultat généré par Ideogram est très similaire à l'image promotionnelle d'une certaine série de boîtes aveugles de style chinois version Q. L'image est très nette, mais ce n'est pas du tout le style de jeu 3D dans mon esprit. Monkey King est également amené à ressembler à Erlang Shen.

Et l'IA s'est également exposée. Même si elle était très bonne pour restituer le texte anglais, elle ne savait rien du chinois. Cette faille a persisté de la version 1.0 à la version 2.0.

Il semble que les produits étrangers ne comprennent pas suffisamment la culture traditionnelle nationale. La performance d'Ideogram au premier tour a été un peu décevante, mais elle était également intéressante.

L'équipe Ideogram a déclaré que la version 2.0 est aussi bonne que Flux et DallE. Récemment, les photos vocales TED générées par la version réelle de LoRA de Flux ont trompé de nombreux internautes car il est difficile de distinguer si elles sont authentiques ou fausses. Testons ensuite dans quelle mesure les résultats générés par Ideogram ressemblent à des photos.

▲ Génération de flux

Après avoir choisi le style réaliste, j'ai saisi les mots d'invite chinois, les photos de la conférence TED et le titre de la diapositive était "Ideogram 2.0 Release". Il y avait trois points clés dessus : "texte précis", "bon en design" et "plus réel". ". L'oratrice se tenait devant le tableau blanc, il y a quelques personnes en arrière-plan.

On peut voir que la compréhension sémantique d'Ideogram est bonne et qu'il contient tous les éléments nécessaires. Le logo TED est presque faux, les expressions de l'orateur et du public sont très vives et les cheveux et la peau sont relativement naturels.

Cependant, les détails ne sont pas assez bien gérés. Même s'il n'y a pas de problème avec le texte à générer, quelques petits mots qui apparaissent au hasard gâchent le pot, et les doigts et les corps des personnages ne sont pas tout à fait corrects, mais c'est le cas. déjà bien meilleur que la précédente version 1.0.

En ce qui concerne la conception d’affiches, on peut dire qu’Ideogram bat la « zone de confort » des autres IA vincentiennes.

Si le succès du box-office "Alien" est utilisé comme question test, l'IA peut-elle créer ce sentiment de terreur indescriptible ?

J'ai choisi un style de conception, utilisé des mots rapides pour décrire les éléments de l'image et mentionné spécifiquement une phrase au bas de l'affiche : « Les téléspectateurs mineurs regardent avec prudence ».

L'effet global est accrocheur et une longue chaîne de texte a été générée avec succès. Il n'y a qu'une petite erreur, mais elle n'est pas réaliste et ressemble davantage à un style de bande dessinée, qui ne correspond pas au film d'action réelle.

J'ai ensuite utilisé le mauvais film d'été "A Dream of Red Mansions" comme source d'inspiration et j'ai demandé à Ideogram de générer une affiche. L'arrière-plan, les décorations et même les personnages mentionnés dans les mots d'invite y étaient tous inclus. les mots rapides sont vraiment bons.

Bien sûr, le titre du film est écrit correctement, mais la police semble avoir été empruntée au Seigneur des Anneaux, c'est un peu dramatique et le style général ressemble plus au film d'animation Mulan.

Le « style de conception » d’Ideogram est plus bidimensionnel et unique, mais à l’inverse, cela limite également les scénarios d’utilisation des affiches.

Pour résumer, Ideogram est un produit graphique d'IA tout à fait unique. Son niveau de réalisme est similaire à celui de Flux et son sens artistique est différent de celui de Midjourney.

▲motif « été pluvieux »

Cependant, il possède un niveau unique de génération de texte et est plus adapté à la génération d'affiches, d'illustrations, de publicités, d'émoticônes, d'impression de T-shirts, etc.

Les résultats de l'évaluation humaine montrent qu'Ideogram 2.0 est meilleur que Flux Pro et DALL·E 3 en termes d'alignement rapide des mots, de performances globales et de qualité de rendu du texte.

▲ Mais c'est la propre déclaration d'Ideogram

Très jouable et terre-à-terre, autant avoir plus de « desserts » IA comme celui-ci

Ideogram a été annoncé le 22 août de l'année dernière, exactement un an après la sortie de la version 2.0.

L'équipe fondatrice compte au total 7 personnes de Google Brain, de l'Université de Californie, Berkeley, de l'Université Carnegie Mellon et de l'Université de Toronto, dont 4 sont les auteurs du document de recherche Imagen du modèle de diffusion de graphes Google Vincent.

En plus de sortir cette fois la version 2.0, Ideogram a également lancé une application iOS, qui peut être téléchargée directement en Chine. La version Android devrait être publiée plus tard. Des pages Web aux terminaux mobiles, nous pouvons générer des images à tout moment et n'importe où.

▲Interface mobile

Ideogram est actuellement ouvert gratuitement à tous les utilisateurs, mais le quota est très limité. Après avoir généré 5 fois un total de 20 photos, Ideogram m'a rappelé que 10 points ont été utilisés, merci de revenir demain. (Bien sûr, le Midjourney d’à côté génère 25 photos gratuitement, ce qui ne semble pas très impressionnant.)

Si vous entrez rarement en contact avec des diagrammes vincentiens et que vous souhaitez démarrer avec une IA de diagramme vincentien, Ideogram est un bon choix.

Saisir des mots d'invite chinois, utiliser des « invites magiques » pour traduire et optimiser est une chose. De plus, Ideogram propose également de nombreuses options pour vous aider à générer des images plus proches de ce que vous voulez dans votre esprit.

Fournir une gamme limitée d'options permettant aux utilisateurs de « cliquer » rend l'interaction plus facile que de remplir une « saisie » dans une zone de saisie vide. Quels que soient la proportion, le style et le ton de l'image que vous souhaitez, Ideogram vous permet de choisir.

▲ "Fille avec boucle d'oreille en perle mangeant McDonald's" en différentes couleurs

Si vous ne savez pas comment écrire des mots rapides, vous pouvez également les dessiner et laisser Ideogram nous aider à transformer le banal en magie.

Je suis désolé pour mes faibles compétences en dessin, mais l'IA a compris le sens, optimisé les lignes et les couleurs, ajouté un arrière-plan, et le style s'est soudainement amélioré. Avec l'IA, qui n'est pas le stylo magique Ma Liang ?

De plus, sous la zone de saisie de la version Web, il y a des œuvres générées par d'autres. Lorsque nous rencontrons celles que nous aimons, nous pouvons visualiser et nous référer aux mots d'invite. Ideogram affirme que ses utilisateurs ont généré plus d'un milliard d'images visibles publiquement au cours de l'année écoulée.

Si vous souhaitez générer un objet spécifique mais ne savez pas comment écrire le mot d'invite, Ideogram a également lancé la fonction de recherche dans la bibliothèque publique de création avec du texte, mais cette fonction nécessite actuellement une adhésion.

▲ Résultats de recherche pour "chat"

Dans l’ensemble, Ideogram est un produit Vincent jouable.

Il peut générer avec plus de précision le contenu textuel requis par les utilisateurs et s'adapter à différents styles d'images. Il couvre un large éventail de domaines d'emploi.

▲ Blog idéogramme

Parfois, il peut apporter une valeur émotionnelle et exprimer une ambition à travers des images, même si les émoticônes produites sont trop biaisées en faveur de l'esthétique de l'Internet européen et américain.

▲ Pack d'émoticônes « Je veux jouer à « Black Myth : Wukong » »

La qualité globale d'Ideogram n'est pas mauvaise, la fonction texte est puissante, conviviale pour les novices, facile à utiliser et les interactions sont agréables. Lorsque les outils d’IA combinent créativité, commodité et partage de valeur, il est facile pour les gens de devenir accros.

Un monde taillé dans des moules est trop ennuyeux. Il est aussi très intéressant de discerner un petit besoin et ensuite de faire de la solution la première de l'industrie.

Il existe de nombreux produits dans le monde, et avec un public plus large, nous pouvons nous attendre à davantage de « desserts » IA de ce type.

Il est aussi vif que le gel d’automne et peut conjurer les désastres maléfiques. E-mail professionnel : [email protected]

# Bienvenue pour suivre le compte public officiel WeChat d'Aifaner : Aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo