Découvrez « Create Point » de Quark : un outil de création d’IA qui comprend mieux les éléments chinois et la combinaison ultime de Midjourney et Wan2.5
La tendance des photos générées par l’IA a finalement atteint les travailleurs.
Le patron a dit : « L'IA est tellement avancée maintenant, utilisez-la pour me produire une image en cinq minutes. » Cela paraît facile à dire, mais quiconque l'utilise comprendra.
Bien que les images et vidéos générées par l'IA puissent être difficiles à distinguer du vrai du faux, leurs applications pratiques présentent encore de nombreux problèmes inattendus. Certains outils d'IA, bien que puissants, ont souvent une compréhension erronée du contenu et des styles chinois en raison des limitations de leur matériel de formation.
Heureusement, les fabricants nationaux travaillent également d'arrache-pied, et la qualité des images brutes adaptées au contexte chinois s'améliore constamment. Lors de la conférence Alibaba Cloud , Quark a également lancé une nouvelle plateforme de création d'images et de vidéos basée sur l'IA, appelée « Zaodian ».

Outre sa meilleure compréhension des éléments et de la typographie chinois, il s'agit du premier outil de génération d'images en Chine à prendre en charge le modèle Midjourney V7. La génération vidéo utilise le nouveau modèle Wanxiang 2.5, qui prend en charge la quasi-totalité des fonctionnalités du Veo3, déjà populaire.
Vous pouvez désormais cliquer sur « Créer un point » sur Quark ou visiter directement zaodian.quark.cn pour en faire l'expérience.
N'oubliez pas de réclamer un bonus supplémentaire : à partir de maintenant et jusqu'au 30 septembre, tous les utilisateurs peuvent découvrir gratuitement les capacités de génération vidéo de Tongyi Wanxiang Wan2.5 pendant 7 jours.
Bien entendu, APPSO l’a également expérimenté de première main pour voir ce qu’il pouvait réellement créer.
Un outil de génération de photos qui comprend mieux les éléments chinois
APPSO teste régulièrement des outils de génération d'images IA. Je communique donc régulièrement avec mes collègues concepteurs pour savoir si les outils IA modifient leur fonctionnement. Cependant, je reçois régulièrement des plaintes. Le réglage de l'IA est une véritable histoire de chat inter-serveurs.
Si vous lui demandez des « sentiments chevaleresques et tendres », il vous donnera un chevalier médiéval ; si vous lui demandez une « atmosphère mondaine », il vous donnera une cheminée.
Après de nombreux efforts, j'ai réussi à créer une affiche avec du texte chinois, mais il manquait des éléments ou son agencement donnait l'impression qu'elle avait été mâchouillée par un chien. Elle n'était toujours pas adaptée à certaines scènes professionnelles.
Ce qui m’a le plus surpris dans la création de Quark cette fois-ci, c’est qu’elle a su capturer la subtilité et la conception artistique du peuple chinois.
J'ai essayé de lui demander de générer une « Photographie d'une beauté sportive orientale, montrant ses abdominaux », et l'image résultante m'a stupéfait – la jeune femme avait des lignes musculaires claires, mais son expression était heureuse et naturelle, sa texture de peau était délicate et réelle, et elle avait l'air très sophistiquée.

Auparavant, de nombreux visages asiatiques générés par l'IA se ressemblaient toujours, mais désormais, ils ont enfin une âme .




Quant à la composition chinoise, qui me donne le plus de maux de tête, je n'ai plus besoin "d'ouvrir une boîte aveugle" comme par le passé .
Par exemple, laissez Quark Create Dots générer une « Affiche Postale sur le thème de l'automne ». Elle reflète non seulement les éléments emblématiques de l'automne et de la poste, mais les calques, les polices et les mises en page des différents textes sont relativement coordonnés. Le texte est parfaitement lisible, qu'il soit de petite ou de grande taille, et son utilisation est très intuitive.

J'ai récemment vu un film plutôt réussi, « Lychees of Chang'an ». Je voulais créer une affiche pour illustrer ma critique sur WeChat Moments. Non seulement la police au pinceau est bien placée, mais la mise en page associe des éléments de litchi à une conception artistique orientale, et la texture n'a rien à envier à l'affiche officielle du film.

Nous avons également testé la mise en page d'autres affiches chinoises, et la stabilité globale était bonne. Non seulement l'écriture était correcte, mais la mise en page était également magnifique.



Qu'il s'agisse du style Art déco de « l'âge d'argent » ou des coups de pinceau bruts de « Old Banyan Tree », sa compréhension du chinois a pénétré jusqu'au niveau des « traits » et de la « conception artistique ».


Si vous avez un esprit plus créatif, utiliser différents matériaux pour concevoir des polices n'est qu'une question de phrase.


Sa compréhension des éléments du style traditionnel chinois est bien plus qu'un simple collage. Par exemple, dans les deux images « Mannequins haute couture en costumes ethniques » et « Les murs rouges de la Cité interdite enveloppés de brume et de pluie », les détails des motifs des coiffes et des vêtements des minorités ethniques, ainsi que l'harmonie du maquillage des mannequins avec le décor de la Cité interdite, sont d'un naturel saisissant.


Au-delà des personnages, la marque propose également des coffrets cadeaux et des bijoux soigneusement conçus, inspirés par la Chine. Outre les coffrets et les bijoux, les objets assortis exposés sont également de style chinois.


J’ai découvert que l’esthétique et la compréhension du « style chinois » de Zaodian ne s’arrêtent pas aux symboles superficiels et sont particulièrement évidentes lors de la création d’illustrations de style chinois.
Ces illustrations non seulement restaurent le style vestimentaire et les images de bon augure, mais transmettent également la conception artistique des peintures à l'encre et des peintures murales de Dunhuang, et présentent mieux l'élégance et l'héritage de l'esthétique traditionnelle chinoise.


C'est très important, ce qui signifie que ce n'est pas seulement un jouet intéressant, mais qu'il a le potentiel de devenir un outil de productivité dans des scénarios plus réels.
Pourriez-vous s'il vous plaît ne pas fabriquer des objets fantaisistes et créer du matériel pratique ?
J'ai découvert qu'en plus d'être un passe-temps, lorsque QuarkZaodian connecte de manière transparente ses capacités de conception chinoise à divers scénarios de travail, il peut vraiment faire avancer les choses.
Avant, je pensais m'arracher les cheveux en essayant de concevoir un emballage. Maintenant, on essaie de concevoir un emballage de nourriture pour chats. Il suffit de lui dire « des illustrations de dessin animé plates, un chat persan qui saute pour attraper un poisson et un fond de plage », et il y aura même les oreilles du chat, une photo du ventre du saumon et une bulle promotionnelle « naturel et bio ».

Ce qui est plus intéressant, c'est qu'il peut également vous aider à faire passer les périphériques de marque des dessins aux étagères et vous aider directement à créer un ensemble d'emballage de produit + conception de périphériques.
Je lui ai demandé de créer un « ensemble de quatre aimants de réfrigérateur culturels et créatifs sur le thème du Yunnan », puis je lui ai donné des éléments tels que « la montagne enneigée du dragon de jade, des grains de café, une fondue aux champignons sauvages et des motifs de paon et d'éléphant ».

Un ensemble d'aimants de réfrigérateur en verre émaillé de style ethnique coloré a été produit, qui sont si exquis qu'ils peuvent être utilisés pour l'épreuvage.
Développez ensuite un ensemble de « PI de monstres de style chinois », qui peuvent vous aider à concevoir une série de produits tels que des peluches, des porte-clés, des badges, etc.

Créer une identité visuelle pour une marque de café est un jeu d'enfant. Des sacs à main aux gobelets en carton en passant par les menus, cet outil vous permet de concevoir un ensemble complet au style minimaliste noir et blanc unifié, alliant esprit industriel et tendance.

Il existe encore plus de façons de jouer avec les produits culturels et créatifs touristiques. Qu'il s'agisse d'adorables « autocollants thématiques voyage » ou de « produits culturels et touristiques de Fuzhou » tels que des sacs en toile, des calendriers de bureau et des éventails ronds, ce site vous permet de générer rapidement des moodboards et des maquettes de produits, facilitant ainsi grandement la mise en œuvre de votre créativité.


Vous souhaitez ouvrir une petite boutique, mais vous ne savez pas comment la décorer et l'aménager ? QuarkZaodian peut même vous proposer un service de designer qualifié et gratuit.
Si vous souhaitez ouvrir un « fast food » et lui donner un « style cyberpunk », une immense enseigne au néon rouge extraterrestre apparaîtra immédiatement, créant une atmosphère complète.

Qu'il s'agisse de l'atmosphère littéraire et confortable de « Boutique Coffee » ou du plaisir rêveur et enfantin de « Balloon Shop », il peut vous aider à le faire en un seul clic, faisant de votre boutique un lieu d'enregistrement populaire.


Après que mon flux de travail a été complètement simplifié par l'IA, je ne me suis plus contenté d'être juste assez bon et j'ai voulu me consacrer à une expression artistique de plus haut niveau. Je me suis donc tourné vers le légendaire…
La première sortie nationale de MJ a ouvert mon goût esthétique
Quand j'ai découvert que le site web de Quark proposait un canal officiel Midjourney, j'ai été complètement stupéfait. C'est la première fois en Chine qu'un canal officiel utilise directement la dernière version de MJ V7.

Auparavant, lorsque je voulais utiliser MJ, j'étais soit découragé par la complexité du processus d'abonnement, soit frustré par son prix élevé. Aujourd'hui, Quark a directement baissé son prix.
Ce qui m'a encore plus surpris, c'est que les paramètres mystérieux de MJ se sont transformés en une « télécommande esthétique » compréhensible par tous. On peut ajuster « stylisme », « étrangeté » et « diversité » pour trouver l'effet souhaité.


Avec ces contrôles précis, j’ai l’impression de ne pas utiliser l’IA, mais plutôt de « co-créer » avec un maître esthétique de haut niveau.
Les développeurs et les joueurs apprécieront sans doute cette fonctionnalité. J'ai essayé de générer une « vue tridimensionnelle d'un jeune héros cyberpunk », et le résultat a rapidement permis de créer un design complet du personnage, de face, de profil et de dos. Même les éléments mécaniques des vêtements étaient clairement visibles, et la qualité était comparable à celle d'un brouillon professionnel.

Besoin de créer une scène ? Demandez-lui de dessiner un « bâtiment en ruine en forme de L dans le désert », et le résultat sera un modèle 3D isométrique avec des murs brisés, des gravats dispersés et une texture d'argile mate, créant une scène véritablement atmosphérique, parfaitement adaptée aux besoins de votre jeu.

C'est aussi un simulateur de style artistique. Si je veux faire une « illustration à la main », je lui indique simplement « style Tony Dietrich » et une scène de rue fantastique de Madrid apparaît.

Les matériaux de style chinois ont également une texture artistique différente dans ce mode.
J'ai essayé de lui donner un aspect féerique, avec du rose et de l'or comme couleurs principales et des montagnes superposées. Non seulement les nuages tourbillonnaient dans les montagnes, mais cela combinait aussi deux textures : le flou des taches d'encre et la finesse des lignes dorées. Cette sensation féerique et magnifique peut être utilisée directement comme papier peint.

N'hésitez pas à vous lâcher un peu, qu'il s'agisse des « robots chromés élégants de Hajime Sorayama » ou du « manga d'horreur noir et blanc de Junji Ito », et cela laissera votre créativité vagabonder librement entre différents styles artistiques.


Avec cette capacité de génération d’images artistiques et esthétiques comme base, une idée plus audacieuse a émergé dans mon esprit : et si ces images époustouflantes pouvaient vraiment « bouger » ?
Beaucoup d'énergie à venir, quelques blockbusters à venir
Lors de la conférence Alibaba Cloud qui vient de s'achever, Tongyi a lancé le dernier modèle Wanxiang 2.5, et le point de production a également été rapidement connecté.
En résumé, le nouveau modèle prend en charge nativement la génération synchrone d'audio et de vidéo, et l'image et l'audio peuvent être utilisés pour « performer ». La durée de la vidéo est doublée à 10 secondes, et la compréhension des instructions complexes et des textures dignes d'un film est également grandement améliorée.
Vous pouvez désormais expérimenter ces nouvelles capacités directement sur votre chantier.
J'ai essayé de laisser le modèle générer une vidéo d'une fille jouant de la guitare. Non seulement les mouvements des lèvres et les pincements des doigts étaient parfaitement synchronisés avec le rythme de la musique, mais même les yeux et les micro-expressions étaient saisissants.
Derrière cela se cache la technologie de « synchronisation audio-vidéo » de Wanxiang 2.5, qui fait de la génération vidéo non plus une simple « synchronisation labiale », mais une véritable expression émotionnelle.
Envie de donner vie à vos personnages préférés ? Essayez ceci : téléchargez une photo et un extrait audio pour faire parler n'importe qui.
L'image peut naturellement correspondre à n'importe quel son que vous fournissez – qu'il s'agisse d'une voix humaine, de musique ou d'effets sonores, afin que votre imagination créative puisse être plus étendue.
La cohérence des personnages est la clé de la narration vidéo. Grâce à Wanxiang 2.5, Zaodian peut désormais générer des vidéos d'une durée maximale de 10 secondes.
Par exemple, en utilisant la création de points pour générer le « vlog à la première personne » auparavant populaire, le personnage peut marcher et effectuer diverses actions tout en conservant une image stable, ce qui signifie que l'histoire peut être racontée de manière plus complète.
De plus, Zaodian a une bonne compréhension du langage des lentilles et de la dynamique complexe, et les images ont la texture d'un blockbuster.
Dans la vidéo ci-dessous, le mannequin se promène dans une robe métallisée réfléchissante. La lumière se reflète sur le tissu métallique et bouillonne, créant un halo éblouissant, révélant une texture onirique et avant-gardiste.
Des mouvements de caméra complexes aux performances dynamiques subtiles, avec l’aide de l’IA, le contrôle des gens ordinaires sur l’image peut être comparable à celui d’un réalisateur de cinéma.
À l'ère de l'IA, utiliser l'imagination pour faire la différence
Après l'avoir expérimenté, j'ai le sentiment que Quark Maker ressemble davantage à un partenaire créatif polyvalent et pratique, qui comprend vos idées étranges, vous aide à économiser de l'argent et des efforts et inspire votre créativité illimitée.
Plus important encore, il offre à Quark, un assistant IA utilisé par 200 millions de personnes, une productivité visuelle plus forte et une plus grande polyvalence.
Que vous soyez un utilisateur ordinaire qui souhaite « changer la coiffure » des photos sur votre téléphone portable et « éditer des photos en un clic » pour les publier sur WeChat Moments ; ou un designer professionnel qui a besoin de générer rapidement de l'inspiration de conception pour la « conception d'emballage » et les « enseignes de magasin » ; ou même un praticien du marketing de marque et de l'industrie du jeu cinématographique et télévisuel qui souhaite produire des « storyboards de films et de télévision » et des « vidéos de niveau film », vous pouvez essayer de trouver des solutions rentables et pratiques dans QuarkZaodian.
Face à cela, créer du « noir coloré » n’est plus une exigence déraisonnable du client, mais un élan d’inspiration, un travail qui peut réellement être mis en pratique.
L'APPSO a toujours placé la création au cœur de ses valeurs. Nous sommes convaincus que l'IA est le meilleur moyen d'allier passion et créativité. Lorsque chacun pourra « utiliser son imagination pour faire la différence », une nouvelle ère de création pourrait bien commencer.
#Bienvenue pour suivre le compte public officiel WeChat d'iFaner : iFaner (ID WeChat : ifanr), où du contenu plus passionnant vous sera présenté dès que possible.




