Le modèle d’image brute avec lequel tout le réseau joue, je l’ai utilisé pour publier l’iPhone 17 à l’avance

Nano Banana est omniprésente sur WeChat Moments, TikTok et Xiaohongshu ces derniers temps. Ce modèle en forme de banane semble prêt à rendre le terme « retouche photo » obsolète, attirant directement 10 millions de nouveaux utilisateurs sur Gemini et en faisant un succès retentissant.

On y trouve une quantité impressionnante de gameplay atypique, réalisé par différents maîtres, avec notamment des figurines 3D et des photos des plus grands. Bien que Nano Banana soit incroyablement puissant, la section commentaires continue de recevoir de nombreuses questions et demandes de la part des utilisateurs.
Premièrement, la barrière initiale à l'entrée a dissuadé de nombreux utilisateurs, rendant l'utilisation de ChatGPT encore plus difficile qu'en Chine. Lors de la retouche d'images, les plaintes les plus fréquentes portaient sur le manque de résolution des images Nano Banana et leurs ratios d'aspect incontrôlables.
Pour être honnête, je me sens aussi un peu exigeant, mais je ne m’attendais pas à ce que quelqu’un écoute réellement ces demandes et les mette en œuvre, et c’était notre fabricant national.
Tout à l'heure, Volcano Engine a officiellement lancé le modèle de création d'images Doubao Seedream 4.0.

En plus des fonctionnalités de base telles que « une superbe cohérence des sujets, une création multi-images flexible et une génération d'images continue », Seedream 4.0 dispose également d'une fonctionnalité que Nano Banana n'a pas : la prise en charge d'une sortie d'image haute définition jusqu'à 4K .
Il s'agit également du premier modèle prenant en charge des images RAW multimodales jusqu'à 4K. Les utilisateurs professionnels peuvent dès à présent profiter d'une première expérience avec Volcano Ark.
Les utilisateurs individuels n'ont pas à être jaloux : la version 4K sera disponible pour la première fois à 20 h ce soir. Recherchez « Volcano Ark Experience Center » pour en faire l'expérience.
Seedream 4.0 est également disponible sur Doubao et Jimeng, prenant en charge une sortie jusqu'à 2K.
Il faut voir ses performances réelles. APPSO a eu un bêta-testeur pendant quelques jours, et nous aimerions lui donner un peu plus de puissance que le Nano Banana.
Après le test réel, j'ai constaté que même s'il ne peut pas être considéré comme parfait, le graphisme domestique est bel et bien entré dans une nouvelle étape.
J'ai sorti l'iPhone 17 Air en avance pour Apple
Ce soir a lieu la conférence d'automne d'Apple. Inutile de veiller tard pour regarder la diffusion en direct. APPSO aidera Apple à lancer l'iPhone 17 en ligne en premier.
Nous avons utilisé Seedream 4.0 pour générer deux pages de produits pour le populaire iPhone 17 Air, qui est le produit phare ultra-mince le plus populaire cette année.
Consultez la page officielle du site Web de l'iPhone 16Pro, remplacez le téléphone et la rédaction associée pour garantir une saveur fruitée complète


Cette composition paraît un peu démodée. Ajustez la petite police et ajoutez la mention « Seulement 5,5 mm d'épaisseur ». Vous pouvez constater que l'angle de prise en main de l'iPhone 17 Air, généré par Seedream4.0, est juste parallèle au côté droit de la lettre A, ce qui lui confère l'esthétique d'un designer expérimenté.

Cette fois, ce n'était pas Tim Cook qui présentait le produit, mais un robot humanoïde Tesla qui faisait une brève apparition. C'était la même scène familière, le même « Good Morning » familier.

Cet ensemble d'images utilise trois images de référence : un robot humanoïde, un iPhone 17 Air et les photos prises par Cook sur place. La cohérence de Seedream4.0 est remarquable.

Il y a ici un détail incroyable qui passe souvent inaperçu. Observez attentivement les reflets sur le casque du robot dans l'image générée. L'image originale est d'un noir absolu. Cela signifie que Seedream 4.0 a déduit les reflets attendus du robot en se basant sur le ciel bleu, les nuages blancs et le bâtiment en arrière-plan de la figure 3. Les détails sont incroyablement précis.

Soyons un peu plus imaginatifs. On dit que l'iPhone 17 Air est en préparation pour le téléphone pliable de l'année prochaine. APPSO a également utilisé Seedream 4.0 pour offrir à tous un aperçu des « vraies photos » du premier téléphone pliable d'iPhone.

Les lecteurs attentifs auront peut-être remarqué qu'il ressemble un peu au nouveau téléphone pliable de Huawei. Oui, je l'ai utilisé comme image de référence et j'ai remplacé l'appareil photo et le logo Apple. Les détails de la composition, de l'arrière-plan et du filigrane sont entièrement préservés.

Alors, il suffit de créer un téléphone pliable pour Apple. En fait, personne ne sait ce qui s'est passé entre Apple et Huawei cette nuit-là.

Si c'était Steve Jobs, comment lancerait-il ce produit ? Nous invitons l'IA Steve Jobs à revenir pour une durée limitée.
La figure familière, avec son aura qui pénètre l'écran, nous fait crier à nouveau « Incroyable ».

En plus d'être amusant, c'est aussi très utile
La popularité de Nano Banana repose non seulement sur son succès sur les réseaux sociaux, mais aussi sur sa vision technologique. Qu'il s'agisse d'uniformisation, de modification partielle, de changement de couleur ou de combinaison de plusieurs images, cette approche peut être directement appliquée au e-commerce, au marketing, aux réseaux sociaux et à d'autres contextes.
Quelle que soit l’impressionnante technologie, si elle ne peut pas être appliquée à des scénarios de productivité, ce n’est qu’un jouet.
Voyons ensuite si Seeddream 4.0 peut être utilisé dans certains scénarios pratiques.
Prenons d’abord la lune rouge qui est partout sur les écrans ces derniers temps et intégrons-la dans le design des baskets.

Je souhaite également visualiser cette paire de baskets sous différents angles. Il me suffit de saisir une invite comme « Générer une basket blanche, montrant les vues de face, de côté et de dessus ». Que ce soit pour une vérification ou des croquis, cela peut se faire en une seule étape.

Et si je cherche un modèle pour présenter le produit dans différentes poses ? Même si je ne trouve pas de photo de référence, je peux simplement dessiner un bonhomme allumette.
Seeddream 4.0 peut contrôler efficacement la cohérence de la posture du modèle sur la base de dessins dessinés à la main, tout en obtenant des changements raisonnables d'angles et des performances précises dans la présentation multi-angles.

Comme dans le cas ci-dessous, je n'ai pas précisé la position debout des deux personnes dans les mots clés. Les quatre photos générées incluent donc les deux positions debout, et le résultat est excellent. C'est comme une soirée B bien pensée. Si vos besoins ne sont pas très clairs, le logiciel prendra en compte toutes les situations possibles et vous proposera des produits finis parmi lesquels choisir. 
▲ Astuce : Combinez l'homme de la figure 1 et la femme de la figure 2 en une seule image et reportez-vous à la pose de la figure 3
Si le câlin est trop simple, faisons une action de levage et spécifions cette fois une image d'arrière-plan supplémentaire. 
▲ Astuce : Combinez les figures 3 et 1 en une seule image, en prenant la pose de la figure 2 comme référence. La figure 1 montre l'enfant soulevé. Utilisez également la figure 4 comme arrière-plan. L'arrière-plan de la figure 4 représente la montagne Langlang, et les deux personnages sont Luo Xiaohei et son maître.
Seedream 4.0 peut également très bien gérer l'image de référence de quatre personnes, en gardant la posture cohérente avec le bonhomme allumette.

▲ Astuce : Disposez les quatre personnages de la figure 1 (les quatre maîtres et apprentis du Voyage vers l'Ouest, à savoir le moine Sha, le moine Tang, le cochon et le roi des singes) selon la posture de la figure 2 (empilement des Arhats), avec le moine Sha, le roi des singes et le cochon en bas et le moine Tang en haut.
Si nous voulons changer le maquillage du modèle, nous avons constaté que Seeddream 4.0 peut également saisir avec précision les caractéristiques de différentes coiffures : la douceur des cheveux longs et raides, l'efficacité des chignons et la courbure des cheveux bouclés sont toutes clairement présentées.
Dans le même temps, l'arrière-plan et le corps humain restent très cohérents, sans aucun problème de flou de bord ni de déformation, ce qui permet d'obtenir une conversion précise du maquillage et des coiffures tout en conservant les principales caractéristiques, ce qui permet d'économiser beaucoup de coûts de maquillage des modèles.

Ce qui m'a le plus surpris, c'est la génération de dessins au trait. Les dessins au trait sont généralement de simples contours ne contenant que les contours et la structure de base des objets, sans détails, couleurs ni textures. Grâce à la fonction de rendu, Seeddream 4.0 peut transformer de simples dessins au trait en produits finis de haute qualité.

Non seulement il peut remplir avec précision des couleurs riches pour rendre les objets visuellement distincts, mais il dispose également d'un traitement délicat de la lumière et des ombres et d'une simulation de matériaux, comme la texture du cuir des sacs et la brillance des accessoires en métal.
Sa compréhension des « rendu de haute qualité » est remarquable. Outre les natures mortes, il propose également des portraits et des scènes. Il a pensé à tout ce à quoi vous n'aviez pas pensé.

Pour être honnête, après la mise à jour de Seeddream 4.0, la gestion des textures réalistes a complètement dépassé mes attentes.
Les textures comme le cuir et le métal sont déjà très stables, mais quand j'ai vu cela générer une texture de peau humaine, j'ai toujours été impressionné.

La texture de la peau, les veines bleues à peine visibles, même la sensation naturelle des poils de sueur sur le poignet et l'effet transparent de la lumière frappant la peau… tous les détails sont très bien saisis, et lorsqu'ils sont combinés ensemble, il n'y a qu'un seul mot : réel.

Quelle est l'image de référence originale de cet ensemble d'images ?

C'est tout.
La reproduction détaillée est comparable à celle d'une vraie photo, répondant parfaitement aux exigences d'un ajustement photographique réaliste. Cela signifie que le modèle est capable de « créer » correctement, offrant des performances raisonnables dans le cadre de l'image de référence et des mots clés.
Cette capacité créative peut être exploitée de manière plus intéressante. Par exemple, une seule image vectorielle suffit pour générer un ensemble complet de conceptions périphériques pour APPSO.

▲ Conseils : Référez-vous à ce LOGO et créez une conception visuelle de marque pour le nom de marque APPSO, y compris des sacs d'emballage, des chapeaux, des boîtes en papier, des cartes, des bracelets, des cordons, etc. Le rouge est la couleur visuelle principale, avec un style amusant, simple et moderne.
Les capacités créatives de Seeddream 4.0 et sa capacité à générer directement des échantillons ont permis de réduire considérablement les coûts de production. Les résultats ont été impressionnants, reflétant le style essentiel de la marque : « ludique, minimaliste et moderne », et intégrant astucieusement le logo de la marque sur des coques de téléphone, des porte-cartes, des cordons et des chapeaux.

Un autre point positif est que Seeddream 4.0 prend en charge la sortie à une résolution maximale de 4K, et la sortie directe à une résolution de 2K ne prend que quelques secondes, ce qui permet une sortie de niveau professionnel dans des scénarios tels que le commerce électronique, laissant plus de place à la post-production.
Un gameplay plus maléfique
De plus, APPSO a également découvert quelques manières maléfiques intéressantes de jouer et aimerait les partager avec vous.
La figurine la plus basique ne pose évidemment aucun problème. Essayons de laisser le personnage la tenir lui-même.

Source de l'image : https://x.com/oden_ai_ai/status/1957414144417910924/photo/1

Astuce : Créez un modèle de personnage à partir de cette photo. Placez une boîte avec l'image du personnage imprimée dessus et un écran d'ordinateur affichant le processus de modélisation dans Blender. Ajoutez un socle rond en plastique devant la boîte pour que le personnage puisse se tenir debout. Essayez de créer un décor intérieur.

▲ Indice : Photoréalisme. La personne sur la photo tient dans sa chambre un modèle, un personnage inspiré du sujet, souriant de satisfaction. Sur un bureau d'ordinateur, un écran affiche le processus de modélisation dans Blender. Il y a aussi une boîte avec l'image du personnage imprimée dessus, et un socle rond en plastique devant.
Vous pouvez non seulement le tenir dans votre main, mais aussi l'accrocher à un sac. Le réalisme et la cohérence des photos sont très impressionnants.

▲ Astuce : Photoréalisme. Transformez d'abord cette photo en un joli pendentif/porte-clés plat en acrylique/porte-clés plat en caoutchouc, et accrochez-le au sac LV/à celui de la deuxième photo. Elle pourra ensuite porter le sac avec le même pendentif.
En plus de fabriquer des figurines, nous l'avons également utilisé pour créer des photos au style photographique affirmé tout en préservant l'authenticité. Votre photographe de toujours pourrait bien être Seedream 4.0.

Outre une cohérence élevée et des capacités d'édition multi-images, Seedream 4.0 offre également de riches capacités de connaissance du monde. Le modèle d'image brute permet également d'inférer et de prédire, et de comprendre en profondeur nos mots et images, ainsi que les intentions qui les sous-tendent.
Par exemple, nous avons téléchargé une photo d'une tasse sur le point de tomber au sol, puis nous avons saisi le mot d'invite « À quoi devrait ressembler cette image dans la seconde qui suit ? »

La coupe tomba au sol et l'eau sur le sol pouvait être vue, reflétant une partie de la coupe et la lumière de la fenêtre.
En plus de savoir ce qui va se passer en une seconde, Seedream 4.0 peut également utiliser sa capacité de raisonnement pour ranger notre propre chambre. 
▲ Invite : Pliez la couette et les vêtements sur le canapé
En plus de plier soigneusement les vêtements et de nettoyer les sols jonchés de peinture, Seedream peut également maintenir la cohérence des éléments existants dans l'image tout en nettoyant.

▲ Astuce : Rangez toute la peinture et nettoyez le sol (même s'il ressemble à un dessus de table)
Grâce à sa capacité de raisonnement, il existe une manière encore plus excitante de jouer.
Dans l'exemple ci-dessous, la référence téléchargée est une photo de modèle, demandant à Seedream 4.0 d'afficher les détails de ses vêtements. L'instruction reçue par le modèle est l'image détaillée ; la distance entre les deux dépend de sa capacité à la déterminer par lui-même.
Le résultat est plutôt réussi. Non seulement le patron est précis, mais les instructions pour afficher les détails sont parfaitement respectées. Le modèle est presque prêt à être publié immédiatement. 
Seedream 4.0 est également un bon outil pour générer des emojis
Grâce aux conseils de l'internaute @op7418, nous avons également créé plusieurs versions de packs d'émoticônes pour les modèles d'IA. Si vous ne réussissez pas une fois, piochez simplement les cartes plusieurs fois. Heureusement, la vitesse de génération est assez rapide.

▲ Astuce : Aidez-moi à transformer le personnage en un autocollant à contour blanc similaire à la figure 1 et ajoutez une phrase ludique à contour blanc « XXXX ».

▲ Image 1 (à gauche) de @fenxxxx, Image 2 (à droite)
Vous avez peut-être vu le célèbre tableau « Mille milles de rivières et de montagnes », mais vous avez peut-être manqué des milliards de détails.

De même, qui a dit qu'il n'y avait pas de Labubu mignon dans « La Procession de l'empereur Taizong à la rencontre du moine bouddhiste Xuanzong » ? Et je ne ressens aucune désobéissance lorsqu'un Shiba Inu Kabosu, célèbre sur Internet et venu des temps modernes, apparaît soudainement au banquet dans « Le Banquet nocturne de Han Xizai ».

Ce n’est pas seulement un outil de création d’images, c’est aussi une plateforme de productivité créative
Si je devais décrire Seedream 4.0 en un mot, ce serait « guerrier hexagonal ». C'est comme un directeur créatif polyvalent associé à une équipe de production hautement performante, vous permettant d'atteindre rapidement les résultats souhaités tout en vous offrant un meilleur contrôle sur votre processus créatif.
La vitesse est la première sensation.
Basé sur l'architecture DiT-MoE, Seedream 4.0 affiche une efficacité de calcul plus de dix fois supérieure à celle de la génération précédente, générant une image haute définition 2K en seulement 1,8 seconde. Ce temps de réponse de « second niveau » se traduit par des coûts d'essais et d'erreurs extrêmement faibles.
La stabilité est la pierre angulaire de la productivité.
La puissante capacité de cohérence des sujets de Seedream 4.0 vous permet de conserver les caractéristiques originales de votre personnage à un degré élevé, que vous souhaitiez changer la scène, le style ou ajuster la posture et la perspective, évitant ainsi l'embarras des « changements soudains de style ».

Pour de nombreux concepteurs de commerce électronique et de marques, l'IA ne consiste plus à changer la couleur d'une affiche, mais à pouvoir se référer à un logo et générer un ensemble complet de designs visuels de marque en un seul clic, des sacs d'emballage aux bracelets, avec un style hautement unifié.
Les directives de marque ont commencé à se transformer d'un épais manuel VI en lignes d'invites exécutables.
En tant que créateurs de contenu comme nous, cela vous permet de vous référer à un paramètre de personnage et de générer des storyboards de bandes dessinées ou des livres d'images d'histoires par lots, améliorant considérablement l'efficacité et la cohérence de la sérialisation du contenu.

▲ Les mots de l'invite sont inspirés par @阿真Irene
De plus, après la sortie de Nano Banana, de nombreux développeurs ont développé des jeux légers ou des outils pratiques basés sur cette technologie. Nous avons constaté que ces outils permettent à davantage de développeurs de petites et moyennes entreprises de concrétiser rapidement leurs idées et de gagner en reconnaissance auprès des utilisateurs.
Seedream 4.0 est omniprésent sur les réseaux sociaux ces derniers temps. Au-delà de l'engouement suscité, nous avons également constaté que Seedream 4.0 ne se contente plus d'être une simple nouveauté ; il vise à devenir une plateforme de productivité créative évolutive et commercialement viable .
Texte de Li Chaofan, Mo Chongyu, Liu Ya et Zhang Zihao
#Bienvenue pour suivre le compte public officiel WeChat d'iFaner : iFaner (ID WeChat : ifanr), où du contenu plus passionnant vous sera présenté dès que possible.
