Le dernier modèle d’OpenAI crée des images réalistes et du texte lisible, essayez-le gratuitement

26 mars 2025 Hibou Gourou

OpenAI a introduit son modèle 4o dans ChatGPT pour permettre la génération d'images natives dans l'atmosphère du chatbot. Cette mise à niveau permet de ne pas avoir à utiliser le modèle de génération d'images Dall-E d'OpenAI en tant qu'entité distincte, bien que Dall-E reste disponible pour ceux-ci en tant que préférence. La marque AI a également activé son générateur vidéo Sora AI dans ChatGPT.

Les nouvelles fonctionnalités sont actuellement disponibles pour les utilisateurs gratuits de ChatGPT, ainsi que pour les utilisateurs de ChatGPT Plus , Team et Pro. La disponibilité sera disponible pour les utilisateurs professionnels et éducatifs la semaine prochaine.

Auparavant, Dall-E 3 était le plug-in de génération d'images pour les abonnés ChatGPT payants. Pendant ce temps, ceux qui souhaitaient essayer le générateur gratuitement pouvaient le faire via le niveau de base de Microsoft Copilot .

Le modèle a été salué comme l'un des meilleurs générateurs d'images disponibles, en particulier dans sa version payante. Malgré l'avantage que tous les utilisateurs de ChatGPT peuvent utiliser la génération d'images de manière native avec le modèle 4o, ceux qui utilisent le niveau gratuit de ChatGPT doivent être prêts à se heurter à certaines limitations, telles que les maximums pour les téléchargements de fichiers et l'analyse des données, a noté CNET .

Néanmoins, selon le Wall Street Journal, ChatGPT bénéficiera d'images plus réalistes avec un texte plus lisible après qu'OpenAI ait passé un an à faire suivre à GPT-4o un effort de formation post-lancement appelé « apprentissage par renforcement à partir de commentaires humains » (RLHF).

Après avoir annoncé GPT-4o en mai 2024, OpenAI avait une équipe de plus de 100 « formateurs humains » qui parcouraient le modèle à la recherche de fautes de frappe, ainsi que d'erreurs courantes dans les mains et les visages, a déclaré le chercheur principal du projet, Gabriel Goh, à la publication.

Le modèle GPT-4o apportera également à ChatGPT la possibilité de créer des arrière-plans transparents. Cela devrait être un avantage majeur pour les utilisateurs professionnels et les créatifs, car cela leur permettra de créer des logos ou d'autres iconographies, a également noté Jackie Shannon, responsable du produit multimodal de ChatGPT, au WSJ.

Malgré les améliorations apportées par OpenAI , le modèle GPT-4o mis à jour dans son ensemble présente toujours ses défauts. Il a toujours une propension aux hallucinations, une caractéristique courante de l’IA qui n’a pas encore été résolue. Maintenir la cohérence de l'édition reste un défi dans l'atmosphère ChatGPT ; cependant, OpenAI a promis des mises à jour rapides, dès la semaine prochaine.

Un autre problème récurrent pour OpenAI est la question de l’éthique et de la légalité. La marque insiste sur le fait que son modèle a été formé sur des « données accessibles au public » et grâce à des données exclusives qu'elle possède via des partenariats avec des marques dont Shutterstock, a noté le WSJ.

Les images générées via ChatGPT basées sur le modèle 4o n'auront pas de filigrane IA. Cependant, la marque a indiqué que les images incluraient des métadonnées C2PA⁠ les indiquant comme générées par l'IA. Cela reste la norme de l’industrie.