Découvrez GPT-5 en avant-première ! Tout le monde peut l’utiliser gratuitement, et Musk est mécontent.

S'il existe un produit technologique qui peut encore permettre aux gens de regarder des émissions en direct tôt le matin après avoir été largement divulgué, outre l'iPhone d'Apple, c'est bien ChatGPT d'OpenAI.

Longtemps après son lancement, GPT-4 est resté le seul véritable concurrent de ses concurrents en IA. Le monde prend progressivement conscience que l'IA surpasse les capacités humaines dans un nombre croissant de tâches.

Aujourd'hui, GPT-5 a finalement fait ses débuts, élevant la norme connue sous le nom de « ligne de passage » à une dimension supérieure.

Découvrez GPT-5 gratuitement ! Tout le monde peut l'utiliser gratuitement, et Musk est mécontent.

Nous avons également commencé avec GPT-5 et lui avons demandé d'écrire un poème pour son anniversaire. Le score total est de 10. Combien de points pensez-vous qu'il puisse obtenir ?

Toujours dans le segment des cartes météo classiques, la qualité esthétique de l'interface utilisateur de GPT-5 est assez impressionnante.

Nous avons également testé les capacités de programmation de GPT-5 dans Flowith.

Pour plus de détails, cliquez sur le lien : Découvrez GPT-5 ! Tout le monde peut l'utiliser gratuitement, a exprimé son mécontentement.

Sam Altman, PDG d'OpenAI, a salué GPT-5, le qualifiant de formidable avancée par rapport à tous les modèles précédents. Selon lui, un système d'IA comme GPT-5 aurait été inimaginable à tout moment de l'histoire.

▲ (Interface principale)

Cependant, la conférence de presse a également eu son lot de « crashs », avec des erreurs évidentes de « fabrication » apparaissant dans les graphiques et les sections de données, et même Ultraman n'a pas pu s'empêcher de publier un message d'autodérision.

Bien sûr, Musk n'a pas laissé passer cette excellente occasion de « surfer sur la popularité ».

Il a déclaré que Grok 4 avait battu GPT-5 lors du test ARC-AGI, et en a profité pour le critiquer et a révélé que Grok 5 sortirait avant la fin de cette année et devrait être encore plus performant.

GPT-5 est là, avec des améliorations significatives des compétences en programmation et en écriture, et il peut également être votre médecin IA

Le GPT-5 apporte des améliorations significatives dans des domaines tels que le codage, les mathématiques, l’écriture, la santé et la perception visuelle, tout en réalisant des progrès significatifs dans la réduction des hallucinations, l’amélioration du suivi des instructions et la réduction des flatteries.

GPT-5 utilise une nouvelle conception de système unifiée avec trois composants principaux : un modèle de base efficace pour gérer les problèmes de routine, un modèle de « pensée GPT-5 » avec des capacités de raisonnement approfondies spécifiquement pour les tâches complexes, et un routeur en temps réel chargé de sélectionner le modèle approprié en fonction de facteurs tels que la complexité de la conversation et les exigences des outils.

Ce « système de routage » apprend en permanence les comportements de commutation, les préférences de retour et la précision des réponses des utilisateurs, et optimise en permanence la stratégie d'allocation. Lorsque les utilisateurs atteignent la limite d'utilisation, le système bascule automatiquement vers une version simplifiée de chaque modèle pour continuer à servir.

GPT-5 est le modèle de codage le plus puissant d'OpenAI à ce jour, capable de gérer des développements front-end complexes et de déboguer des bases de code volumineuses. Altman a déclaré : « Le concept de logiciels générés à la demande sera un élément clé de l'ère GPT-5. »

Par exemple, il peut créer des sites web, des applications et des jeux entièrement fonctionnels et élégants à partir d'une seule invite. À partir de l'invite suivante, GPT‑5 a réussi à créer un jeu appelé « Jumping Ball Runner », doté de toutes les fonctionnalités requises, notamment une augmentation de la vitesse, un système de score, des effets sonores et un arrière-plan à défilement parallaxe.

Astuce : pour créer une application d'une seule page, les exigences sont les suivantes, et toutes écrites dans un seul fichier HTML :
– Nom : Coureur de balle sauteur
– Objectif : sauter par-dessus les obstacles et survivre le plus longtemps possible.
– Caractéristiques : vitesse augmentant progressivement, enregistrement des meilleurs scores, bouton de réessai et effets sonores amusants pour les actions et les événements.
– L’interface doit être colorée avec un arrière-plan à défilement parallaxe.
– Les personnages doivent avoir un aspect de dessin animé et être amusants à regarder.
« Les jeux doivent être agréables pour tout le monde. »

En matière d’écriture, GPT-5 est capable de transformer des idées brutes en texte avec une profondeur et un rythme littéraires.

Il est plus fiable pour la gestion des formes écrites complexes, comme le maintien du mètre, tout en équilibrant normes formelles et clarté. Ces améliorations rendent ChatGPT plus pratique pour les tâches quotidiennes telles que le traitement de documents et la rédaction d'e-mails.

De plus, GPT-5 est le modèle le plus performant d’OpenAI sur les problèmes liés à la santé.

Lors de l'évaluation HealthBench, basée sur des scénarios réels et des normes médicales, GPT-5 a largement surpassé tous les modèles précédents. Le nouveau modèle identifie proactivement les problèmes potentiels, pose des questions ciblées et fournit des recommandations personnalisées en fonction de l'expérience, du niveau de connaissances et de la localisation de l'utilisateur.

Altman était responsable de la présentation du volet santé du GPT-5. Lors de la conférence de presse, il a invité Carolina et Filipe à partager leurs expériences personnelles.

Carolina a reçu trois diagnostics de cancer différents en une semaine. Après avoir soumis ces rapports, riches en termes médicaux, à ChatGPT, ChatGPT a traduit le contenu complexe en un langage clair et compréhensible en quelques secondes, ce qui l'a aidée à mieux communiquer avec son médecin.

Lorsqu'elle a été confrontée à la question de savoir s'il fallait subir une radiothérapie, une question sur laquelle même les médecins ne parvenaient pas à un consensus, ChatGPT lui a fourni une analyse détaillée des nuances du cas, des risques et des avantages, etc. Elle a déclaré que cela lui avait été plus bénéfique qu'une conversation de 30 minutes avec un médecin.

Bien entendu, ChatGPT ne remplace pas un professionnel de la santé et la prudence est de mise.

Les résultats de référence montrent que GPT-5 établit de nouveaux records dans plusieurs benchmarks :

  • Capacité mathématique : score au test AIME 2025 (sans outils) de 94,6 %
  • Capacité de programmation : SWE-bench Vérifié (avec réflexion) score 74,9 %, Aider Polyglot (avec réflexion) score 88 %
  • Compréhension multimodale : MMMU a obtenu un score de 84,2 %
  • Santé : HealthBench Score strict 46,2 %

GPT-5 a également amélioré sa capacité à exécuter des instructions et à appeler des outils de manière autonome. Il peut exécuter des requêtes multi-étapes de manière plus stable, coordonner plusieurs outils avec souplesse et ajuster intelligemment les stratégies comportementales en fonction du contexte, démontrant ainsi une plus grande adaptabilité aux tâches.

GPT-5 a également obtenu des performances impressionnantes dans de nombreux tests multimodaux, couvrant la reconnaissance visuelle, la compréhension vidéo, le jugement spatial et le raisonnement scientifique. Grâce à ses capacités de perception et de raisonnement améliorées, ChatGPT peut désormais traiter avec plus de précision les images et autres données non textuelles.

Dans les tests de référence internes d'OpenAI, GPT-5 a atteint ou dépassé les niveaux d'expert dans environ 50 % des tâches de travail de connaissances complexes, couvrant plus de 40 domaines professionnels tels que le droit, la logistique, les ventes, l'ingénierie, etc., et a obtenu de meilleurs résultats que o3 et ChatGPT Agent.

OpenAI a spécifiquement souligné que GPT-5 a été formé sur le supercalculateur Azure AI de Microsoft.

De plus, GPT-5 a également réalisé des avancées majeures en matière d'efficacité du raisonnement. Dans des tâches telles que le raisonnement visuel, le codage et la résolution de problèmes scientifiques de niveau universitaire, GPT-5 a surpassé OpenAI o3 tout en réduisant le nombre de jetons de sortie de 50 à 80 %.

Les hallucinations ont toujours été un problème majeur pour l'IA. Comparé aux modèles précédents d'OpenAI, le risque d'hallucinations dans GPT-5 a été considérablement réduit, et le modèle est plus apte à traiter des problèmes complexes et ouverts.

Lors de tests anonymes représentatifs du trafic de production de ChatGPT, GPT-5 a atteint un taux d'erreur factuel inférieur d'environ 45 % à celui de GPT-4o et un taux d'erreur inférieur d'environ 80 % à celui d'OpenAI o3 lorsque l'inférence était activée.

Dans les tests de référence de précision des faits ouverts LongFact et FActScore, le taux d'hallucination de la « pensée GPT-5 » est environ six fois inférieur à celui de o3, marquant une amélioration significative de la précision de la génération de contenu long.

Outre une précision factuelle améliorée, GPT-5 (qui possède la capacité de penser) peut communiquer plus honnêtement son comportement et ses capacités aux utilisateurs. Selon Alex Beutel, responsable de la recherche sur la sécurité des modèles, OpenAI a testé GPT-5 pendant « plus de 5 000 heures » afin de comprendre ses risques de sécurité.

GPT-5 introduit également une nouvelle méthode d'apprentissage sécurisée appelée « Safe Completion », qui permet au modèle de fournir des réponses utiles tout en préservant les limites de sécurité. Lorsqu'une requête doit être rejetée, GPT-5 en explique la raison de manière transparente et propose une alternative sûre.

En termes d'expérience utilisateur, GPT-5 réduit les comportements trop réactifs, réduisant le taux de réponses flatteuses lors d'un test de flatterie spécialement conçu de 14,5 % à moins de 6 %. Le nouveau modèle utilise moins d'émojis inutiles et ses réponses sont plus nuancées et réfléchies.

De plus, OpenAI a lancé quatre personnalités prédéfinies pour tous les utilisateurs : Cynique, Robot, Auditeur et Nerd. Ces personnalités sont initialement disponibles pour le chat textuel et seront disponibles ultérieurement pour le chat vocal. Les utilisateurs peuvent personnaliser le style d'interaction de ChatGPT selon leurs préférences.

Lors de la démonstration en direct, l’interaction vocale est devenue très naturelle et contrôlable.

Les chercheurs d'OpenAI ont demandé à GPT-5 de répondre aux questions en un seul mot. Lorsqu'on lui a demandé de partager un conseil, GPT-5 a répondu : « Patience ». Tout le monde a ri lors de l'événement de lancement, et l'animateur a suggéré que c'était peut-être une façon pour le modèle de remercier tout le monde pour sa patience en attendant la sortie de GPT-5.

Les utilisateurs gratuits peuvent également l'utiliser, et il existe également un modèle vraiment parfumé

En remplacement d'OpenAI o3-pro, OpenAI a également publié GPT-5 pro, une variante de GPT-5 capable de réfléchir plus longtemps et d'utiliser un calcul de temps de test parallèle à l'échelle mais efficace pour fournir les réponses de la plus haute qualité et les plus complètes.

Lors d'une évaluation de plus de 1 000 questions de raisonnement concrètes et économiquement intéressantes, des experts externes ont préféré GPT-5 Pro dans 67,8 % des cas. Son taux d'erreur majeur était inférieur de 22 % à celui de GPT-5, et il a obtenu d'excellents résultats en santé, en sciences, en mathématiques et en codage, recevant les éloges unanimes des experts.

GPT-5 est désormais le nouveau modèle par défaut de ChatGPT, déployé auprès de tous les utilisateurs Plus, Pro, Team et Free, les utilisateurs Enterprise et Edu y ayant accès une semaine plus tard.

Les utilisateurs gratuits peuvent envoyer 10 messages toutes les 5 heures, tandis que les utilisateurs Plus peuvent envoyer 80 messages toutes les 3 heures.

Les utilisateurs Pro bénéficient d'un accès illimité à GPT-5 et GPT-5 Pro, tandis que les utilisateurs gratuits basculeront automatiquement vers GPT-5 mini dès qu'ils auront atteint leur limite d'utilisation. Les utilisateurs Pro, Plus et Team peuvent également se connecter à la CLI Codex via ChatGPT et appeler GPT-5 depuis leur environnement de développement pour effectuer des tâches telles que le codage et le débogage.

Bien que GPT-5 soit désormais disponible pour tous les utilisateurs, les utilisateurs de ChatGPT gratuits ne bénéficieront pas immédiatement de l'expérience complète de GPT-5. Une fois la limite d'utilisation de GPT-5 atteinte, ils passeront à un modèle plus compact, plus rapide et simplifié : GPT-5 mini.

Pour les développeurs, OpenAI a également lancé trois versions différentes de sa plateforme API : gpt-5, gpt-5-mini et gpt-5-nano. Les développeurs peuvent choisir en toute flexibilité en fonction des exigences de leur projet en termes de performances, de coût et de temps de réponse.

GPT-5 prend en charge les interfaces courantes telles que l'API Reply et l'API Chat Completion, et constitue désormais le modèle par défaut de l'interface de ligne de commande Codex. Toutes les versions incluent le contrôle des paramètres reasoning_effort et verbosité, ainsi que des outils personnalisés.

Outre les capacités conversationnelles de base, GPT-5 intègre également des fonctions de base telles que les appels d'outils parallèles, les outils intégrés (recherche Web, traitement de fichiers, génération d'images), le traitement en continu, la sortie structurée et les fonctionnalités d'optimisation des coûts telles que la mise en cache rapide et l'API par lots.

L'API GPT-5 introduit également quatre nouvelles fonctionnalités principales qui améliorent considérablement l'expérience du développeur.

Tout d'abord, le paramètre reasoning_effort permet aux développeurs de basculer de manière flexible entre les paramètres minimum, bas, moyen et élevé en fonction des différents scénarios de tâches. Utiliser le paramètre minimum pour des réponses rapides aux tâches simples et le paramètre élevé pour une réflexion approfondie sur des questions complexes permet aux développeurs de trouver l'équilibre optimal entre qualité et rapidité des réponses.

Le paramètre de verbosité prend en charge trois niveaux : faible, moyen et élevé, vous permettant de contrôler le niveau de détail de vos réponses. Par exemple, pour la question « Pourquoi le ciel est-il bleu ? », un niveau faible fournit une réponse concise et claire, tandis qu'un niveau élevé inclut une explication scientifique détaillée.

La nouvelle fonctionnalité d'outil personnalisé prend en charge le formatage de texte brut, éliminant ainsi les contraintes liées aux caractères d'échappement JSON. Les développeurs n'ont plus à se soucier des erreurs de formatage lors du traitement de gros volumes de code ou de longs documents.

Il est important de noter que l'ensemble du processus d'exécution est traçable. GPT-5 affichera activement des mises à jour de progression lors de l'exécution des appels d'outils, permettant aux développeurs de comprendre le plan d'exécution et l'état actuel de l'IA.

De plus, contrairement au système GPT-5 de ChatGPT, la version API est spécialement optimisée pour les besoins des développeurs et est plus adaptée aux scénarios de programmation et de tâches d'agent.

Des outils et plateformes de développement réputés, notamment Windsurf, Vercel et JetBrains, ont donné des avis positifs à GPT-5. Windsurf a souligné que GPT-5 a atteint des performances de pointe lors de son évaluation, avec un taux d'erreur d'appel d'outil deux fois inférieur à celui d'autres modèles de pointe.

La sortie de GPT-5 pourrait être un coup fatal pour Claude.

Selon The Information, plus de 60 % des 5 milliards de dollars de chiffre d'affaires annuel d'Anthropic proviennent des API, Cursor et GitHub Copilot contribuant à eux seuls à hauteur de 1,4 milliard de dollars. Cette structure de revenus tout-en-un révèle la vulnérabilité d'Anthropic.

La cruauté du marché des outils de programmation réside dans le fait que la performance est primordiale. Même une augmentation de 5 % de la précision permet aux développeurs d'économiser des heures de débogage chaque jour. Par le passé, Claude a pu progresser rapidement dans le domaine de la programmation, en grande partie grâce au retard relatif de ChatGPT en matière de codage.

Mais cette fenêtre d'opportunité finira par se refermer. Avec l'amélioration des tâches de programmation et des capacités des agents de GPT-5, combinée au renforcement des liens écologiques et des canaux de distribution des produits d'OpenAI, le retour de Cursor et Copilot chez OpenAI aura un impact considérable sur les revenus d'Anthropic.

Peut-être que bientôt, nous verrons l'arrivée de Claude 5.

Auteurs : Li Chaofan, Mo Chongyu, Zhang Zihao

#Bienvenue pour suivre le compte public officiel WeChat d'iFaner : iFaner (ID WeChat : ifanr), où du contenu plus passionnant vous sera présenté dès que possible.

iFanr | Lien original · Voir les commentaires · Sina Weibo