GPT-4.5 est sorti ! Le modèle le plus grand et le plus cher d’OpenAI ne considère pas DeepSeek comme un rival

Amis, ne vous précipitez pas pour vous désabonner de ChatGPT.

Récemment, la semaine Open Source DeepSeek bat son plein, avec des développeurs du monde entier occupés à partager du code et à se heurter à l'inspiration. D'un autre côté, OpenAI a choisi le dernier jour de la semaine Open Source pour lancer le « grand tueur » de GPT-4.5.

Sam Altman a partagé son expérience personnelle sur la plateforme X :

C’était la première fois que j’avais l’impression qu’IA avait une conversation avec une personne réfléchie. Cela fournit vraiment de précieux conseils et m'a même fait me pencher en arrière sur ma chaise à plusieurs reprises, étonné de voir à quel point l'IA pouvait trouver des réponses.

Cependant, il a également rappelé que GPT-4.5 n'est pas un modèle d'inférence et n'écrasera pas les autres modèles dans les tests de référence. La raison pour laquelle il ne s'est pas présenté à la conférence de presse était qu'il s'occupait de ses enfants à l'hôpital.

À partir d'aujourd'hui, les utilisateurs de ChatGPT Pro ont accès à GPT-4.5 (Research Preview). La semaine prochaine, il sera progressivement ouvert aux utilisateurs Plus et Team ; la semaine prochaine, les utilisateurs Enterprise et Edu pourront également découvrir cette nouvelle version.

L'expérience est très simple. Il vous suffit de basculer entre les sélecteurs de modèles sur la version web, la version mobile et la version de bureau.

GPT-4.5 prend en charge la recherche sur Internet et peut gérer les téléchargements de fichiers et d'images, et peut également utiliser Canvas pour l'écriture et la programmation. Cependant, GPT-4.5 ne prend actuellement pas en charge les fonctionnalités multimodales telles que le mode vocal, la vidéo et le partage d'écran.

GPT-4.5 devient principalement plus intelligent grâce à « l'apprentissage non supervisé » (c'est-à-dire l'apprentissage à partir d'une grande quantité de données par lui-même), plutôt que de se concentrer sur des capacités de raisonnement comme OpenAI o1 ou DeepSeek R1.

En termes simples, GPT-4.5 en sait plus, tandis que la série o1 peut mieux penser.

Les faits saillants sont résumés ci-dessous :

  • Connaissances plus larges : il apprend plus d'informations, donc il comprend plus qu'avant
  • Moins de conneries : réduction des « hallucinations » (où l’IA invente des faits)
  • Meilleure compréhension du cœur des gens : une « intelligence émotionnelle » plus élevée et une meilleure compréhension de vos véritables intentions
  • Les conversations sont plus naturelles : discuter ressemble davantage à une communication avec une personne réelle et moins robotique.
  • Plus créatif : plus performant en écriture et en conception

GPT-4.5 est officiellement publié, je comprends mieux votre cœur

Le changement le plus intuitif de GPT-4.5 est qu'il vous comprend mieux.

Il s’agit plutôt d’un ami compréhensif, capable de comprendre votre implication et de capturer vos subtils changements émotionnels.

OpenAI a découvert lors de tests internes que les testeurs préféraient les réponses de GPT-4.5 à GPT-4o, pensant qu'elles étaient plus naturelles, plus chaleureuses et plus conformes aux habitudes de communication humaines.

Dans les évaluations comparatives avec des testeurs humains, GPT-4.5 a un taux de réussite (test de préférence humaine) plus élevé que GPT-4o, y compris, mais sans s'y limiter, l'intelligence créative (56,8 %), les problèmes professionnels (63,2 %) et les problèmes quotidiens (57,0 %).

En tant que modèle OpenAI le plus vaste et le plus riche en connaissances à ce jour, GPT-4.5 étend encore la pré-formation basée sur GPT-4o et est conçu pour être plus général que les puissants modèles OpenAI axés sur le raisonnement dans les domaines STEM.

La percée du GPT-4.5 est en grande partie due aux progrès de « l’apprentissage non supervisé ».

En termes simples, l’apprentissage non supervisé permet à l’IA d’apprendre par elle-même à partir d’énormes quantités de données, plutôt que de s’appuyer sur un étiquetage manuel des données.

C'est comme laisser un enfant voir le monde par lui-même au lieu de laisser les adultes lui dire tout. De cette manière, les enfants peuvent acquérir des connaissances plus nombreuses et plus riches et se forger leur propre « vision du monde ».

OpenAI estime que l’apprentissage non supervisé et les capacités de raisonnement sont les deux piliers du développement de l’IA.

Grâce à cela, GPT-4.5 dispose d’une base de connaissances plus large, d’une compréhension plus précise des intentions des utilisateurs et d’une intelligence émotionnelle améliorée. Il est donc particulièrement adapté pour écrire, programmer et résoudre des problèmes pratiques, tout en réduisant les hallucinations.

SimpleQA est utilisé pour évaluer la factualité des grands modèles de langage (LLM) dans le cadre de réponses à des questions de connaissances simples mais difficiles. La précision de GPT-4.5 dans SimpleQA (plus la valeur est élevée, mieux c'est) atteint 62,5 %, bien devant les autres modèles OpenAI.

De plus, lors de l'évaluation du taux d'hallucinations SimpleQA (plus la valeur est faible, mieux c'est), GPT-4.5 a obtenu un score de 37,1 %, ce qui est également loin derrière les autres modèles OpenAI.

Sur l'ensemble de données PersonQA, GPT-4.5 a atteint une précision de 0,78, ce qui est meilleur que GPT-4o (0,28) et o1 (0,55).

En outre, OpenAI a effectué des tests de sécurité approfondis sur GPT-4.5, notamment le rejet de contenu nuisible, l'évaluation des hallucinations, la détection des biais, la protection contre les attaques de jailbreak, etc. : GPT-4.5 a bien fonctionné en rejetant le contenu dangereux, mais était légèrement supérieur au modèle de la génération précédente en termes de refus excessif.

En termes de performances multilingues, GPT-4.5 prend en charge 14 langues, surpassant GPT-4o dans l'évaluation MMLU, en particulier dans les langues à faibles ressources (telles que le swahili et le yoruba).

En ce qui concerne la programmation et l’ingénierie logicielle, les performances des tâches de génération et de réparation de code GPT-4.5 se sont améliorées.

Agentic Tasks évalue la capacité de l'IA à effectuer de manière indépendante des tâches complexes dans un environnement réel, y compris les opérations de terminal (environnement Linux + Python), l'acquisition de ressources (telles que le téléchargement automatique, l'exécution de programmes) et l'exécution de tâches complexes (telles que le chargement et l'exécution de modèles d'IA), etc.

La carte système publiée par OpenAI montre que GPT-4.5 est encore soumis à certaines limitations dans les tâches autonomes et est loin d'être un agent d'IA véritablement autonome.

Outre les utilisateurs ordinaires, GPT-4.5 ouvre également la porte aux développeurs.

OpenAI a ouvert simultanément les API GPT-4.5, notamment l'API Chat Completions, l'API Assistants et l'API Batch.

GPT-4.5 prend en charge les appels de fonctions, les sorties structurées, les réponses en continu et les messages système, et possède des capacités visuelles qui peuvent être traitées via la saisie d'images.

Les développeurs peuvent intégrer GPT-4.5 dans leurs propres applications via l'interface API pour créer des produits plus intéressants et utiles.

Cependant, GPT-4.5 nécessite beaucoup de calculs et est coûteux, il ne remplacera donc pas GPT-4o. De plus, OpenAI évalue toujours l'opportunité de fournir GPT-4.5 dans l'API à long terme afin de continuer à faire progresser le développement de futurs modèles tout en prenant en charge les fonctions actuelles.

L’IA entre-t-elle dans l’ère de « l’intelligence émotionnelle » ?

Cette session en direct est animée par Mia Glaese, Rapha Gontijo Lopes, Youlong Cheng, Jason Teplitz et Alex Paino.

Lorsqu'une démo lui a demandé d'écrire un message texte de colère à un ami qui annulait fréquemment des rendez-vous, GPT-4.5 a été capable de reconnaître la frustration de l'utilisateur et de fournir une réponse plus subtile et constructive, l'aidant à exprimer ses sentiments de manière plus rationnelle.

Une autre démonstration a montré la capacité de GPT-4.5 à expliquer une question complexe : « Pourquoi l’eau de mer est-elle salée ?

GPT-1 n'avait absolument aucune idée de la réponse, GPT-2 a donné une réponse pertinente mais incorrecte, GPT-3.5 Turbo a donné pour la première fois une réponse correcte mais mal expliquée, GPT-4 a trop détaillé les faits et GPT-4.5 a fourni une explication concise, cohérente et intéressante qui utilisait même des structures de phrases accrocheuses au début.

Selon les rapports, OpenAI a réalisé plusieurs innovations clés en matière de mécanismes de formation lors du développement de GPT-4.5.

La formation d'un modèle à si grande échelle nécessite des améliorations significatives de l'infrastructure post-formation, car les données de formation et la taille des paramètres des étapes de pré-formation et de post-formation sont complètement différentes.

L’équipe a développé un nouveau mécanisme de formation capable d’affiner un modèle aussi vaste en utilisant des ressources informatiques plus petites.

Plus précisément, ils ont complété le processus post-formation à travers plusieurs itérations, combinant un réglage fin supervisé et un apprentissage par renforcement avec un feedback humain, et ont finalement développé un modèle déployable.

En termes de pré-formation, l'équipe dirigée par Alex et Jason a pris un certain nombre de mesures pour maximiser l'utilisation des ressources informatiques :

  • Utilisez un entraînement de faible précision pour tirer pleinement parti des performances du GPU
  • Pré-entraîner simultanément des modèles sur plusieurs centres de données, car ils nécessitent plus de ressources informatiques qu'une seule architecture réseau à large bande passante ne peut en fournir.

De plus, l'équipe a construit un nouveau système d'inférence pour garantir que le modèle peut répondre rapidement aux utilisateurs dans ChatGPT et maintenir la fluidité de la conversation. Dans le même temps, ils ont déclaré qu’ils continueraient à s’améliorer après la sortie pour rendre le modèle plus rapide.

Ces innovations dans les mécanismes de formation et de déploiement permettent à l'équipe d'injecter plus de puissance de calcul dans le modèle pour parvenir à une mise à l'échelle massive de l'apprentissage non supervisé, ce qui constitue l'une des principales raisons pour lesquelles GPT-4.5 peut toujours démontrer une solide compréhension et de faibles taux d'hallucinations sans s'appuyer sur un raisonnement étape par étape.

Il convient de mentionner que Mark Chen, directeur de la recherche chez OpenAI, a été interviewé par Alex Kantrowitz avant la sortie de GPT-4.5.

Lorsqu'on lui a demandé si OpenAI avait amélioré l'efficacité de l'exécution des modèles, il a répondu :

Le processus visant à rendre un modèle plus efficace est souvent relativement indépendant du développement des capacités de base du modèle. Je vois beaucoup de travaux axés sur les architectures d'inférence. DeepSeek fait un excellent travail dans ce domaine et nous y consacrons beaucoup d’efforts. Nous sommes très concentrés sur la manière de fournir ces services modèles à tous les utilisateurs à moindre coût et avons travaillé dur pour réduire les coûts.

Qu'il s'agisse d'un modèle d'inférence comme GPT-4 ou d'autres modèles, nous favorisons toujours une optimisation d'inférence à moindre coût. Depuis la version initiale de GPT-4, les coûts de fonctionnement ont été réduits de plusieurs ordres de grandeur et nous faisons de bons progrès sur ce front.

Plus tard, lorsqu'on lui a demandé si la loi de mise à l'échelle actuelle avait rencontré un goulot d'étranglement ou si des rendements décroissants de l'expansion avaient été observés, Mark Chen a répondu :

"J'ai une compréhension différente de la mise à l'échelle. Lorsqu'il s'agit d'apprentissage non supervisé, vous avez besoin de plus d'éléments clés, tels que des ressources informatiques, l'optimisation des algorithmes et davantage de données. Et GPT-4.5 prouve vraiment que nous pouvons continuer à faire progresser le paradigme de mise à l'échelle, et ce paradigme ne s'oppose pas à la capacité de raisonner. "

Les capacités de raisonnement doivent être basées sur des connaissances. Un modèle ne peut pas raisonner dans le vide, mais doit d’abord acquérir des connaissances, puis développer des capacités de raisonnement sur cette base. Nous pensons donc que ces deux paradigmes sont complémentaires et qu’il existe entre eux une boucle de rétroaction qui se renforce mutuellement. "

En fait, GPT-4.5 démontre non seulement l’énorme potentiel de l’apprentissage non supervisé, mais annonce également l’orientation du développement de l’IA – plus proche des humains.

Dans le passé, le développement de l’IA se concentrait principalement sur l’amélioration de l’intelligence, comme jouer aux échecs, résoudre des problèmes, reconnaître des images, etc. Aujourd’hui, contrairement à la sensation provoquée par la sortie de GPT-4 il y a deux ans, les attentes des gens à l’égard de l’IA sont passées de « ce qu’elle peut faire » il y a deux ans à « ce qu’elle peut faire de mieux, être plus sûre et être plus contrôlable » aujourd’hui.

De plus en plus d’entreprises d’IA commencent à se concentrer sur « l’intelligence émotionnelle », essayant de faire en sorte que l’IA comprenne mieux les émotions et les besoins humains.

GPT-4.5 est représentatif de cette tendance. Investir des ressources pour développer une IA qui comprend mieux l’esprit des gens reste une proposition digne de l’attention de l’industrie. Cependant, bien que GPT-4.5 montre la hauteur que peuvent atteindre les modèles de langage basés sur des données massives et une puissance de calcul, ses performances semblent encore quelque peu poussées.

De ce point de vue, il s’agirait plutôt d’une fin progressive, jouant un rôle de transition entre le passé et le suivant. Il ne s'agit pas seulement d'un résumé et d'une réparation des générations passées de modèles, mais il ouvre également la voie à la prochaine vague technologique.

La véritable avancée devra peut-être attendre la réalisation du GPT-5.

Si vous craignez qu'il ne reste pas assez de temps pour qu'OpenAI puisse itérer, ne vous inquiétez pas, j'ai une astuce. La fausse itération de la version est GPT-4.5→GPT-5. Dans les prochains « mois », le véritable rythme de sortie devrait être GPT-4.5→GPT-4.6→GPT-4.7→….

La bonne nouvelle est que cette fois, vous n’aurez pas à attendre encore deux ans.

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo