Lancement de GPT-5 : six fois j’ai dit « wow », mais trois fois « hmmmm »

L'équipe OpenAI, dirigée par Sam Altman, a enfin dévoilé GPT-5. Environ 600 000 personnes ont suivi le lancement en direct ou pendant les trois heures qui ont suivi ( et vous pouvez faire de même si vous l'avez manqué). Bien que ce soit en décalage avec certaines prises de vue spatiales et les épreuves de la Coupe du monde, le public manifeste un intérêt considérable pour la nouvelle version de ChatGPT. YouTube ne communique pas encore pleinement ses données d'audience, mais seuls deux ou trois événements Apple ont enregistré un nombre significativement plus élevé de spectateurs.

J'ai testé GPT-5 avant son lancement et presque tout ce que nous attendions a été annoncé. Je vais vous parler ci-dessous de ce qui m'a surpris/impressionné et de ce qui m'a laissé perplexe.

Waouh #1. Ils ont fait du chemin en deux ans et demi.

De nombreux auteurs, dont moi-même, se sont plaints d'hallucinations, d'erreurs et autres ratés. Tout cela est vrai. Mais il faut aussi prendre une grande inspiration et saluer les progrès considérables réalisés par OpenAI depuis la première version publique de ChatGPT. Cette version était plus un jouet qu'un outil. Les versions actuellement disponibles – 4.0, 4.1 et 4.5 – sont très puissantes et plus utiles. Si GPT-5 tient ne serait-ce que la moitié des promesses faites aujourd'hui, ce sera un bond en avant majeur. Wow 1.5 est arrivé lorsque Sam Altman a annoncé qu'ils comptaient désormais 700 millions d'utilisateurs. J'applaudis leur ambition et je me souviens d'une citation de Leo Burnett (qui est sur le Mont Rushmore de la publicité) : « Quand on vise les étoiles, on n'en obtient peut-être pas une, mais on n'en trouve pas non plus une poignée de boue. » OpenAI vise clairement les étoiles.

Waouh #2 : Ils ferment les anciens modèles et migrent tout le monde vers GPT-5

Si vous consultiez le menu en haut de la page ChatGPT avant le lancement, vous verriez plusieurs options pour différents modèles. Il y avait quelques précisions sur les fonctionnalités de chaque modèle. C'était toujours confus, du moins pour moi. Maintenant, ils migrent tous les utilisateurs vers GPT-5 et ferment les anciens modèles. Ce tableau résume les différences entre GPT-4 et GPT-5. Altman a expliqué que si GPT-3 était destiné à un lycéen et GPT-4 à un étudiant, GPT-5 fonctionnerait au niveau d'un doctorat. Cette version sera bientôt disponible pour tous les utilisateurs commerciaux (entreprises et éducation ultérieurement). Les utilisateurs gratuits verront leur utilisation plafonnée et seront redirigés vers un modèle moins puissant lorsqu'ils dépasseront cette limite.

Fonctionnalité GPT-4 GPT-5 (attendu)
Capacité de raisonnement Des lacunes logiques fortes et occasionnelles Raisonnement proche du niveau du doctorat
Multimodalité Texte, images, voix Texte, images, voix, vidéo
Mémoire contextuelle Jusqu'à ~128 000 jetons Jusqu'à environ 1 million de jetons
Autonomie des agents Limité, nécessite des entrées fréquentes Des tâches plus indépendantes et en plusieurs étapes
Options de vitesse Un modèle principal Versions phare, Mini et Nano
Soutien aux médias Pas de support vidéo Compréhension et génération complètes de vidéos

Waouh #3 : Moins d'hallucinations

OpenAI a souligné que GPT-5 passerait moins de temps dans Fantasyland que les versions précédentes. C'est une bonne nouvelle, si tant est que ce soit vrai. Ils ont amélioré les pourcentages, mais n'ont pas montré leur travail. Mon instinct me dit que ce sera une amélioration significative, mais pas encore parfaite.

Waouh #4 : Intégration vocale beaucoup plus forte

Certaines personnes utilisaient la voix pour accéder à ChatGPT dans les versions précédentes. Un effort important a clairement été déployé pour élever la voix au même niveau que la saisie textuelle. Je ne sais pas encore quelle proportion de leur utilisation cela représentera, mais c'est sans aucun doute une excellente option. Mon scepticisme repose en partie sur un optimisme excessif quant à la rapidité avec laquelle Alexa révolutionnerait le commerce pour Amazon. J'imaginais un monde où les gens commanderaient leurs courses dans leur cuisine tout en cuisinant, mais je n'ai pas encore vu cela se produire. La saisie au clavier reste peut-être le mode de saisie préféré de nombreuses personnes.

Wow #5 : Développement de code plus puissant

Ceci entre dans les deux catégories. Ils ont essayé de démontrer la facilité de développement d'applications web avec GPT-5. Un collègue a « développé » une application pour apprendre à sa petite amie à parler français avec sa famille. Ça a plus ou moins fonctionné, mais ça ressemblait à un projet de lycée. Ils affirment que les codeurs préfèrent travailler avec GPT-5, mais n'ont montré ni leur travail ni leurs sources. Ils ont également montré comment GPT-5 pouvait faciliter le débogage. À mettre dans la catégorie « tant mieux si ça arrive ».

Waouh #6 : De grands progrès contre les mauvais acteurs

Premièrement, ne pas nuire. OpenAI semble prendre ses responsabilités envers la société au sérieux. La manière dont GPT-5 réagirait aux recherches problématiques a été discutée. Cela fournira plus de contexte sur les raisons pour lesquelles quelque chose est incorrect, contraire à l'éthique ou dangereux. C'est ce qu'ils appellent la « complétion sécurisée ». Il sera utile de continuer à suivre cette situation au fil du temps.

Hmmm #1 : Cela ressemblait à une présentation en classe et non au lancement d'un produit d'une grande entreprise

Apple et les autres nous ont peut-être gâtés, mais la présentation elle-même était amateur. Ils ont fait monter et descendre des responsables produits nerveux sur scène par segments de trois minutes. Beaucoup de « blagues » semblaient improvisées et maladroites. Je sais que c'est une question de produit, pas de packaging, mais il semble qu'il soit temps pour eux de passer à la vitesse supérieure.

Hmmm #2 : Ils ont besoin d'aide pour traduire leur enthousiasme et leurs pensées en anglais

Un exemple très intéressant a montré comment un parent pouvait aider son lycéen à rédiger un rapport scientifique sur l'effet Bernoulli. Jusque-là, tout va bien. La présentatrice a ensuite demandé : « Ne serait-ce pas formidable d'avoir une animation illustrant cela ? » Oui ! Et si elle avait continué à l'expliquer en termes simples, cela aurait été formidable. Au lieu de cela, elle a proposé de créer un fichier SVG avec Canva et a montré un tas de code Python. Il est encore possible de rendre la puissance de ChatGPT 5.0 plus accessible à l'utilisateur moyen, mais il faut la présenter à ce niveau.

Hmmm #3 : Ils prétendent avoir avancé l'évolution de l'IA de deux ou trois ans

Daniel Kokotajlo est l'un des principaux scientifiques en IA. Il était ingénieur de haut niveau chez OpenAI avant de partir. Il est également l'auteur principal d' AI 2027 , une étude très bien documentée et argumentée sur le développement de l'IA. Selon cet article, il faudra encore deux ou trois ans à l'IA pour réellement accomplir le travail d'un développeur. OpenAI a pratiquement affirmé qu'elle s'y dirigeait avec GPT-5. Je ne suis pas sûr d'y croire. Encore une fois, peut-être dans une certaine direction. Jusqu'au bout ? Pas avant d'en savoir plus.