Le modèle avancé « Project Strawberry » d’OpenAI est enfin arrivé
![chatGPT sur un téléphone sur une encyclopédie](https://www.digitaltrends.com/wp-content/uploads/2024/08/pexels-theshantanukr-16474955.jpg?fit=720%2C540&p=1)
Après des mois de spéculation et d'anticipation, OpenAI a publié la version de production de son modèle de raisonnement avancé, Project Strawberry , qui a été renommé « o1 ». Il est rejoint par une version « mini » (tout comme l'était GPT-4o) qui offrira des interactions plus rapides et plus réactives au détriment de l'exploitation d'une base de connaissances plus large.
Il semble que o1 offre un mélange d’avancées techniques. Il s'agit du premier modèle de raisonnement d'OpenAI conçu pour utiliser la déduction humaine pour répondre à des questions complexes sur des sujets, notamment les sciences, le codage et les mathématiques, plus rapidement que les humains.
Par exemple, lors des tests, o1 a subi un examen de qualification pour l'Olympiade internationale de mathématiques. Alors que son prédécesseur, GPT-4o , n'a réussi à résoudre correctement que 13 % des problèmes présentés, o1 en a résolu 83 %. Dans une compétition Codeforces en ligne, o1 a obtenu un score dans le 89e centile. De plus, o1 peut répondre aux requêtes qui ont déconcerté les modèles précédents (comme « lequel est le plus grand, 9.11 ou 9.9 ? »). Cependant, la société précise que cette version n'est qu'un aperçu de toutes les capacités du modèle néophyte.
Le nouveau o1 "a été entraîné à l'aide d'un tout nouvel algorithme d'optimisation et d'un nouvel ensemble de données d'entraînement spécialement adapté à cet effet", a déclaré Jerry Tworek, responsable de la recherche chez OpenAI, à The Verge . En utilisant une combinaison d’apprentissage par renforcement et de raisonnement en « chaîne de pensée », o1 renvoie des inférences plus précises que son prédécesseur. "Nous avons remarqué que ce modèle hallucine moins", a déclaré Tworek, mais "nous ne pouvons pas dire que nous avons résolu les hallucinations".
Les abonnés ChatGPT-Plus et Teams pourront tester o1 et o1-mini à partir d’aujourd’hui. Les abonnés Enterprise et Edu devraient y avoir accès d’ici la semaine prochaine.
La société affirme que o1-mini sera éventuellement disponible pour les utilisateurs du niveau gratuit, sans toutefois préciser de calendrier. Les développeurs remarqueront une forte augmentation du prix de l'API pour o1, par rapport à GPT-4o. L'accès à o1 coûtera 15 $ par million de jetons d'entrée (contre 5 $ par million pour GPT-4o) et 60 $ par million de jetons de sortie, soit quatre fois plus que les frais de 5 $ par million de 4o. La vraie question est de savoir si le nouveau modèle pense que le mot « fraise » contient deux R ou trois .