Le nouveau modèle Claude d’Anthropic offre à la fois des réponses en temps réel et des réponses longuement réfléchies

Les modèles o3 d'OpenAI et R1 de DeepSeek ont de nouveaux concurrents. Anthropic a annoncé lundi la sortie de son nouveau modèle de « raisonnement hybride », Claude 3.7 Sonnet.
Les modèles de raisonnement existants comme o3 , R1 et Gemini 2.0 Flash Thinking de Google sont conçus pour décomposer des problèmes complexes en tâches plus petites, puis déduire et vérifier leurs réponses avant de répondre, un processus qui renvoie des réponses plus précises au prix d'une utilisation de calcul plus élevée et de temps d'inférence plus longs. Claude 3.7 Sonnet, quant à lui, est capable de fournir soit « des réponses quasi instantanées, soit une réflexion étendue, étape par étape, rendue visible à l'utilisateur », selon le message d'annonce de l'entreprise .
La double nature de Claude 3.7 fait partie d'un effort de l'entreprise visant à simplifier l'expérience utilisateur et à éliminer les énormes menus de sélection de modèles que l'on trouve sur d'autres plateformes de chatbot. OpenAI a annoncé un plan similaire avec ses prochains modèles GPT-4.5 et GPT-5 .
"Tout comme les humains utilisent un seul cerveau pour des réponses rapides et une réflexion approfondie, nous pensons que le raisonnement devrait être une capacité intégrée des modèles frontières plutôt qu'un modèle entièrement distinct", a écrit la société. « Cette approche unifiée crée également une expérience plus fluide pour les utilisateurs. »
Claude 3.7 Sonnet est en cours de déploiement auprès de tous les utilisateurs de Claude, cependant, la capacité de réflexion étendue du modèle ne sera accessible qu'avec un abonnement payant. Anthropic s'empresse de souligner que même avec son processus de réflexion standard, Claude 3.7 surpasse le prédécesseur du modèle, Claude 3.5.
Il a été démontré que le processus de réflexion étendu du nouveau Sonnet améliore la qualité de réponse du modèle dans une variété de tâches de mathématiques, de physique, de suivi d'instructions et de codage. "Claude est une fois de plus le meilleur de sa catégorie pour les tâches de codage du monde réel, avec des améliorations significatives dans des domaines allant de la gestion de bases de code complexes à l'utilisation d'outils avancés", se vante la société.
Anthropic a également dévoilé son IA agentique, baptisée Claude Code, dans l'annonce de lundi. "Claude Code est un collaborateur actif qui peut rechercher et lire du code, éditer des fichiers, écrire et exécuter des tests, valider et transmettre du code sur GitHub et utiliser des outils de ligne de commande", a écrit la société.
Anthropic publie Claude Code en tant qu'aperçu de recherche limité et prévoit d'améliorer encore ses performances dans les semaines à venir en fonction des commentaires des développeurs et d'autres premiers utilisateurs. L'IA agentique s'appuie sur le succès du pseudo-agent précédent d'Anthropic, Claude Computer Use , qui permettait à l'IA de manipuler son système informatique local en imitant les mouvements du clavier et de la souris d'un utilisateur humain.