OpenAI vient de supprimer les chaînes de la version gratuite de ChatGPT

OpenAI a annoncé la sortie de son nouveau modèle génératif de la taille d'une collation, baptisé GPT-4o mini, qui est à la fois moins gourmand en ressources et moins cher à exploiter que son modèle standard GPT-4o , permettant aux développeurs d'intégrer la technologie d'IA dans une gamme beaucoup plus large de des produits.

Il s'agit d'une mise à niveau importante pour les développeurs et les applications, mais elle étend également les capacités et réduit les limitations de la version gratuite de ChatGPT . GPT-4o mini est désormais disponible pour les utilisateurs des niveaux Free, Plus et Team via le Web et l'application ChatGPT pour les utilisateurs et les développeurs à partir d'aujourd'hui, tandis que les abonnés ChatGPT Enterprise y auront accès la semaine prochaine. Le GPT-4o mini remplacera le petit modèle existant de la société, le GPT-3.5 Turbo, pour les utilisateurs finaux à partir d'aujourd'hui.

L'ancien modèle est toujours disponible pour les développeurs via l'API s'ils ne souhaitent pas encore passer à 4o mini. La société annonce qu’elle retirera éventuellement l’ancien modèle, mais n’a pas encore fixé de date.

GPT-4o est disponible pour les comptes ChatGPT gratuits depuis mai, mais la demande est limitée. Selon la page FAQ mise à jour , GPT-4o proprement dit a toujours ces limitations en place, mais vous serez désormais rétrogradé vers GPT-4o mini plutôt que GPT-3.5 lorsque vous atteindrez votre limite. En théorie, c'est une grande victoire pour ceux qui ne sont pas passés à ChatGPT Plus .

Selon les données d' Analyse artificielle , le dernier modèle d'IA d'OpenAI a obtenu un score de 82 % sur le test de raisonnement MMLU, battant Gemini 1.5 Flash de 3 % et Claude 3 Haiku de 7 %. Pour référence, le benchmark MMLU le plus élevé à ce jour a été établi par Gemini Ultra, l'IA haut de gamme de Google, avec un score de 90 % .

De plus, OpenAI affirme que le GPT-4o mini est 60 % moins cher à exploiter que le GPT-3.5 Turbo. Les développeurs paieront 15 cents par million de jetons d'entrée et 60 cents par million de jetons de sortie. OpenAI affirme que le GPT-4o mini est « le petit modèle le plus performant et le plus rentable disponible aujourd'hui », selon CNBC .

D’où viennent ces économies ? Eh bien, toutes les tâches qui peuvent être améliorées par l'IA n'ont pas besoin de tout le poids et des capacités d'un modèle grandeur nature comme GPT , Claude ou Gemini . Comme pour écraser des mouches avec un marteau, utiliser un LLM de taille standard pour des tâches simples mais à volume élevé est excessif et gaspille à la fois de l'argent et des ressources de calcul – c'est là que les petits LLM tels que Gemini 1.5 Flash de Google, Llama 3 8b de Meta ou Claude 3 d'Anthropic. Les haïkus entrent en jeu. Ils sont capables d'effectuer ces tâches simples et répétitives plus rapidement et de manière plus rentable que les itérations plus importantes.

Selon OpenAI, GPT-4o mini aura la même taille de fenêtre contextuelle, 128 000 jetons (environ l'équivalent d'un livre de contenu), que la version complète avec le même seuil de connaissances, en octobre 2023, bien que la société n'ait pas précisé. la taille exacte du nouveau modèle. L'API du modèle n'offre actuellement que des fonctionnalités de texte et de vision, mais la vidéo et l'audio arriveront également à l'avenir.

L'annonce intervient quelques semaines seulement après qu'OpenAI ait fourni une mise à jour tant attendue de son mode vocal avancé et attendu dans le cadre de GPT-4o. La mise à jour de la société indiquait qu'une version alpha plus petite devait encore arriver fin juillet, avec un déploiement plus large prévu pour cet automne.