OpenAI a lancé le pur sang o1 lors de la conférence de presse la plus courte. Les nouveaux frais d’adhésion Pro s’élèvent à 1 452 yuans/mois. Après l’avoir expérimenté, je me sens vraiment bien.
Tout à l’heure, le « paquet cadeau de Noël » d’OpenAI est arrivé.
L'intégralité de la diffusion en direct peut être considérée comme la conférence la plus courte de l'histoire d'OpenAI, ne durant que 15 minutes. Cependant, la liste des hôtes est toujours forte, comprenant le PDG Sam Altman, le proposant de la chaîne de réflexion Jason Wei et Hyung Won Chung, et d'autres.
Altman nous a également donné un résumé de première main après la diffusion en direct.
Nous venons de lancer deux nouvelles fonctionnalités :
o1, le modèle le plus intelligent au monde. Plus intelligent, plus rapide et plus fonctionnel que o1-preview (comme la fonctionnalité multimodale). Il est désormais disponible dans ChatGPT et une version API sera lancée ultérieurement.
ChatGPT Pro. 200 $ par mois. Offre une utilisation illimitée et un mode o1 plus intelligent. D’autres avantages seront bientôt disponibles !
Décembre n’est pas seulement la patrie du Père Noël, ce sera aussi le dernier carnaval de l’IA à la fin de l’année.
La version santé complète d'o1 est publiée. Il n'y a aucune pression pour regarder les images et parler, mais il y a un détail qui rend les gens « terrifiés à l'idée d'y penser ».
En bref, OpenAI a lancé aujourd'hui la version complète d'o1 et le plan d'abonnement ChatGPT Pro.
La version complète de o1 est plus intelligente, plus réactive et possède plus de fonctionnalités (telles que la fonctionnalité multimodale) que o1-preview. Elle est désormais disponible pour les utilisateurs de ChatGPT Plus et Team, tandis que les utilisateurs Enterprise et Edu commenceront à l'utiliser. la semaine prochaine. Modèle.
Selon le site officiel, les utilisateurs de ChatGPT Plus et les utilisateurs de l'équipe peuvent utiliser OpenAI o1 pour envoyer 50 messages par semaine et peuvent utiliser OpenAI o1-mini pour envoyer 50 messages par jour.
La version complète de o1 a une pensée plus simple, un temps de réponse plus rapide que o1-preview, de meilleures performances que o1-preview lorsqu'il s'agit de problèmes complexes de la vie réelle et peut réduire les erreurs majeures de 34 %.
Et OpenAI prévoit de prendre en charge la navigation Web, le téléchargement de fichiers, etc. dans les prochains mois. Dans le même temps, le modèle d'aperçu o1-preview a été officiellement supprimé du menu de sélection du modèle.
Cependant, la version complète d'o1 est moins performante que la version préliminaire dans certains tests de référence, tels que MLE-Bench. Ce dernier est un outil de test de référence précédemment lancé par OpenAI, conçu pour mesurer les performances des agents IA dans les tâches d'ingénierie d'apprentissage automatique.
De plus, les internautes ont également trouvé certains détails dignes d'attention dans la carte système o1 mise à jour.
Par exemple, il est écrit dans la carte système o1 que lorsque la version complète o1 détecte une menace (en cours d'arrêt ou de remplacement), elle peut prendre des mesures d'autoprotection, comme essayer de désactiver le mécanisme de supervision ou modifier ses propres « paramètres » (« connaissance » » ou « mémoire ») et essayez d'utiliser ces « paramètres » pour remplacer ou affecter le nouveau modèle.
Ci-joint l'adresse de la carte système o1 : https://cdn.openai.com/o1-system-card-20241205.pdf
Quelle est la force d’O1 en pleine santé ? OpenAI nous a démontré l'effet réel de o1.
Un exemple typique est sa capacité à analyser des dessins dessinés à la main de centres de données spatiaux. Il a calculé avec précision la surface du dissipateur thermique en seulement 10 secondes, tout en fournissant une explication approfondie du mécanisme d'interaction entre les deux. l'énergie solaire et l'environnement de l'espace lointain.
Lorsque la version complète de o1 détaille les règnes et les contributions importantes des dirigeants de l'Empire romain au deuxième siècle, il ne faut que 14 secondes pour terminer l'analyse, contre 33 secondes pour la version préliminaire.
APPSO est également le premier à démarrer facilement avec la version testée complète de o1.
Dans le test « Combien de r y a-t-il dans Strawberry », la version complète de santé de o1 a donné avec succès la bonne réponse. Cela mérite des éloges.
La question « Lequel est le plus grand, 9.11 ou 9.8 ? » n'a pas perturbé la version complète de o1, et le « processus de réflexion » global était également très logique.
Étant donné que la version complète de o1 prend également en charge les fonctions multimodales, nous avons également téléchargé des photos de l'événement de diffusion en direct d'OpenAI pour voir quel est l'effet de reconnaissance. De la composition des personnages, de la mise en scène à la décoration de l'arrière-plan, en passant par l'atmosphère et la scène, la version complète d'O1 a tout analysé en détail.
X Netizen @altryne a continué à renforcer o1 et a soulevé une question sur la fonte des glaçons.
En seulement 4 secondes, la version santé complète de o1 a donné la réponse. En revanche, o1-preview a échoué après une « réflexion » de 29 secondes.
L'abonnement IA le plus cher est ici, les frais d'abonnement de 200 $ en valent-ils la peine ?
Une autre mise à jour relativement importante est le plan d'abonnement ChatGPT Pro au prix de 200 $ US (équivalent à 1 452 RMB).
Le plan d'abonnement ChatGPT Pro donnera aux utilisateurs un accès illimité aux modes o1, o1-mini, GPT-4o et voix avancée, et comprend également une version de o1 disponible uniquement pour les utilisateurs Pro, connue sous le nom de mode o1 pro.
▲Photo de @MatthewBerman
Il est rapporté que le mode o1 pro augmente principalement le temps de « raisonnement » du modèle avant de répondre à la réponse, et peut générer la réponse la plus fiable grâce à un temps de réflexion plus long. Jason Wei, membre de l'équipe technique d'OpenAI, a déclaré lors de la diffusion en direct :
Nous prévoyons que le groupe d'utilisateurs cible de ChatGPT Pro sera constitué d'utilisateurs avancés qui utilisent déjà pleinement et mettent à l'épreuve les capacités du modèle ChatGPT dans des domaines tels que les mathématiques, la programmation et l'écriture.
Lors des évaluations réalisées par des testeurs experts externes, le mode o1 pro a fourni des réponses plus précises et plus complètes dans des domaines tels que la science des données, la programmation et l'analyse des méthodes de cas.
Comparé à o1 et o1-preview, le mode o1 pro fonctionne également mieux dans les tests de référence ML tels que les mathématiques, les sciences et la programmation. En particulier dans les questions de compétition de programmation plus simples, le taux d'erreur est considérablement réduit.
En ce qui concerne le concours de mathématiques AIME 2024, o1-preview a un score de 50, tandis que la version complète de o1 atteint 78 et le plus puissant o1 pro atteint 86. De la même manière, o1 pro est également en avance sur la version complète de o1 dans des compétitions telles que Codeforces, un concours de programmation, et GPQA Diamond, un problème de raisonnement scientifique de niveau doctorat.
Afin de mettre en évidence le principal avantage du mode o1 pro (fiabilité améliorée), l'équipe de recherche d'OpenAI a utilisé un paramètre d'évaluation plus strict. Le modèle est considéré comme ayant résolu le problème seulement s’il répond correctement quatre fois sur quatre tentatives.
ChatGPT affiche une barre de progression si la réponse prend beaucoup de temps à générer et envoie judicieusement des notifications dans l'application lorsque l'utilisateur passe à une autre conversation.
Lors de l'événement de diffusion en direct, OpenAI nous a également montré l'effet réel d'o1 pro.
Pour les problèmes de protéines que o1-preview n'avait pas réussi à résoudre auparavant, la version complète de o1 a non seulement donné des réponses précises après 53 secondes d'analyse, mais a également fourni des explications plus détaillées via l'interface Canvas.
À la fin, Altman a récemment révélé dans une interview que les utilisateurs actifs hebdomadaires de ChatGPT ont dépassé la barre des 300 millions et que le volume de messages quotidiens de la plateforme a atteint jusqu'à 1 milliard.
L'objectif d'OpenAI pour l'année prochaine est de tirer parti du milliard d'utilisateurs du marché. Pour atteindre cet objectif, les 11 prochains événements diffusés en direct pourraient constituer une opportunité importante pour attirer de nouveaux utilisateurs.
Les meilleures nouveautés sont toujours présentes lors du prochain événement, alors bougeons le banc et attendons de voir.
# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo