Les chatbots se rendent à Washington avec ChatGPT Gov

30 janvier 2025 Hibou Gourou

lunettes et chatgpt — Matheus Bertelli / Pexels

Dans un article X lundi commentant le succès soudain de DeepSeek, le PDG d'OpenAI, Sam Altman, a promis de « publier quelques versions » et il semble qu'il l'ait fait. OpenAI a dévoilé mardi son nouveau produit, une « version sur mesure de ChatGPT conçue pour fournir aux agences gouvernementales américaines un moyen supplémentaire d'accéder aux modèles frontières d'OpenAI », selon le message d'annonce . ChatGPT Gov offrirait des mesures de sécurité des données encore plus strictes que ChatGPT Enterprise, mais comment gérera-t-il les hallucinations qui affligent les autres modèles de l'entreprise ?

Selon OpenAI, plus de 90 000 employés des administrations fédérales, étatiques et locales répartis dans 3 500 agences ont interrogé ChatGPT plus de 18 millions de fois depuis début 2024. La nouvelle plateforme permettra aux agences gouvernementales de saisir des « informations non publiques et sensibles » dans ChatGPT pendant qu'il s'exécute dans leurs environnements d'hébergement sécurisés (en particulier, le cloud commercial Microsoft Azure ou le cloud communautaire Azure Government) et dans des cadres de cybersécurité comme IL5 ou CJIS. Cela permet à chaque agence de « gérer ses propres exigences en matière de sécurité, de confidentialité et de conformité », a déclaré Felipe Millon, responsable des ventes gouvernementales chez OpenAI, aux journalistes lors de la conférence de presse mardi.

Le R1 de Deepseek est un modèle impressionnant, en particulier en ce qui concerne ce qu'ils sont capables de fournir pour le prix.
nous allons évidemment livrer des modèles bien meilleurs et c'est aussi légitimement revigorant d'avoir un nouveau concurrent ! nous publierons quelques versions.
— Sam Altman (@sama) 28 janvier 2025

La société a également fourni une démonstration de ce que ChatGPT Gov, qui fonctionne sur le modèle GPT-4o , peut faire lors de l'appel à la presse. Dans la démo, un « employé fédéral » s'est connecté à ChatGPT, a généré un plan de cinq semaines pour ses tâches, puis a analysé une version imprimée du même plan de 5 semaines annotée de notes et d'addenda étiquetés à la main. ChatGPT a ensuite rédigé une note adressée au service juridique et de conformité de l'agence résumant son plan.

"Je sais que le président Trump étudie également la manière dont nous pouvons potentiellement rationaliser cela, car c'est un moyen d'intégrer des outils logiciels plus modernes au gouvernement et d'aider le gouvernement à fonctionner plus efficacement", a déclaré Kevin Weil, directeur général d'OpenAI, à CNBC. "Nous sommes donc très excités à ce sujet."

ChatGPT Gov s'appuie en grande partie sur le cadre ChatGPT Enterprise existant, qui est toujours soumis au programme fédéral de gestion des risques et des autorisations et n'a pas encore été autorisé à gérer des données non publiques. Il n'y a pas encore de calendrier pour l'obtention de cette accréditation, mais l'IA ne sera probablement pas déployée auprès des véritables employés de l'agence avant que cela ne se produise.

Même en mettant l’accent sur la sécurité des données et des opérations, s’appuyer sur l’IA générative pour des tâches aussi vitales et sensibles que le fonctionnement du gouvernement pose des défis uniques et difficiles. Nous avons déjà vu plus d'un avocat se faire prendre à utiliser des chatbots pour « effectuer des recherches », ce qui les a amenés à citer une jurisprudence hallucinée , et la police s'appuyer sur des preuves erronées basées sur l'IA pour arrêter injustement des personnes . Les électeurs californiens ont également récemment rejeté une mesure qui aurait confié à AI la responsabilité de la détermination de la peine sous caution.

De plus, une étude Stanford HAI de 2024 a révélé que les modèles juridiques populaires de Thomas Reuters et de LexisNexis, qui promettent une « recherche juridique sans hallucinations », ont effectivement eu des hallucinations dans leurs réponses, respectivement 34 % et 17 % du temps. Les auteurs de l'étude soulignent qu'il s'agit toujours d'une amélioration significative par rapport aux chatbots à usage général qui hallucinaient les réponses aux questions juridiques entre 58 % et 82 % du temps.

L'annonce d'OpenAI intervient quelques heures seulement après que DeepSeek a révélé V3 , son dernier modèle génératif, qui offre des performances comparables au modèle de raisonnement o1 de pointe d'OpenAI tout en utilisant 20 à 50 fois moins d'énergie, selon la tâche. La startup chinoise a plongé l’industrie américaine de l’IA dans le désarroi avec cette révélation, remettant en question la nécessité de construire continuellement de plus en plus de centres de données et de centrales électriques si un code d’IA plus efficace pouvait accomplir la même chose. Nvidia, le premier fournisseur mondial de GPU, les unités de traitement spécialisées dont les systèmes d'IA ont besoin pour les tâches de formation et d'inférence, a perdu 600 milliards de dollars en capitalisation boursière en réponse aux nouvelles de DeepSeek. Les sociétés d’énergie gazière et nucléaire ont également vu la valeur de leurs actions baisser.