Cette prochaine fonctionnalité d’IA pourrait révolutionner Google Chrome

Le logo Gemini de Google avec l'IA fonctionnant sur un smartphone et un PC.
Google

L'une des dernières tendances dans le domaine de l'IA générative concerne les agents IA, et Google pourrait préparer son propre agent pour devenir une fonctionnalité d'un prochain modèle de langage étendu (LLM) Gemini.

Le développement, appelé Project Jarvis, est un agent d'IA basé sur le navigateur Google Chrome qui sera capable d'exécuter des tâches courantes après avoir reçu une courte requête ou une commande avec plus d'indépendance qu'auparavant. L'inclusion d'agents IA dans la prochaine mise à jour de Chrome pourrait constituer la plus grande refonte depuis le lancement du navigateur en 2008, selon The Information .

Google a déjà démontré comment Gemini peut être un compagnon de shopping ou un planificateur de voyage avec son modèle actuel Gemini 1.5 Pro, qui alimente le chatbot Gemini Advanced. Dans un futur modèle, le projet Jarvis pourra boucler la boucle en s'attaquant à diverses tâches telles que visiter des sites Web, remplir des formulaires et effectuer des paiements pour répondre à la requête donnée par un utilisateur.

Par exemple, un modèle Gemini 1.5 Pro serait capable d'exécuter la requête « planifiez-moi des vacances en décembre avec un budget de 2 000 $ » ; Le projet Jarvis serait probablement en mesure d'exécuter la requête « planifiez-moi des vacances en décembre avec un budget de 2 000 $. Réservez les vols et l'hôtel et envoyez les détails à mon adresse e-mail », a noté Tom's Guide .

Jarvis, ou « Juste un système plutôt très intelligent » est un clin d'œil à l'assistant IA de Tony Stark dans Iron Man . Bien que le nom officiel reste actuellement inconnu, le nom de code convient à mesure que Google ajoute des fonctionnalités à son modèle.

Google a partagé des détails sur les agents IA depuis mai lors de sa conférence des développeurs Google I/O , où il a noté que la technologie aiderait au traitement du contenu vocal et vidéo et permettrait des temps de réponse plus rapides dans les conversations.

Comme indiqué, le projet Jarvis pourrait faire partie des fonctionnalités du prochain LLM de Google, qui, selon les rumeurs, serait Gemini 2.0. L’IA générative pourrait être annoncée début décembre, mais on ne sait pas dans quelle mesure elle sera disponible, note The Information.

Alors que Google se prépare potentiellement à lancer son propre agent IA, de nombreuses autres marques ont déjà présenté leurs propres itérations de fonctions similaires. La marque Anthropic a récemment dévoilé son agent Computer Use, qui permet au Claude LLM de servir de manière indépendante en tant qu'utilisateur de l'appareil pour effectuer des tâches. La fonctionnalité est actuellement en version bêta. De même, Swarm Framework d'OpenAI est un système d'agents qui travaillent ensemble pour accomplir des tâches. L'entreprise a déclaré que cette technologie reste en phase de recherche et d'expérimentation pédagogique.