Les navigateurs Web entrent dans une nouvelle ère où les compétences de l’IA prennent le relais des extensions
« Le navigateur est plus important que le chat. C'est un produit plus accrocheur, et c'est le seul moyen de créer des agents. C'est le seul moyen de créer des workflows de bout en bout », a déclaré Aravind Srinivas, PDG de Perplexity, lors d'une récente interview. Le cofondateur de Perplexity évoquait l'avenir des navigateurs web, des agents IA et des automatisations dans les navigateurs web.
Srinivas était optimiste quant aux perspectives, notamment parce que son entreprise teste déjà un nouveau navigateur très en vogue appelé Comet. Actuellement en phase bêta sur invitation uniquement, ce navigateur est doté d'un agent capable de gérer des tâches complexes et chronophages à votre place.
Imaginez un outil d'IA comme ChatGPT ou Gemini, mais hébergé exclusivement dans votre navigateur. L'approche « agent dans le navigateur », comme l'explique Srinivas, est plus familière et plus flexible. Vous n'avez pas à gérer les habituelles restrictions d'autorisation locale et de flux de travail inter-applications. De plus, les navigateurs fonctionneront comme nous en avons l'habitude, avec des produits comme Chrome ou Safari.
Mais les tendances sous-jacentes sont radicalement différentes, et le changement le plus important pourrait être la disparition des extensions de navigateur au profit des compétences d'IA et des agents générés par les utilisateurs. Il est intéressant de noter que les outils fondateurs ont été posés il y a plus d'un an, mais nous n'en entendons parler qu'avec l'arrivée de navigateurs privilégiant l'IA comme Dia et Comet.
Les compétences en IA sont les nouveaux champions du travail
Tout ce discours sur les agents et les compétences d'IA ressemble à du jargon technique, alors laissez-moi vous l'expliquer. Dans le navigateur Dia , j'ai récemment créé une compétence appelée « expand ». Comment ai-je fait, même si je n'ai pas écrit une seule ligne de code ? Je l'ai simplement décrite ainsi :
« Lorsque j'utilise cette compétence, je colle un extrait, je fais une recherche approfondie sur le Web et je récupère l'historique complet sous forme d'article, dans un ordre précis. Je ne tire les informations que de sources d'information fiables. »
Je lis et j'écris des articles pour gagner ma vie, et je tombe souvent sur des extraits et des événements d'articles que je ne connais pas. Dans ce cas, il me suffit de sélectionner le texte concerné (ou de le copier-coller dans la barre latérale de discussion) et d'utiliser la commande « / » pour activer la compétence « développer ».
Comme décrit ci-dessus, l'agent IA du navigateur Dia recherche les mentions de ma cible dans les principaux médias et crée un bref rapport chronologique. Cela me fait gagner un temps précieux, autrement consacré à des recherches Google incessantes.
Mais surtout, je n'ai même pas besoin d'ouvrir un autre onglet et je peux poser des questions complémentaires dans la même boîte de discussion, dans l'onglet de lecture actif. C'est rapide et pratique. Je ne connais pas d'extension capable de faire exactement ce que cette compétence « développer » me permet.
Ce n'est pas possible non plus. Je l'ai créé avec un objectif précis. Et je peux en créer autant que je veux, ou l'affiner pour l'adapter à mon flux de travail. J'en ai créé un autre, appelé « recherche », qui fait référence à un ouvrage (ou à une expression) et effectue des recherches sur le web en consultant exclusivement des articles scientifiques évalués par des pairs.
La communauté d'utilisateurs Dia réalise même des économies en créant des compétences qui recherchent les codes promo disponibles sur les produits juste avant le paiement. Pour mes achats sur Amazon, j'ai créé une fonctionnalité qui combine les avis, les notes et les caractéristiques des produits sur différents onglets Amazon, crée un tableau comparatif et m'aide à faire le meilleur choix. Tout cela se fait en tapant un seul mot !
Un autre vérifie rapidement les erreurs grammaticales et la clarté du guide de style dans mes e-mails. Il y en a un qui crée un matériel de lecture sous forme de quiz pour les enfants que j'enseigne dans une institution à but non lucratif proche, à partir du matériel pédagogique que j'ai préparé.
Les élèves apprécient le ton ludique et amusant des questions à choix multiples qui testent leurs connaissances en actualité. Dia propose même une galerie officielle où découvrir les compétences créées par ses utilisateurs, ainsi qu'un tableau de bord web participatif où vous trouverez encore plus d'informations.
Mais voici la principale raison pour laquelle je pense que les compétences en navigation sont plus importantes que les extensions. N'importe qui peut en créer en décrivant simplement ce qu'il souhaite. Pour les extensions, il faut des connaissances en codage et des compétences de base sur le fonctionnement du web et de son architecture de navigation.
La sécurité est une autre raison pour laquelle je privilégierais les compétences des navigateurs aux extensions. De nombreux utilisateurs malintentionnés ont utilisé des extensions de navigateur comme armes pour propager des logiciels malveillants. L'utilisateur moyen est incapable d'analyser ou de comprendre le fonctionnement interne d'une extension, et ne réalise l'absurdité qu'une fois le mal fait.
La situation des compétences d'IA dans les navigateurs est on ne peut plus transparente. Le fonctionnement précis d'une compétence est décrit en détail, en langage naturel et sans aucune réserve. Il suffit de la lire attentivement ou de la copier-coller pour créer la vôtre en y apportant des modifications. Cette approche est flexible, beaucoup plus sûre et donne toute latitude aux utilisateurs.
Les agents de navigateur sont là pour rester
Ensuite, nous avons les agents de navigation. Opera en a déjà implémenté un et propose une version plus avancée appelée Operator . Vous pouvez également utiliser des outils comme ChatGPT Agent et le navigateur Comet de Perplexity . Imaginez-le comme Siri, mais pour la navigation web.
Les agents sont plus adaptés aux tâches complexes et chronophages. Ils sont plus efficaces lorsqu'ils ont accès aux services que vous consultez quotidiennement, comme votre messagerie et votre calendrier. Par exemple, voici ce que j'ai fait hier soir dans le navigateur Comet de Perplexity :
Consultez ma boîte mail et tenez-moi au courant de toutes les demandes d'entretien avec un scientifique ou un dirigeant d'entreprise que j'ai l'intention de traiter. Privilégiez les conversations où j'ai évoqué la possibilité d'entretiens virtuels plutôt qu'une rencontre en personne.
Sans ouvrir un autre onglet, l'assistant intégré a parcouru ma boîte de réception Gmail, recherché les e-mails pertinents, puis m'a fourni la liste de ces interactions dans une vue bien formatée. Pour plus de commodité, il a même inclus des liens Gmail accessibles en un clic, me permettant d'ouvrir directement la chaîne d'e-mails sans avoir à la consulter manuellement.
C'est très utile pour bien d'autres choses. Par exemple, lors d'une AMA sur Twitter, j'ai simplement demandé au système de sélectionner les réponses de l'intervenant et de les lister sous forme de puces. Cela m'a évité de nombreux allers-retours pour ouvrir et fermer des chaînes de conversation.
Pour planifier un voyage, faire du shopping ou même visionner des vidéos, l'assistant du navigateur Comet fonctionne parfaitement. Le seul bémol, c'est que si vous en avez besoin pour des tâches plus personnelles, vous devrez autoriser l'accès aux connecteurs. Par exemple, pour gérer Gmail, Agenda et Drive, vous devrez autoriser l'accès.
Je l'ai également fait pour mon compte WhatsApp, et cela a très bien fonctionné dans le navigateur Comet. Ce n'est pas toujours facile pour tout le monde, et la prudence est de mise. Pour ce type de scénario, Google et OpenAI proposent des fonctionnalités d'agent similaires pour Gemini et ChatGPT, respectivement.
Il n'y a pas de retour en arrière
Tout comme vous créez des compétences dans Dia en saisissant ou en racontant vos besoins, Gemini et ChatGPT vous permettent également de créer des agents personnalisés pour des tâches spécifiques. Google les appelle « Gems », tandis qu'OpenAI les appelle « GPT ». Et oui, vous pouvez les partager comme des compétences. Leur utilisation est gratuite, mais pour les créer, vous aurez besoin d'un abonnement de 20 $ par mois.
J'ai créé de nombreux Gems et GPT personnalisés pour accélérer mes tâches quotidiennes. Pour mes publications personnelles sur les réseaux sociaux, j'ai créé un Gem qui décompose mes articles en petits morceaux, qui sont ensuite publiés sous forme de chaîne sur X. De même, j'ai créé des agents personnalisés pour gérer mes e-mails.
L'un des Gems me demande simplement de saisir « oui » ou « non », et il rédigera une réponse polie en fonction du contexte de l'e-mail. Grâce aux connecteurs, vous pouvez les lier à autant de services que vous le souhaitez.
L'avantage de ces joyaux est qu'ils peuvent être utilisés sans effort sur un navigateur de bureau et des applications mobiles. Les extensions nécessitent l'utilisation d'un navigateur de bureau. Certains navigateurs mobiles prennent en charge les extensions, mais elles sont rares.
De plus, ils n'offrent pas la même flexibilité et la même tranquillité d'esprit que les compétences de navigateur personnalisées ou les agents créés par les utilisateurs. ChatGPT Agent et Project Mariner de Google constituent une nouvelle génération d'assistants IA, conçus sur mesure pour les tâches web, à l'instar de l'assistant intégré au navigateur Comet de Perplexity.
Contrairement aux extensions, elles peuvent gérer des workflows en plusieurs étapes et vous pouvez prendre le relais à tout moment. De plus, vous pouvez modifier le fonctionnement interne de l'automatisation de votre navigation web et adapter les compétences de l'IA à vos besoins, ce qui est impossible avec les extensions.
Bien sûr, ils ne sont pas parfaits. En même temps, on peut les prendre en charge et compléter les tâches qui leur sont confiées, car aucun agent d'IA n'est infaillible, surtout à une époque où les modèles de raisonnement sont encore loin d'être parfaits », admet le PDG de Perplexity.
Mais le changement est évident. Les extensions de navigateur ne disparaîtront pas du jour au lendemain, mais les agents de navigation et les compétences d'IA créés par les utilisateurs prendront le dessus. Ce n'est qu'une question de temps avant que les barrières (lire : les frais d'abonnement) ne tombent !
