Le nouvel agent IA de Perplexity peut effectuer des tâches en plusieurs étapes sur votre appareil Android

Perplexity a annoncé jeudi qu'elle commençait à déployer une IA agentique pour les appareils Android, appelée Perplexity Assistant, qui sera capable d'effectuer indépendamment des actions en plusieurs étapes au nom de son utilisateur.

"Nous sommes ravis de lancer l'assistant Perplexity à tous les utilisateurs d'Android", a écrit Aravind Srinivas, PDG de Perplexity, dans un message publié jeudi sur X. "Cela marque la transition pour Perplexity d'un moteur de réponse à un assistant intégré de manière native qui peut appeler d'autres applications et effectuer des tâches de base pour vous."

L'assistant sera disponible via l'application mobile Perplexity et fonctionnera sur le modèle de « moteur de réponse » existant de la plateforme. En tant que tel, Assistant aura accès à Internet. Avec lui, les utilisateurs pourront définir des rappels et des actions futures, un peu comme les nouvelles offres de fonctionnalités Tâches de ChatGPT . Par exemple, l'agent pourra rappeler aux utilisateurs un événement à venir en créant automatiquement une entrée de calendrier à la bonne heure et à la bonne date.

Les utilisateurs peuvent également l'utiliser pour prendre des mesures plus immédiates, comme appeler un covoiturage ou rechercher une chanson, a noté la société. La nouvelle fonctionnalité peut également accéder à la caméra de l'utilisateur afin que vous puissiez, en théorie, lui demander de rechercher des restaurants dans votre voisinage immédiat et lui demander ensuite de faire des réservations pour vous.

Perplexity Assistant est gratuit à utiliser dans le cadre de l'application mobile et sera initialement disponible en 15 langues, dont l'anglais, l'espagnol, le français, l'allemand, le japonais, le coréen et l'hindi. Il reste à voir dans quelle mesure il interagira avec d'autres IA agents sur l'appareil, telles que Gemini ou ChatGPT Tasks .

Les agents sont la nouveauté de l’IA générative. Ces modèles légers sont souvent « distillés » à partir de LLM plus grands comme ChatGPT, Claude ou Gemini, mais sont chargés d'interpréter les données et d'agir de manière autonome plutôt que de générer du contenu. Ces actions peuvent être simples, comme la transcription automatique d'un appel Zoom, ou en plusieurs étapes : pensez à planifier un repas de 8 plats, achetez les ingrédients nécessaires sur Instacart, puis envoyez des invitations par e-mail à vos invités.

Le marché est déjà saturé d’agents d’IA des différentes entreprises leaders. Anthropic a lancé la course aux agents en novembre en lançant son API Computer Use , qui permet à Claude d'émuler les actions de la souris et du clavier humain pour contrôler le système informatique local. Microsoft a annoncé Copilot Actions le même mois et a commencé à déployer les agents auprès des abonnés professionnels et professionnels en janvier. Nvidia a emboîté le pas au CES 2025 en dévoilant sa nouvelle famille de LLM Nemotron , et OpenAI a finalement dévoilé son agent d'IA, Operator, en guise d'« aperçu de recherche » il y a quelques heures à peine .